داده کاوی بزرگ مقرون به صرفه در زمینه ابر : یک مطالعه موردی با K-means
Publish place: 16th National Conference on Computer Science and Engineering and Information Technology
Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 188
This Paper With 16 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CECCONF16_031
تاریخ نمایه سازی: 19 شهریور 1401
Abstract:
کاوش داده ی بزرگ , اغلب نیازمند منابع محاسباتی فوق العاده می باشد. این امر به یک مانع عمده در رابطه با استفاده ی وسیع از تجزیه و تحلیل داده های بزرگ تبدیل شده است. محاسبات ابری به محققانی که در زمینه ی داده فعالیت می کنند , اجازه ی دسترسی به منابع محاسباتی , بر اساس تقاضای ساخت راه حل های تحلیلی داده ای بزرگ در ابر را می دهد. هر چند , هزینه ی پولی کاوش داده ی بزرگ در ابر , هنوز هم می تواند بر خلاف انتظار مان , بالا باشد.برای مثال , اجرای مثال های ۱۰۰ m۴- xlarge Amazon EC۲ به مدت یک ماه هزینه ای در حدود $۱۷,۴۹۵,۰۰ را به دنبال دارد. در این زمینه , مسئله ی حیاتی به منظور تجزیه و تحلیل هزینه ی بهره وری (هزینه ی مقرون به صرفه ) داده کاوی بزرگ در ابر , چگونگی دستیابی به یک نتیجه ی رضایت بخش کافی با حداقل هزینه ی محاسباتی ممکن است. در سناریو های داده کاوی بزرگ حقیقی , دقت ۱۰۰% غیر ضروری است. در عوض , اغلب , دستیابی به یک دقت کافی , برای مثال , ۹۹% یا هزینه ی کمتر مانند , ۱۰% نسبت به هزینه ی دستیابی با دقت , ۱۰۰% ترجیح داده می شود.در این مقاله , ما به کشف و نمایش داده کاوی بزرگ مقرون به صرفه به همراه یک مطالعه ی موردی و با استفاده از K-means اقدام می کنیم. با استفاده از مطالعه ی موردی , در می یابیم که دست یابی به دقت ۹۹% تنها نیاز به هزینه ی محاسبتی ۰.۳۲%-۴۶.۱۷% مربوط به دقت ۱۰۰% دارد. این یافته , سنگ بنای لازم را برای داده کاوی مقرون به صرفه در انواع دامنه ها قرار می دهد.
Keywords:
Authors
اسماعیل جهانگشته
استاد دانشگاه آزاد واحد ایرانشهر
پرویز گزمه
استاد دانشگاه آزاد واحد ایرانشهر
حسینعلی رفیعی
دانشجوی مهندسی نرم افزار کامپیوتر، دانشگاه آزاد واحد ایرانشهر