داده کاوی بزرگ مقرون به صرفه در زمینه ابر : یک مطالعه موردی با K-means

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 188

This Paper With 16 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CECCONF16_031

تاریخ نمایه سازی: 19 شهریور 1401

Abstract:

کاوش داده ی بزرگ , اغلب نیازمند منابع محاسباتی فوق العاده می باشد. این امر به یک مانع عمده در رابطه با استفاده ی وسیع از تجزیه و تحلیل داده های بزرگ تبدیل شده است. محاسبات ابری به محققانی که در زمینه ی داده فعالیت می کنند , اجازه ی دسترسی به منابع محاسباتی , بر اساس تقاضای ساخت راه حل های تحلیلی داده ای بزرگ در ابر را می دهد. هر چند , هزینه ی پولی کاوش داده ی بزرگ در ابر , هنوز هم می تواند بر خلاف انتظار مان , بالا باشد.برای مثال , اجرای مثال های ۱۰۰ m۴- xlarge Amazon EC۲ به مدت یک ماه هزینه ای در حدود $۱۷,۴۹۵,۰۰ را به دنبال دارد. در این زمینه , مسئله ی حیاتی به منظور تجزیه و تحلیل هزینه ی بهره وری (هزینه ی مقرون به صرفه ) داده کاوی بزرگ در ابر , چگونگی دستیابی به یک نتیجه ی رضایت بخش کافی با حداقل هزینه ی محاسباتی ممکن است. در سناریو های داده کاوی بزرگ حقیقی , دقت ۱۰۰% غیر ضروری است. در عوض , اغلب , دستیابی به یک دقت کافی , برای مثال , ۹۹% یا هزینه ی کمتر مانند , ۱۰% نسبت به هزینه ی دستیابی با دقت , ۱۰۰% ترجیح داده می شود.در این مقاله , ما به کشف و نمایش داده کاوی بزرگ مقرون به صرفه به همراه یک مطالعه ی موردی و با استفاده از K-means اقدام می کنیم. با استفاده از مطالعه ی موردی , در می یابیم که دست یابی به دقت ۹۹% تنها نیاز به هزینه ی محاسبتی ۰.۳۲%-۴۶.۱۷% مربوط به دقت ۱۰۰% دارد. این یافته , سنگ بنای لازم را برای داده کاوی مقرون به صرفه در انواع دامنه ها قرار می دهد.

Authors

اسماعیل جهانگشته

استاد دانشگاه آزاد واحد ایرانشهر

پرویز گزمه

استاد دانشگاه آزاد واحد ایرانشهر

حسینعلی رفیعی

دانشجوی مهندسی نرم افزار کامپیوتر، دانشگاه آزاد واحد ایرانشهر