الگوریتم K-means++ پیشنهادی با روش نگاشت - کاهش تکراری نموی جهت بهبود مقیاس پذیری و افزایش کارایی داده کاوی داده های بزرگ

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,440

This Paper With 18 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCT08_042

تاریخ نمایه سازی: 3 اردیبهشت 1399

Abstract:

با توسعه ی سریع شبکه ها، رسانه های ذخیره سازی و افزایش گنجایش مجموعه های دادهای، داده های بزرگ در تمام حوزه های علم و فناوری از جمله علوم فیزیکی، زیستی و پزشکی به سرعت در حال رشد وگسترش است . برای پشتیبانی از داده کاوی داده های بزرگ به سکوهای پردازشی با عملکرد بالا موردنیاز است تا بتواند قدرت داده های بزرگ را رها سازد. یک سیستم باید به دقت طراحی شود تا بتوان داده های بدون ساخت یافته با روابط پیچیده شان را به الگوهای مفیدی تبدیل کرد. به کارگیری یک زیرساخت موازی، پشتیبانی از زبان برنامه نویسی موازی، مدلهای نرم افزاری برای تجزیه و تحلیل داده کاوی توزیع شده از اهداف بسیار مهم برای پردازش داده های بزرگ است. در حال حاضر، پردازش داده های بزرگ وابسته به مدلهای برنامه نویسی موازی همچون نگاشت کاهش است. زمانی که نگاشت کاهش با داده های بزرگ سروکار دارد، با موانع و چالش هایی مواجه است. نگاشت کاهش برای الگوریتم های تکرارشونده ی داده کاوی همچون الگوریتم خوشه بندی K-means ، مناسب نیست. هدف پژوهشی پایان نامه، بهبود مقیاس پذیری و کارایی الگوریتم ++ K-means برای کاوش داده های بزرگ است. ++ K-means مراکز را به ترتیب انتخاب میکند تا به یک راه حل بهینه ی قابل اثباتی برسد اما به علت مقیاس پذیری ضعیفی که دارد با افزایش داده ها، بازده اش کم میشود. در الگوریتم ++ K-means تمام رکوردهای ساختار به تمام رکوردهای وضعیت وابسته اند. نگاشت کاهش تکراری نموی از روابط بین وضعیت و ساختار پشتیبانی میکند. در حقیقت، با به کارگیری نگاشت کاهش تکراری نموی، هزینه های شروع کار و به دنبال آن تعدادی از کارهای نگاشت کاهش به شدت کاهش مییابد. الگوریتم ++ K-means پیشنهادی با روش نگاشت کاهش تکراری نموی مقیاس پذیری و کارایی بالایی دارد و از این پس میتوانیم به راحتی نتایج داده کاوی را همواره به روز نگه داریم.

Keywords:

Authors

مراد درخشان

استادیار ،گروه مهندسی کامپیوتر وفناوری اطلاعات، - دانشگاه پیام نور، تهران ، ایران

جاسم قاسمی نژاد

دانشجوی کارشناسی ارشد رشته نرم افزار ،گروه مهندسی کامپیوتروفناوری اطلاعات، دانشگاه پیام نور، تهران، ایران