تحلیل تکنیک های خوشه بندی موازی در کلان داده ها

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 202

This Paper With 15 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

STCONF05_095

تاریخ نمایه سازی: 24 مهر 1401

Abstract:

یک روش محبوب یادگیری بدون نظارت، معروف به خوشه بندی، به طور گسترده در داده کاوی، یادگیریماشین و تشخیص الگو استفاده می شود. این روش شامل گروه بندی نقاط منفرد و متمایز در یک گروه استبه گونه ای که یا مشابه یکدیگر باشند یا با نقاط دیگر خوشه ها بی شباهت باشند. روش های خوشه بندی سنتی بهدلیل رشد عظیم اخیر داده ها به شدت به چالش کشیده شده اند. بنابراین، چندین کار تحقیقاتی طرح های جدیدی را برای روش های خوشه بندی پیشنهاد کردند که از مزایای پلتفرم های Big Data استفاده می کنند خوشه بندی داده یکی از مهم ترین کارهای داده کاوی است. هدف آن از طریق روش های مختلف، کشفگروه های ناشناخته قبلی در مجموعه داده ها است. در سال های گذشته، پیشرفت های قابل توجهی در این زمینهصورت گرفته است که منجر به توسعه الگوریتم های خوشه بندی نوآورانه و امیدوارکننده شده است.خوشه بندی سنتی مسائل جدی را در ارتباط با افزایش سرعت، توان عملیاتی و مقیاس پذیری ارائه می کنند.بنابراین، آنها دیگر نمی توانند مستقیما درزمینه داده های بزرگ استفاده شوند، جایی که داده ها عمدتا باحجم، سرعت و تنوع مشخص می شوند. برای غلبه بر محدودیت های آنها، پژوهش امروز با ایجادالگوریتم های خوشه بندی موازی به سمت مفهوم محاسبات موازی می رود. این مقاله مروری بر آخرینالگوریتم های دسته بندی موازی ارائه می کند که بر اساس پلتفرم های محاسباتی مورداستفاده برای مدیریت داده های بزرگ، برنامه ریزی شده اند. که شامل شبکه های همتا به همتا، پلتفرم MapReduce و Spark است، و پردازنده های چندهسته ای، واحد پردازش گرافیکی و پلتفرم های آرایه های دروازه قابل برنامه ریزیمیدانی است. علاوه بر این، شامل مقایسه عملکرد الگوریتم های بررسی شده بر اساس برخی معیارهای رایجاعتبارسنجی خوشه بندی درزمینه داده های بزرگ است. بنابراین، دید کلی از تکنیک های خوشه بندی موازیفعلی را در اختیار خواننده قرار می دهد.

Keywords:

Big Data · Clustering · Data mining · DBSCAN · FPGA

Authors

رضا قائمی

استادیار گروه مهندسی کامپیوتر، واحد قوچان، دانشگاه آزاد اسلامی، قوچان، ایران...

رسول قدمگاهی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر،واحد نیشابور، موسسه آموزش عالی سبحان،نیشابور،...