خوشه بندی داده ها، مروری بر روش های موجود و مقایسه عملکرد آن ها

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 4,949

This Paper With 25 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCC01_012

تاریخ نمایه سازی: 9 فروردین 1395

Abstract:

یکی از مهمترین اعمال در داده کاوی خوشه بندی داده های موجود در یک دیتاست می باشد. این تکنیک به دنبال کشف ساختارهایی بوده که منجر به گروه بندی نمونه های موجود در یک پایگاه داده بوده، به گونه ای که نمونه های مشابه درون دسته هایی که بیشترین شباهت را با هم داشته قرار گرفته، در حالی که دارای تفاوتی قابل قبول با نمونه های سایر گروه ها داشته باشند. الگوریتم های خوشه بندی را می توان به چند دسته کلی الگوریتم های خوشه بندی تفکیکی، سلسله مراتبی، مبتنی بر چگالی و مبتنی بر گرید تقسیم نمود. این تحقیق ابتدا به مرور روش های خوشه بندی مطرح پرداخته و چند الگوریتم از هر روش را معرفی کرده است. در ادامه همچنین به معرفی روش های دیگری از جمله روش های خوشه بندی مبتنی بر الگوریتم های فرا ابتکاری و خوشه بندی های آنلاین پرداخته شده و سپس چالش های موجود در خوشه بندی از قبیل انتخاب تعداد بهینه خوشه ها، کاهش ابعاد، مدیریت داده های پرت و روشهای مقابله با آنها معرفی شده اند. در نهایت روش ها و الگوریتم های موجود از نظر برخی از پارامترها مقایسه شده و به بررسی مزایا و معایب هر الگوریتم پرداخته شدهاست.

Authors

محمود شاکری

دانشگاه جامع علمی کاربردی واحد جهاد دانشگاهی مشهد

محمد عبدالهی

دانشگاه جامع علمی کاربردی واحد جهاد دانشگاهی مشهد

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • "داده کاوی پیشرفته، _ دکتر جمال شهرابی، مهندس علی ذوالقدر ...
  • Pavel Berkhin "Survey of Clustering Data Mining Techniques", Accrue Software, ...
  • Paul S. Bradley, Usama M. Fayyad, (1998), "Refining Initial Point ...
  • D. Hand, H. Mannila, P. Smyth, (20 01).Principles of Data ...
  • Jeffery W. Seifert, (2004) _ Analyst in information science and ...
  • http : //www. ecg-pnum. ir/thes is/index _ php ?page s=thes ...
  • Ahmadi A, Karry F, Kamel M, (2009), "Flocking based approach ...
  • Pradeep R, Singh S, (2010), _ survey of clustering technigues", ...
  • نمایش کامل مراجع