یک الگوریتم خوشه بندی سلسله مراتبی ترکیبی برپایه روش مبتنی بر تراکم

Publish Year: 1397
نوع سند: مقاله ژورنالی
زبان: Persian
View: 353

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_SAIRAN-9-1_012

تاریخ نمایه سازی: 30 مهر 1398

Abstract:

خوشه بندی یکی از شاخه های مهم موجود در داده کاوی است که هدف آن تقسیم داده ها به زیرمجموعه های معناداری است که خوشه نامیده می شوند. این تکنیک شامل فرآیند پیدا کردن گروه بندی طبیعی در مجموعه داده ها، بر اساس شباهت و تفاوت است به نحوی که اطلاعات قبلی کمی در مورد داده ها در دسترس است و یا اصلا اطلاعاتی در دسترس نیست. در طی دهه های متمادی الگوریتم های فراوانی برای خوشه بندی در رویکردهای مختلف و متفاوت و یا ترکیبی از آنها ایجاد شده اند. در این مقاله الگوریتمی بر پایه رویکردهای مبنی بر تراکم و سلسله مراتبی ارائه می شود. DBSCANیکی از الگوریتم های مطرح شده در رویکرد مبتنی بر تراکم است. این الگوریتم نیاز به دو پارامتر دارد که تعیین آن هنوز یک چالش بزرگ است. در روش پیشنهادی پارامترهای الگوریتم DBSCANطوری تنظیم می شود که بدون نیاز به دخالت کاربر، خوشه های احتمالی بصورت خودکار یافت شوند. سپس خوشه های نزدیک به یکدیگر به قدری باهم ادغام می شوند تا کیفیت خوشه های نهایی به نحو مطلوبی ارتقا یابد. بدین ترتیب خوشه های باکیفیت و دقیقی بدست خواهد آمد. در انتها برای آزمایش این الگوریتم ترکیبی جدید از داده های واقعی موجود در پایگاه داده UCIاستفاده شد. نتایج نشان می دهد که الگوریتم ترکیبی جدید کارایی بیشتر و دقیقتر و سرعت مناسبی نسبت به روش های قبلی دارد.

Keywords:

داده کاوی , خوشه بندی ترکیبی , خوشه بندی سلسله مراتبی , خوشه بندی مبتنی بر تراکم

Authors

علیرضا لطیفی پاکدهی

دانشجوی کارشناسی ارشد، دانشگاه تربیت دبیر شهید رجایی

نگین دانشپور

دکتری مهندسی کامپیوتر دانشگاه تربیت دبیر شهید رجائی