CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک الگوریتم خوشه بندی سلسله مراتبی ترکیبی برپایه روش مبتنی بر تراکم

عنوان مقاله: یک الگوریتم خوشه بندی سلسله مراتبی ترکیبی برپایه روش مبتنی بر تراکم
شناسه ملی مقاله: JR_SAIRAN-9-1_012
منتشر شده در شماره 1 دوره 9 فصل بهار در سال 1397
مشخصات نویسندگان مقاله:

علیرضا لطیفی پاکدهی - دانشجوی کارشناسی ارشد، دانشگاه تربیت دبیر شهید رجایی
نگین دانشپور - دکتری مهندسی کامپیوتر دانشگاه تربیت دبیر شهید رجائی

خلاصه مقاله:
خوشه بندی یکی از شاخه های مهم موجود در داده کاوی است که هدف آن تقسیم داده ها به زیرمجموعه های معناداری است که خوشه نامیده می شوند. این تکنیک شامل فرآیند پیدا کردن گروه بندی طبیعی در مجموعه داده ها، بر اساس شباهت و تفاوت است به نحوی که اطلاعات قبلی کمی در مورد داده ها در دسترس است و یا اصلا اطلاعاتی در دسترس نیست. در طی دهه های متمادی الگوریتم های فراوانی برای خوشه بندی در رویکردهای مختلف و متفاوت و یا ترکیبی از آنها ایجاد شده اند. در این مقاله الگوریتمی بر پایه رویکردهای مبنی بر تراکم و سلسله مراتبی ارائه می شود. DBSCANیکی از الگوریتم های مطرح شده در رویکرد مبتنی بر تراکم است. این الگوریتم نیاز به دو پارامتر دارد که تعیین آن هنوز یک چالش بزرگ است. در روش پیشنهادی پارامترهای الگوریتم DBSCANطوری تنظیم می شود که بدون نیاز به دخالت کاربر، خوشه های احتمالی بصورت خودکار یافت شوند. سپس خوشه های نزدیک به یکدیگر به قدری باهم ادغام می شوند تا کیفیت خوشه های نهایی به نحو مطلوبی ارتقا یابد. بدین ترتیب خوشه های باکیفیت و دقیقی بدست خواهد آمد. در انتها برای آزمایش این الگوریتم ترکیبی جدید از داده های واقعی موجود در پایگاه داده UCIاستفاده شد. نتایج نشان می دهد که الگوریتم ترکیبی جدید کارایی بیشتر و دقیقتر و سرعت مناسبی نسبت به روش های قبلی دارد.

کلمات کلیدی:
داده کاوی, خوشه بندی ترکیبی, خوشه بندی سلسله مراتبی, خوشه بندی مبتنی بر تراکم

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/950614/