یک معیار شباهت مبتنی بر محبوبیت برای بهبود کارایی خوشه بندی طیفی
Publish place: Computing Science Journal، Vol: 9، Issue: 2
Publish Year: 1403
نوع سند: مقاله ژورنالی
زبان: Persian
View: 46
This Paper With 15 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_CSJI-9-2_002
تاریخ نمایه سازی: 18 شهریور 1403
Abstract:
روش های خوشه بندی طیفی، به دلیل قابلیتی که در تشخیص خوشه های با شکل های مختلف دارند، بسیار مورد توجه قرار گرفته اند. کارایی این روش ها وابستگی شدیدی به نحوه تعریف شباهت بین نمونه ها دارد. بنابراین، تلاش ها برای بهبود کارایی این الگوریتم ها بر روی ارایه معیار شباهت مناسب تر متمرکز بوده است. در این مقاله، به هر نمونه شاخصی تحت عنوان شاخص محبوبیت نسبت می دهیم که بیانگر میزان مرکزیت آن نمونه در مجموعه داده است. همچنین، معیار شباهت جدیدی مبتنی بر محبوبیت نمونه ها پیشنهاد و بر پایه آن الگوریتم خوشه بندی طیفی مبتنی بر محبوبیت را پیشنهاد می دهیم. از آنجا که شاخص محبوبیت پیشنهادی مستقل از چگالی محلی خوشه هاست، الگوریتم پیشنهادی می تواند در خوشه بندی داده های با چگالی های متفاوت موفق عمل کند. معیار پیشنهادی ویژگی سودمند دیگری نیز دارد؛ شباهت نمونه ها در معیار پیشنهادی با توجه به محبوبیت آنها و جایگاه یک نمونه در لیست همسایگان نمونه دیگر محاسبه می شود. این ویژگی به جداسازی خوشه های با همپوشانی بالا کمک بسیاری می کند. به دلیل سادگی تعریف پیشنهادی برای شاخص محبوبیت، الگوریتم محاسبه ماتریس شباهت پیشنهادی پیچیدگی محاسباتی بسیار پایینی دارد. برای مطالعه و مقایسه کارایی الگوریتم خوشه بندی پیشنهادی با همتاهای آن، از منظر معیار انطباق NMI، آزمایش هایی بر روی شش مجموعه داده مصنوعی و پانزده مجموعه داده واقعی انجام داده ایم. نتایج نشان می دهد که الگوریتم خوشه بندی پیشنهادی و معیار شباهت مطرح در آن کارایی بهتری نسبت به روش های همتای آن از جمله معیار شباهت مبتنی بر میانگین محلی، معیار خود- تنظیم و معیار شباهت محلی مبتنی بر همسایه های مشترک دارد و در اغلب موارد بهترین عملکرد را به دست می آورد.
Keywords:
Authors
حسن مطلبی
استادیار، دانشکده مهندسی برق و کامپیوتر، دانشگاه تحصیلات تکمیلی صنعتی و فناوری پیشرفته، کرمان، ایران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :