بهبودی بر خوشه بندی مقید با استفاده از انتخاب ویژگی

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 681

This Paper With 9 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

EISTC01_015

تاریخ نمایه سازی: 19 آذر 1398

Abstract:

الگوریتم های خوشه بندی کاربردهای بسیاری در علوم پزشکی، بانک داری، داده کاوی و... دارند. از جمله مشهورترین الگوریتم های خوشه بندی، الگوریتم K-means است که پیاده سازی ساده و سرعت بالایی دارد. اما یکی از جمله ایرادات بزرگ این الگوریتم، یکسان در نظر گرفتن ارزش تمامی ویژگی های پایگاه داده و عدم توانایی آن در استفاده از اطلاعات جانبی (قیدهای باید پیوند و نفی پیوند) است که به میزان قابل توجهی از کارآیی آن می کاهد. الگوریتم CVQE با هدف بهبود الگوریتم K-means و ایجاد امکان استفاده از قیدهای مجموعه داده، طراحی شده است و توانایی استفاده از اطلاعات جانبی، یعنی قیدهای باید پیوند و نفی پیوند را دارا می باشد. ایرادی که بر این الگوریتم وارد است، یکسان در نظر گرفتن اهمیت ویژگی ها می باشد که گاه به جای بهبود نتیجه خوشه بندی، موجب اختلال در عملکرد آن خواهد شد. در این مقاله مکانیسمی پیشنهاد شده است که به منظور بهبود کیفیت نتایج خوشه بندی مقید، با بهره گیری از قابلیت های الگوریتم خوشه بندی CVQE و الگوریتم رقابت استعماری، قابلیت انتخاب ویژگی های یک مجموعه داده، به خوشه بندی مقید اضافه شود. معیار بهبود ما در این روش، کاهش فواصل درون خوشه ای و افزایش فاصله میان خوشه ای می باشد. به همین منظور از شاخص دویس بلدین برای مقایسه نتایج الگوریتم پیشنهادی و الگوریتم های خوشه بندی CVQE و Cop-K-means استفاده شده است. پس از خوشه بندی سه مجموعه داده توسط الگوریتم پیشنهادی و الگوریتم های خوشه بندی، نتایج نشان می دهد که الگوریتم پیشنهادی در بهبود خوشه بندی مقید موفق عمل نموده است. اما زمان اجرای الگوریتم پیشنهادی بیشتر از سایر الگوریتم های یاد شده می باشد.

Authors

ماندانا غلامی گزافرودی

کارشناس ارشد مهندسی کامپیوتر در گرایش هوش مصنوعی