ارائه ناحیه بندی S-B جهت انتخاب بهتر مرکز داده در الگوریتم خوشه بندی K-means
Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 566
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
TEDECE02_026
تاریخ نمایه سازی: 21 شهریور 1395
Abstract:
یکی از ابتدایی ترین روش ها برای تحلیل مسئله های مختلف استفاده از الگوها و بررسی آنهاست. خوشه بندی روشی مفید برای کشف توزیع داده ها و الگوهای موجود در داده می باشد. در نظام های بازیابی اطلاعات، خوشه بندی نقشی مؤثر ایفا می کند. از این رو تصحیح در خوشه بندی مورد توجه قرار می گیرد.یکی از الگوریتم های خوشه بندی اطلاعات K-means است که جزء پرکاربردترین الگوریتم ها در این زمینه است. از مزایای آن می توان از سادگی و سرعت بالایاین الگوریتم و از معایب آن، انتخاب نقاط اولیه به صورت تصادفی و تاثیر نقاط اولیه بر مراکز خوشه ها نام برد. در الگوریتم مذکور، مراکز خوشه ها به صورت تصادفی انتخاب می گردد که موجب می شود نتایج خوشه بندی ناپایدار باشد. در این راستا روشی در جهت بهبود این الگوریتم ارائه گردیده است. در این روش در نظر است که اثر وجود نقاط نویزدار کمتر شود، به همین جهت به ناحیه بندی نقاط یک مجموعه قبل از اجرای الگوریتم پرداخته می شود. با استفاده از نرم افزار متلب به همراه تعدادی از مجموعه داده های استاندارد UCI و شاخص های ارزیابی خوشه بندی، این نتیجه حاصل می شود که ناحیه بندی پیشنهادی تاثیر انتخاب تصادفی نقاط اولیه را کاهش داده و احتمال انتخاب خوشه ای فاقد داده را به صفر می رساند
Keywords:
Authors
بهنوش کریمی مفرح
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد تهران شمال
کامران لایقی
استادیار دانشگاه آزاد اسلامی واحد تهران شمال
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :