CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی چالش ها و بهبود های الگوریتم خوشه بندی کا-میانگین

عنوان مقاله: بررسی چالش ها و بهبود های الگوریتم خوشه بندی کا-میانگین
شناسه ملی مقاله: STCONF04_075
منتشر شده در چهارمین همایش ملی فناوریهای نوین در مهندسی برق، کامپیوتر و مکانیک ایران در سال 1400
مشخصات نویسندگان مقاله:

اکرم سادات مصطفوی - دانشجوی ارشد کامپیوتر دانشگاه بین المللی امام خمینی(ره) قزوین
محمد مهدی گل ریز - دانشجوی ارشد کامپیوتر دانشگاه بین المللی امام خمینی(ره) قزوین
مرتضی محمدی زنجیره - استاد گروه مهندسی کامپیوتردانشگاه بین المللی امام خمینی(ره) قزوین

خلاصه مقاله:
در میان الگوریتم های خوشه بندی موجود، الگوریتم کا -میانگین به دلیل سادگی و موثر بودن به یکی از گسترده ترین تکنیک های مورد استفاده برای خو شه بندی داده ها تبدیل شده است. این الگوریتم با وجود سادگی و گستردگی استفاده از آن، دارای مشکلاتی چون حساب بودن به نویز، مقدار دهی تصادفی مراکز اولیه خوشه بندی، وجود داده های پرت و اثرات آن بر خوشه بندی، دقت و پایداریالگوریتم، تعیین مناسب تعداد خوشه ها قبل از انجام خوشه بندی، ناتوانی الگوریتم در مدیریت داده هائی با مدیرت کاملا متفاوت، می باشد. باتوجه به مشکلات این الگوریتم، در سال های اخیر بهبود هایی بر روی آن انجام شده است تا مشکلات مربوط به این الگوریتم را به حداقل برساند. ما در این مقاله سعی می کنیم بهبود های اخیرا صورت گرفته بر روی این الگوریتم را به طور مختصر و مفید شرح دهیم.

کلمات کلیدی:
الگوریتم خوشه بندی، بهبود کا میانگین، داده های پرت داده های نویزی، مراکز اولیه تصادفی، تعداد خوشه ها.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1292711/