الگوریتمی جدید و موثر در خوشه بندی فازی ترکیبی دولایه براساس قاعده K نزدیک ترین همسایگی abstract
آنالیز خوشه بندی برای کلاسه بندی مجموعه ای از داده ها به زیرگروه های مشابه بکار می رود اساس آن بر مبنای روشهای مبتنی بر
یادگیری بدون مربی است و یکی از تکنیکهای مهم در زمینه شناسایی آماری الگوها است. در تحقیقات و مقالات مختلفی که تاکنون در این زمینه صورت گرفته، نشان داده شده است که الگوریتمهای خوشه بندی که از معیارهای فازی استفاده می کنند مزیت آشکاری نسبت به نمونه های قطعی (crisp) دارند. در خوشه بندی فازی (نرم) هر نمونه به چندین کلاستر با درجات عضویت مختلف اختصاص می یابد. اکثر الگوریتمهای خوشه بندی فازی برمبنای روش ( Fuzzy C-Mean) می باشند با وجود مزیت FCM نسبت به روش سخت نظیر یعنی HCM در شناسایی دسته ها، نیاز به دانستن مراکز اولیه و تعداد خوشه ها از معایب روش فازی است چرا که معمولا این مراکز اولیه به صورت دلخواه مقدار دهی می شوند و وجود این مقادیر اولیه متفاوت ممکن است باعث رسیدن تابع هدف فازی به نقاط مینیمم محلی متفاوت شوند. بنابراین با این امید که بعضی از اجراها به نقاط مینیمم گلوبال برسند خوشه بندی با مقادیر اولیه متفاوتی تکرار می شوند لذا در این مقاله الگوریتم جدیدی برای خوشه بندی فازی بدون احتیاج به پیش فرض مراکز و تعداد خوشه ها پیشنهاد شده است که می تواند با دقت بالایی خوشه بندی را به سمت خوشه بندی بدون مربی (unsupervised learning ) واقعی سوق دهد. با استفاده از معیارهای سنجش خوشه بندی فازی، یافتن مقدار بهینه خوشه ها توسط
الگوریتم ترکیبی حاصل شود. این الگوریتم براساس استراتژی خوشه بندی دولایه پایه گذاری شده است. در لایه اول یک جستجوی بدون مربی به دنبال مراکز اولیه خوشه ها با استفاده از قاعده نزدیکترین همسایگی (K-NN) مورد استفاده قرار می گیرد. سپس برای بدست آوردن خوشه بندی بهینه، دومین لایه شامل فقط یک تکرار از FCM است. برخلاف روش متداول که تکرارهای متوالی تا همگرایی دارد. الگوریتم جدید پیشنهاد شده و روش FCM متداول را روی 6 مجموعه داده استاندارد که برای ارزیابی و مقایسه این قبیل الگوریتمها به کار می روند پیاده سازی کرده ایم. نتایج بدست آمده نشان می دهد که الگوریتم جدید نسبت به FCM، دقت بیشتری هم در یافتن تعدادواقعی کلاسترها و هم در اختصاص درست نمونه ها به هر کلاستر دارد.