CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک روش خوشه بندی خودکار با استفاده از رابطه همسایگی متقابل داده ها و ساختار هندسی دایره آپولونیوس

عنوان مقاله: یک روش خوشه بندی خودکار با استفاده از رابطه همسایگی متقابل داده ها و ساختار هندسی دایره آپولونیوس
شناسه ملی مقاله: CSCG04_126
منتشر شده در چهارمین کنفرانس بین المللی محاسبات نرم در سال 1400
مشخصات نویسندگان مقاله:

مژگان سادات مشیریان - دانشکده فناوری اطلاعات و مهندسی کامپیوتر دانشگاه شهید مدنی آذربایجان، تبریز، ایران
مهدی هاشم زاده - دانشیار، دانشکده فناوری اطلاعات و مهندسی کامپیوتر دانشگاه شهید مدنی آذربایجان، تبریز، ایران
شهین پوربهرامی - استادیار، دانشکده مهندسی کامپیوتر دانشگاه فنی و حرفه ای، تهران، ایران

خلاصه مقاله:
در بسیاری از مسائل یادگیری ماشین و داده کاوی مانند طبقه بندی و خوشه بندی، از الگوریتم های ساخت همسایگی برای مدل سازی روابط محلی بین نمونه های داده استفاده می شود. در یافتن ارتباط بین نقاط داده، تشخیص دقیق همسایگی نقاط به طور انکارناپذیری برای کاوش داده ها مفید است. طی سالیان اخیر، برخی روش های تشخیص همسایگی مبتنی بر ساختارهای هندسی ارائه شده اند که به دلیل دقت بالا در مکان یابی نقاط همسایگی بسیار کارآمد بوده اند. با این حال اغلب این روش ها برای تشکیل گروه های مشابه نیاز به بررسی همه نقاط همسایگی دارند. از این رو، هزینه های محاسباتی بالایی دارند. در این میان، ساختار دایره آپولونیوس در ارزیابی شباهت های محلی در بین مشاهدات، عملکرد بهتری از خود نشان داده است و زمینه جدیدی از علم هندسه را در داده کاوی گشوده است. ساختار آپولونیوس امکان معرفی دانش پنهان را از طریق معرفی معیارهای هندسه فراهم می کند و می تواند یک منطقه همسایگی پویا را برای نقاط داده تعریف کند. در این مقاله، با بهره گیری از مزایای ساختار هندسی دایره آپولونیوس و ایده همسایگان متقابل داده ها، یک روش خوشه بندی خودکار ارائه می شود. از ویژگی همسایگی متقابل نقاط داده برای تشخیص سریع و بهینه همسایگی نقاط داده، شناسایی نواحی متراکم و کشف داده های پرت (نویز) استفاده می شود. از ساختار هندسی دایره آپولونیوس نیز برای تعیین شعاع همسایگی نواحی متراکم (با چگالی داده بالا) استفاده می شود. طوری که برای هریک از نواحی، یک شعاع همسایگی پویا و متناسب با نقاط داده مربوطه استخراج می شود. طی این دو فرایند، هم تعداد خوشه های بهینه و هم اعضا هر خوشه شناسایی می شود. بدین ترتیب یک روش خوشه بندیخودکار حاصل می شود که بدون نیاز به دریافت پارامتر خاصی، حتی تعداد خوشه ها، می تواند عمل خوشه بندی داده ها را انجام دهد. آزمایش های انجام شده بر روی مجموعه داده های استاندارد و مقایسه نتایج با دیگر روش ها، نشان از عملکرد مناسب روش پیشنهادی دارد.

کلمات کلیدی:
داده کاوی، تشخیص همسایگی، ساختار هندسی، دایره آپولونیوس، همسایگان متقابل، خوشه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1418635/