سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

بررسی مشکلات الگوریتم خوشه بندی DBSCAN و مروری بر بهبودهای ارائه شده برای آن

Publish Year: 1396
Type: Journal paper
Language: Persian
View: 240

This Paper With 36 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

JR_SCJKA-6-1_001

Index date: 22 July 2022

بررسی مشکلات الگوریتم خوشه بندی DBSCAN و مروری بر بهبودهای ارائه شده برای آن abstract

خوشه بندی یک از تکنیک های مهم کشف دانش در پایگاه داده است. الگوریتم های خوشه بندی مبتنی بر چگالی یکی از روش های اصلی برای خوشه بندی در داده کاوی هستند. عدم محدودیت به شکل خوشه ها، ساده و قابل فهم بودن از جمله مزایای این الگوریتم ها است. DBSCAN الگوریتم پایه روش های خوشه بندی مبتنی بر چگالی است. این الگوریتم قابلیت کشف خوشه های با اندازه و اشکال متفاوت را از حجم زیادی از داده ها دارد و در مقابل نویز نیز مقاوم است. علی رغم وجود این مزایا، این الگوریتم دارای مشکلاتی نظیر سخت بودن تعیین مقدار دقیق پارامترهای ورودی، عدم تشخیص خوشه های با چگالی متفاوت و عدم تشخیص صحیح خوشه ها در هنگام نزدیک بودن خوشه ها به هم نیز می باشد. از سال ۱۹۹۶ که DBSCAN ارائه شده تا به امروز، الگوریتم های بسیار زیادی در جهت بهبود DBSCAN ارائه شده اند. در این مقاله ابتدا، مشکلات الگوریتم DBSCAN بررسی می شوند. سپس به مرور و بررسی الگوریتم هایی که در جهت بهبود مشکلات الگوریتم DBSCAN ارائه شده اند می پردازیم تا با نقاط ضعف و قوت این الگوریتم ها و میزان موفقیت این الگوریتم ها در بهبود الگوریتم DBSCAN آشنا شویم. همچنین، با توجه به مطالعات انجام شده، اقدام به پیاده سازی برخی از این الگوریتم ها نموده ایم و آن ها را بر روی مجموعه داده های استاندارد، بر اساس معیارهای ارزیابی خوشه بندی تست کرده ایم تا بهتر بتوانیم درباره این الگوریتم ها قضاوت کنیم.  

بررسی مشکلات الگوریتم خوشه بندی DBSCAN و مروری بر بهبودهای ارائه شده برای آن Keywords:

بررسی مشکلات الگوریتم خوشه بندی DBSCAN و مروری بر بهبودهای ارائه شده برای آن authors

علی زاده ده بالایی

دانشگاه صنعتی امیرکبیر

علیرضا باقری

دانشگاه صنعتی امیرکبیر

حامد افشار

دانشگاه صنعتی امیرکبیر