بهبود پیچیدگی زمانی الگوریتم DBSCAN با تلفیق شبکه های توری

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 791

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ETECH04_067

تاریخ نمایه سازی: 27 بهمن 1398

Abstract:

خوشه بندی یکی از مسائل مهم در پردازش داده ها و داده- کاوی است که هدف اصلی آن پیدا کردن نمونه های مشابه در داده ها است. الگوریتم های خوشه بندی متنوعی وجود دارد. تفاوت الگوریتم ها در رویکرد خوشه بندی و مقیاس شباهتی است که استفاده می کنند. در میان این الگوریتم ها DBSCAN یکی از محبوبترین الگوریتم های چگالی محور است. این روش قادر است که نمونه های آموزشی را با شکل های مختلف شناسایی کند و به همین دلیل کاربردهای بسیار زیادی دارد. اگرچه این الگوریتم، مزایای خاص خود را دارد، اما دو نقطه ضعف مهم دارد. اول اینکه برای پایگاه داده های بسیار بزرگ کارایی مناسبی ندارد، دوم آنکه تعیین کردن پارامترهای eps و MinPts برای به دست آوردن خوشه بندی بهینه کار سختی است. برای حل این مشکلات، در این مقاله یک نوع دیگر از الگوریتم DBSCAN به نام GM2-DBSCAN ارائه شده است که از شبکه بندی و پارامترهای محلی برای حل مشکلات مذکور بهره می برد. با آزمایش الگوریتم جدید روی چندین مجموعه داده مختلف نشان داده شده است که الگوریتم از کارایی بالایی در تشخیص خوشه ها برخوردار بوده و همزمان پیچیدگی زمانی آن نسبت به الگوریتم DBSCAN کمتر است.

Keywords:

داده کاوی , خوشه بندی , DBSCAN , خوشه بندی شبکه محور , خوشه بندی چگالی محور

Authors

علی کمندی

دانشکده علوم مهندسی، پردیس فنی دانشگاه تهران تهران، ایران

نگار اوحدی

دانشکده علوم مهندسی، پردیس فنی دانشگاه تهران تهران، ایران

محمود شعبان خواه

دانشکده علوم مهندسی، پردیس فنی دانشگاه تهران تهران، ایران

سید محسن فاطمی

دانشکده علوم مهندسی، پردیس فنی دانشگاه تهران تهران، ایران

سید محسن حسینی

دانشکده علوم مهندسی، پردیس فنی دانشگاه تهران تهران، ایران