CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

خوشهبندی در دادههای بعد بالا

عنوان مقاله: خوشهبندی در دادههای بعد بالا
شناسه ملی مقاله: NSOECE01_013
منتشر شده در کنفرانس بین المللی سیستمهای غیر خطی و بهینه سازی مهندسی برق و کامپیوتر در سال 1394
مشخصات نویسندگان مقاله:

سحر روستایی - دانشجو، دانشگاه قم، قم

خلاصه مقاله:
خوشه بندی به طور گسترده به عنوان ابزار اولیه برای داده کاوی مورداستفاده قرارگرفته اما به دلیل وجود صدها ویژگی و خاصیت اسپارس ذاتی داده های بعد بالا به خوبی برای خوشه بندی مجموعه داده های بعد بالا ازنظر کارایی و اثربخشی مقیاس پذیر نیست. خوشه بندی زیر فضا یک متدولوژی در حال تکامل است که به جای پیدا کردن خوشه در کل فضای ویژگی هدفش پیدا کردن خوشه های مختلف در زیر فضاهای متداخل یا غیرمتداول از مجموعه داده های بعد بالا است. الگوریتم های تراکم محور خوشه بندی زیر فضا با خوشه ها به شکل نواحی متراکم در مقایسه با نواحی نویزی یا مرزی رفتار می کند. الگوریتم های خوشه بندی زیر فضا دوشاخه اصلی بر اساس استراتژی جستجوی شان دارند: الگوریتم های بالا-پایین یک خوشه یابی اولیه در تمام ابعاد انجام می دهد و زیر فضای هر خوشه را ارزیابی می کند. الگوریتم های پایین- بالا فضاهای متراکم را در فضاهای بعد پایین پیدا می کند و آن ها را برای تشکیل خوشه ترکیب می کند. در این مقاله مروری روی الگوریتم های خوشه بندی زیر فضا و الگوریتم های تراکم محور زیر فضا ارائه می دهیم همراه نموداری از مقایسه این الگوریتم ها. سپس دو الگوریتم به عنوان نماینده های شاخه اصلی الگوریتم های خوشه بندی زیر فضا و 3 الگوریتم تراکم محور را ازلحاظ دقت، زمان اجرا، مقیاس پذیری مقایسه می کنیم.

کلمات کلیدی:
داده کاوی، خوشه بندی زیر فضا، الگوریتم های تراکم محور، خوشه بندی زیر فضا

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/383285/