توسعه یک الگوریتم خوشه بندی با ناظر افزایشی برای داده های جریانی

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 482

This Paper With 21 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ECECON01_019

تاریخ نمایه سازی: 25 بهمن 1399

Abstract:

امروزه با توجه به حجم زیاد و سرعت بالای داده های جریانی در حال تولید، نیاز به ذخیره و مدیریت این داده ها بیشتر احساس می شود. خوشه بندی داده های جریانی به دلیل ماهیت غیر ثابت و نامحدود آن ها، با چالش های بسیاری مواجه است. داده های جریانی دارای ترتیب زمانی، تغییرات سریع، حجم عظیم و به طور بالقوه از داده های بی نهایت تشکیل دادند. الگوریتم های زیادی در زمینه خوشه بندی داده های جریانی ارائه شده است. با این حال الگوریتم های بسیار محدودی در زمینه داده های جریانی با ناظر ارائه شده است. در این مقاله، یک الگوریتم دو مرحله ای خوشه بندی پویای داده های جریانی DCDS که یک روش با ناظر افزایشی است، توسعه داده شده است. در این الگوریتم، داده های جریانی به صورت اتوماتیک و بدون نیاز به دریافت هیچ پارامتری از کاربر، خوشه بندی می شوند. علاوه بر این، از خوشه های تولید شده، جهت کلاس بندی داده های بدون برچسب می توان استفاده کرد. نتایج تجربی روش پیشنهادی بر روی شش مجموعه داده از UCI نشان می دهد که روش ارائه شده نسبت به روش های موجود با توجه به معیارهای ارائه شده دارای برتری می باشد.

Keywords:

خوشه بندی با ناظر , داده های جریانی , یادگیری افزایشی , کلاس بندی , خوشه بندی سلسله مراتبی

Authors

شاهرخ اسدی

استادیار، آزمایشگاه داده کاوی، دانشکده مهندسی پردیس فارابی دانشگاه تهران

سهیلا نیک پور

دانشکده فنی مهندسی، دانشگاه ازاد اسلامی واحد تهران شمال