خوشه بندی داده های جریان داده دارای برچسب

Publish Year: 1397
نوع سند: مقاله ژورنالی
زبان: Persian
View: 75

This Paper With 14 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_CSJI-3-3_003

تاریخ نمایه سازی: 14 بهمن 1402

Abstract:

امروزه مسئله پیداکردن الگوریتم های خوشه بندی نظارت شده برای داده های پویا و جریان داده اهمیت زیادی دارد. محققان سعی می کنند برای حل کردن این مسئله الگوریتم های جدید ارائه نمایند و یا الگوریتم های موجود را بهبود دهند. در میان این الگوریتم ها، روش SAIC برای خوشه بندی داده های پویا با خوشه های با اندازه و شکل دلخواه ارائه شده است. در این روش، تعداد خوشه ها به طور خودکار توسط الگوریتم مشخص می شود اما این الگوریتم قادر به تشخیص صحیح خوشه های مسائل تک دسته ای نیست. این امر موجب می شود که بعضا در خوشه بندی جریان داده اختلال ایجاد شود. در این مقاله ضمن توضیح علت ایجاد این مشکل، الگوریتمISAIC برای بهبود الگوریتم SAIC پیشنهاد می شود. همچنین عملکرد الگوریتم ISAIC با الگوریتم SAIC روی چند مجموعه داده مورد مقایسه قرار گرفته و نتایج ارایه شده است. میزان بهبود دقت دسته بندی بر روی مجموعه داده های مورد آزمایش حداقل صفر و حداکثر حدود ۶۵% است.

Keywords:

توده جریان داده , جریان داده خوشه بندی , خوشه بندی نظارت شده

Authors

زهرا بیات

دانشجوی کارشناسی ارشد دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران

هدیه ساجدی

استادیار دانشکده ریاضی، آمار و علوم کامپیوتر، پردیس علوم، دانشگاه تهران