ارائه الگوریتم SAIC بهبود یافته برای خوشه بندی نظارت شده ی داده های جریانی

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 232

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

KAUCEE02_111

تاریخ نمایه سازی: 18 اردیبهشت 1400

Abstract:

هر روزه، حجم عظیمی از داده های اینترنتی، تراکنشی و سنسور بصورت پیوسته در قالب جریان داده تولید میشود که نیاز است بصورت برخط به محض اینکه دریافت میشوند مورد تحلیل و پردازش قرار گیرند. طبیعت پویای جریان داده و سرعت دریافت آن محدودیت های زمان و فضا را بر کاربردهای جریان داده اعمال می کندکه طراحی الگوریتم های جریان داده را دشوار می سازد . خوشه بندی یکی از روشهای کارآمد داده کاوی برای تحلیل و استخراج دانش از جریان داده هاست. از آنجا که ماهیت این داده ها ناپایدار و نامحدود است، الگوریتمهای متداول خوشه بندی را نمیتوان بطور مستقیم مورد استفاده قرار داد. الگوریتم SAIC یک روش خوشه بندی نظارت شده افزایشی سازگار روی جریان داده مبتنی بر بسته است. هدف ما ارائه چارچوبی مبتنی بر این الگوریتم است. ما در این چارچوب با در نظر گرفتن مفاهیمی همچون تغییر مفهوم در جریان داده ها و بروزرسانی مدل یادگیری پس از تشخیص تغییر مفهوم سعی در بهبود نتایج خوشه بندی داریم. به منظور اعتبارسنجی روش پیشنهادی از مجموعه داده های متداول موجود در فهرست UCI استفاده شده است. نتایج آزمایشات حاکی از اینست که الگوریتم پیشنهادی بطور قابل ملاحظه ای کاراتر از الگوریتم SAIC عمل مینماید.

Keywords:

داده کاوی- جریان داده مبتنی بر بسته- تغییر مفهوم-خوشه بندی نظارت شده

Authors

سمانه تیموری

دانشگاه امام رضا

عادل قاضی خانی

دانشگاه امام رضا