رده بندی داده های جریانی به کمک سیستم های چند رده بند: بررسی چندین الگوریتم مطرح با مطالعه موردی بورس اوراق بهادار تهران

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 418

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

EMAA16_028

تاریخ نمایه سازی: 7 مهر 1398

Abstract:

پیشرفت های اخیر فناوری در زمینه پردازش و نگهداری اطلاعات، سبب شده است تا بسیاری از سازمان های بزرگ، روزانه و به صورت خودکار حجم انبوهی از داده ها را که به آنها داده های جریانی اطلاق می شود، با نرخ بسیاری بالائی تولید نمایند. اهمیت استخراج دانش از این حجم عظیم از داده ها و وجود چالش هائی از قبیل تغییر مفهوم، محدودیت حافظه، محدودیت پردازش و عدم امکان دسترسی مجدد به داده ها سبب شده است تا تحقیقات وسیعی در این زمینه صورت پذیرد. رویکردهای مختلفی برای رده بندی داده های جریانی مطرح شده اند که از این میان میتوان به رویکردهای مبتنی بر مجمع اشاره نمود. بیش از 60 الگوریتم مبتنی بر مجمع جهت رده بندی داده های جریانی وجود دارند که در این مقاله از میان آنها به پنج الگوریتم مطرح اشاره خواهد شد. در شبیه سازی صورت گرفته، دقت این الگوریتم ها با هم مقایسه شده اند. در این مطالعه، از داده های معاملات 280 شرکت پذیرفته شده در بورس اوراق بهادار تهران به همراه داده های مصنوعی استفاده شده است. نتا یج شبیه سازی نشان می دهد که دقت الگوریتم های بررسی شده، نزدیک به هم هستند، هر چند که این الگوریتم ها در رده بندی داده های بورس تهران، از دقت مناسبی برخودار نیستند.

Keywords:

داده های جریانی , رده بندی , مجمع , سیستم های چند رده بند

Authors

مهدی محمدیان

مربی، دانشکده مهندسی کامپیوتر، دانشگاه پیام نور تهران ایران / دانشجوی مقطع دکتری، گرایش نرم افزار، دانشگاه علم و صنعت، تهران