رده بندی داده های جریانی به کمک سیستم های چند رده بند: بررسی چندین الگوریتم مطرح با مطالعه موردی بورس اوراق بهادار تهران
Publish place: 16th conference on Recent Research in Science and Technology
Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 418
This Paper With 11 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
EMAA16_028
تاریخ نمایه سازی: 7 مهر 1398
Abstract:
پیشرفت های اخیر فناوری در زمینه پردازش و نگهداری اطلاعات، سبب شده است تا بسیاری از سازمان های بزرگ، روزانه و به صورت خودکار حجم انبوهی از داده ها را که به آنها داده های جریانی اطلاق می شود، با نرخ بسیاری بالائی تولید نمایند. اهمیت استخراج دانش از این حجم عظیم از داده ها و وجود چالش هائی از قبیل تغییر مفهوم، محدودیت حافظه، محدودیت پردازش و عدم امکان دسترسی مجدد به داده ها سبب شده است تا تحقیقات وسیعی در این زمینه صورت پذیرد. رویکردهای مختلفی برای رده بندی داده های جریانی مطرح شده اند که از این میان میتوان به رویکردهای مبتنی بر مجمع اشاره نمود. بیش از 60 الگوریتم مبتنی بر مجمع جهت رده بندی داده های جریانی وجود دارند که در این مقاله از میان آنها به پنج الگوریتم مطرح اشاره خواهد شد. در شبیه سازی صورت گرفته، دقت این الگوریتم ها با هم مقایسه شده اند. در این مطالعه، از داده های معاملات 280 شرکت پذیرفته شده در بورس اوراق بهادار تهران به همراه داده های مصنوعی استفاده شده است. نتا یج شبیه سازی نشان می دهد که دقت الگوریتم های بررسی شده، نزدیک به هم هستند، هر چند که این الگوریتم ها در رده بندی داده های بورس تهران، از دقت مناسبی برخودار نیستند.
Keywords:
Authors
مهدی محمدیان
مربی، دانشکده مهندسی کامپیوتر، دانشگاه پیام نور تهران ایران / دانشجوی مقطع دکتری، گرایش نرم افزار، دانشگاه علم و صنعت، تهران