CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

طبقه بندی ترکیبی برخط داده های جریانی چند برچسبی

عنوان مقاله: طبقه بندی ترکیبی برخط داده های جریانی چند برچسبی
شناسه ملی مقاله: UTCONF03_001
منتشر شده در سومین همایش ملی دانش و فناوری مهندسی برق، کامپیوتر و مکانیک ایران در سال 1398
مشخصات نویسندگان مقاله:

تکتم فرجی محصل - دانشجوی کارشناسی ارشد دانشگاه امام رضا
عادل قاضی خانی - استادیار گروه کامپیوتر دانشگاه امام رضا

خلاصه مقاله:
روش های داده کاوی کلاسیک اغلب روی مجموعه داده های ایستا تمرکز دارند. اما پیشرفت تکنولوژی باعث شده است تا داده هایی با حجم و سرعت بسیار بالا تولید شوند. این داده ها، داده های جریانی نامیده می شوند و طبقه بندی آن ها به علت ماهیت پویای آن داده ها به یکی از مسائل مهم داده کاوی تبدیل شده است. مسئله زمانی چالش برانگیزتر می شود که داده های جریانی دارای چندین برچسب باشند. یکی از روش های مناسب و مرثر برای طبقه بندی داده های جریان، استفاده از طبقه بند ترکیبی است که از چندین طبقه بند به منظور بهبود صحت طبقه بندی استفاده می کند. در این مقاله، یک طبقه بند ترکیبی بر خط برای طبقه بندی داده های جریانی چند برچسبی ارائه شده است که از الگوریتم winnow برای به روز رسانی وزن طبقه بندها استفاده می کند. همچنین، به دلیل اینکه مجموعه داده مورد استفاده در این مقاله، یک مجموعه داده دودویی است در الگوریتم پیشنهادی، فاصله همینگ به عنوان معیار فاصله بکار رفته است. به منظور بررسی عملکرد الگوریتم پیشنهادی، این الگوریتم با الگوریتم طبقه بند ترکیبی وزن دار برای داده های جریانی چند برچسبی (WECM) مقایسه شده است نتایج آزمایشات با استفاده از معیارهای ارزیابی خطای همینگ، میانگین دقت و پوشش حاکی از برتری الگوریتم پیشنهادی است.

کلمات کلیدی:
داده های جریانی، خوشه بندی، طبقه بندی، طبقه بند ترکیبی برخط، فاصله همینگ

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/925506/