طبقه بندی و ارزیابی روشهای کاوش جریان داده براساس رویکردهای مختلف یادگیری abstract
کاوش
جریان داده یکی از مهمترین موضوعات تحقیقاتی در حوزهی
دادهکاوی به شمار میرود که پژوهشهای زیادی را در سال-های اخیر به خود اختصاصداده است. با توجه به طیف وسیع کاربردهای
کاوشجریان داده از جمله شبکههای حسگر، ارزیابیهای شبکهای و گزارشات تلفنی و همچنین چالشهای موجود در این زمینه، نیاز روزافزون به تحقیق در این حوزه احساسمیشود. به طور کلی، دو چالشعمده فرا روی کاوش جریانهای دادهای قرار دارد: اول طراحی روشهای کاوشسریع و دوم نیاز به تشخیص سریع تغییرات داده. بر این اساسالگوریتمهایی با رویکردهای بانظارت (دسته بندی) و رویکردهای بدون نظارت (خوشه بندی و کاوشالگوهای تکراری) در این حوزه تدوین و بکارگرفته شده است. روشهای مبتنی بر رویکرد بانظارت تنها از دادههای حاوی برچسب استفاده میکنند، که به دست آوردن آنها پرهزینه و زمانبر است. همچنین روشهای مبتنی بر رویکرد بدوننظارت از پیچیدگی زیاد ساختاری برخوردارند و هزینهی انجام این نوع عملیات بسیار زیاد است. براین اساس اخیرًا تحقیقاتی مبتنی بر رویکردهای شبه نظارتی به منظور ارائهی الگوریتمهای کاراتر از بعد فضا و زمان در حوزه کاوشدادههای جریانی انجام شده است. لذا تحقیقات نشان میدهد این دسته از رویکردهای یادگیری، در رفع چالشهای موجود در حوزهی
کاوشجریان داده و ارائه الگوریتم های به صرفه از نظر زمان و هزینه، بهتر عمل میکنند. هدف این مقاله ارائهی یک چارچوب برای تحلیل و ارزیابی رویکردهای مختلف یادگیری در رفع چالشهای فراروی
کاوشجریان داده است. چارچوب تحلیلی بستری را فراهم میآورد که بر طبق آن بتوان تطبیقی بین روشهای
کاوشجریان داده و
رویکردهای یادگیری از طریق دستهبندی و ارزیابی الگوریتمهای مختلف بدست داد. چارچوب پیشنهادی در کمکبه شناسایی روشهای نوین یادگیری که میتوانند در ارائهی راهکارهایی برای
کاوشجریان داده ایفای نقشنمایند، مؤثر باشد و تحقیقات آتی در این زمینه را جهتدهی نماید.