CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

کاوش مجموعه اقلام تکراری جریان های داده در مدل پنجره ی لغزان حساس به زمان بر مبنای درخت پیشوندی و تخمین احتمالی

عنوان مقاله: کاوش مجموعه اقلام تکراری جریان های داده در مدل پنجره ی لغزان حساس به زمان بر مبنای درخت پیشوندی و تخمین احتمالی
شناسه ملی مقاله: JR_SAIRAN-7-4_006
منتشر شده در در سال 1395
مشخصات نویسندگان مقاله:

محمود دی پیر - استادیار، دانشگاه علوم و فنون شهید ستاری
حمیدرضا دلیلی اسکویی - استادیار، دانشگاه هوایی شهید ستاری

خلاصه مقاله:
برای کاوش مجموعه اقلام تکراری در جریان های داده مدل های مختلفی مطرح شده اند. مدل پنجره ی لغزان حساس به زمان یکی از بهترین این مدل هاست چون به کمک آن هم تغییر مفهوم و هم سرعت متغیر جریان داده ورودی را می توان در نظر گرفت. تغییر محتوای پنجره با گذشت زمان، سبب پدیدار شدن الگوهای جدید و حذف برخی از الگوهای قدیمی میشود. چگونگی محاسبه یا تخمین تکرار، مجموعه اقلام جدید یکی از عوامل تاثیر گذار در کارایی الگوریتم های کاوش الگوهای تکراری در جریان های داده است. در این مقاله برای نخستین بار از تخمین احتمالی به منظور تخمین میزان تکرار مجموعه اقلام جدید استفاده شده است. بر اساس این تخمین، الگوریتمی سریع ارائه شده است که قادر است در پنجره های حساس به زمان، با میزان حافظه ای قابل قبول، مجموعه اقلام تکراری را کاوش کند. این الگوریتم به منظور ذخیره سازی مجموعه اقلام تکراری پنجره ی فعال از ساختمان داده ی جدیدی بر مبنای درخت پیشوندی استفاده می کند. آزمایش های صورت گرفته بر روی جریان داده های واقعی و تولید شده ی مصنوعی، نشان دهنده برتری این الگوریتم نسبت به روش های ارائه شده قبلی از نظر زمان اجرا و حافظه مصرفی است.

کلمات کلیدی:
جریان کاوی, تخمین احتمالی, پنجره ی لغزان حساس به زمان, کاوش مجموعه اقلام تکراری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1804577/