CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استخراج مجموعه آیتم های فراوان بسته غیر قابل اشتقاق در محیط توزیع شده

عنوان مقاله: استخراج مجموعه آیتم های فراوان بسته غیر قابل اشتقاق در محیط توزیع شده
شناسه ملی مقاله: IDMC02_087
منتشر شده در دومین کنفرانس داده کاوی ایران در سال 1387
مشخصات نویسندگان مقاله:

الهام پرنیان
محمدهادی صدرالدینی

خلاصه مقاله:
مطالعات اخیر در زمینه طراحی الگوریتمهای داده کاوی توزیع شده، باعث پیشرفتهای عمده ای از لحاظ کارایی در این الگوریتم ها شده است. اما اگر داده ها بسیار چگال باشند و یا اینکه مینیمم آستانه فراوانی، عدد کوچکی باشد، تعداد مجموعه آیتم های فراوانی بسیار زیاد خواهد بود و هزینه زیادی از لحاظ ارتباطات شبکه ای را سبب می شود. از طرفی الگوریتمهای زیادی در زمینه فشرده سازی مجموعه آیتم های فراوان ارایه شده که در آنها، روشهایی برای ایجاد یک مجموعه فشرده از مجموعه آیتم های فراوان به جای محاسبه کردن فراوانی تمام مجموعه آیتم ها پیشنهاد شده است. یکی از کاراترین آنها، محاسبه مرزهای فراوانی یک مجموعه آیتم، با استفاده از قوانین استنتاجی است. ما با استفاده از این قوانین استنتاجی و مجموعه آیتم های بسته، یک مجموعه کمینه از مجموعه آیتمهای فراوان سراسری در یک محیط توزیع شده ایجاد کرده ایم. نتایج آزمایشات بر روی داده های واقعی، افزایش کارایی الگوریتم توزیع شده با فرم فشرده را نسبت به حالت عادی الگوریتم نشان می دهد.

کلمات کلیدی:
کشف قواعد وابستگی، نمایش فشرده مجموعه آیتم ها، مجموعه آیتم های غیر قابل اشتقاق

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/70477/