تاثیر الگوریتم APRIORI براساس مدل هادوپ در مجموعه داده های عملیاتی

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 247

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

UTCONF04_071

تاریخ نمایه سازی: 13 آبان 1399

Abstract:

پیدا کردن آیتم های تکراری یکی از مهم ترین زمینه های داده کاوی است. الگوریتم Apriori الگوریتم شناخته شده ترین در پیدا کردن مجموعه های مکرر از یک مجموعه داده های عملیاتی است؛ با این حال، باید تعداد زیادی از داده ها را اسکن کرده و تعداد زیادی از آیتم های موجود را تولید کند. متأسفانه، زمانی که حجم داده ها بسیار زیاد است، استفاده از حافظه و هزینه های محاسباتی هنوز هم می تواند بسیار گران باشد. علاوه بر این، حافظه تک پردازنده و منابع CPU بسیار محدود است که عملکرد الگوریتم را ناکارآمد می سازد. محاسبات موازی و توزیع شده، راهبردهای موثر برای سرعت بخشیدن به عملکرد الگوریتم هستند. در این مقاله ما به بررسی الگوریتم MapReduce Apriori (MRApriori)را با استفاده از مدل Hadoop-MapReduce می پردازیم که نیاز به دو مرحله برای یافتن آیتم های مکرردارد .

Authors

زهرا رحیمی فر

استاد دانشگاه پیام نور شیراز