تاثیر الگوریتم APRIORI براساس مدل هادوپ در مجموعه داده های عملیاتی

زهرا, رحیمی فر

تاثیر الگوریتم APRIORI براساس مدل هادوپ در مجموعه داده های عملیاتی

عنوان مقاله: تاثیر الگوریتم APRIORI براساس مدل هادوپ در مجموعه داده های عملیاتی
شناسه ملی مقاله: UTCONF04_071
منتشر شده در چهارمین کنفرانس ملی دانش و فناوری مهندسی برق کامپیوتر و مکانیک ایران در سال 1399

مشخصات نویسندگان مقاله:

زهرا رحیمی فر - استاد دانشگاه پیام نور شیراز

خلاصه مقاله:

پیدا کردن آیتم های تکراری یکی از مهم ترین زمینه های داده کاوی است. الگوریتم Apriori الگوریتم شناخته شده ترین در پیدا کردن مجموعه های مکرر از یک مجموعه داده های عملیاتی است؛ با این حال، باید تعداد زیادی از داده ها را اسکن کرده و تعداد زیادی از آیتم های موجود را تولید کند. متأسفانه، زمانی که حجم داده ها بسیار زیاد است، استفاده از حافظه و هزینه های محاسباتی هنوز هم می تواند بسیار گران باشد. علاوه بر این، حافظه تک پردازنده و منابع CPU بسیار محدود است که عملکرد الگوریتم را ناکارآمد می سازد. محاسبات موازی و توزیع شده، راهبردهای موثر برای سرعت بخشیدن به عملکرد الگوریتم هستند. در این مقاله ما به بررسی الگوریتم MapReduce Apriori (MRApriori)را با استفاده از مدل Hadoop-MapReduce می پردازیم که نیاز به دو مرحله برای یافتن آیتم های مکرردارد .

کلمات کلیدی:

Hadoop، MapReduce، محاسبات موازی ، محاسبات توزیع شده ، الگوریتمApriori ، مؤلفه تکراری ، قوانین انجمن .

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1116903/