CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

کاوش داده های بزرگ: چالش ها و پیامدها

عنوان مقاله: کاوش داده های بزرگ: چالش ها و پیامدها
شناسه ملی مقاله: ETECH03_121
منتشر شده در سومین کنفرانس ملی تکنولوژی مهندسی برق و کامپیوتر در سال 1396
مشخصات نویسندگان مقاله:

احمد یوسفی - گروه کامپیوتر، دانشگاه آزاد اسلامی واحد تهران مرکزتهران، ایران

خلاصه مقاله:
داده های بزرگ مجموعه ای از مجموعه داده ها هستند که بسیارپیچیده و بزرگ است. مجموعه داده ها روز به روز رشد میکنند. به اشتراک گذاری، انتقال، ذخیره و غیره بیشترین چالشهایی هستند که داده های بزرگ با آنها مواجهند. داده کاوی الگوهایی از مجموعه های بزرگ را پیدا می کند. داده کاوی با داده های بزرگ کاری پیچیده است. تیوری HACE فرضیه ای است که روابط پیچیده و درحال تحول بین داده ها را پیدا میکند بعبارتی ویژگیها و خصوصیات داده های بزرگ را مییابد. در این مقاله بررسی می کنیم که چگونه سامانه های مدیریت پایگاه داده های مرسوم نمیتوانند با داده های بزرگ مواجه شوند و داده های بزرگ شروع به ظهور میکنند. پیامدها و چالشهای داده های بزرگ و ابزارهای رایج برای پیادهسازی و تحلیل آنها را شرح میدهیم. به بررسی تکنیکهای شاخص گذاری مانند MapReduce خواهیم پرداخت که به داده های بزرگ اضافه میشوند و در بسیاری برنامه ها مانند اناگرام و مسیله دوستان مشترک و غیره به کار می-روند. برخی دیگر از برنامه های جهانی داده های بزرگ نیز مورد بحث قرار می-گیرند . در آخر نیز به مقایسه کلی تکنیکهای مختلف داده کاوی خواهیم پرداخت.

کلمات کلیدی:
داده های بزرگ، آناگرام، HACE، داده کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/749285/