چارچوب هدوپ ، کاربردها و چالش های پیش روی آن

Publish Year: 1397
نوع سند: مقاله ژورنالی
زبان: Persian
View: 487

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_SAPD-9-2_006

تاریخ نمایه سازی: 1 مهر 1398

Abstract:

در سال های اخیر، شاهد افزایش چشم گیر تولید داده بوده ایم. به گفته IBM تقریبا، 90 % کل داده های ذخیره شده موجود در دنیا، در دو سال اخیر تولید شده اند و برای اولین بار در تاریخ، در سال 2007 میلادی بود که حجم داده های تولیدی فراتر از فضای موجود برای ذخیره سازی آن ها رفت. همچنین، طیف گسترده ای از برنامه های کاربردی مانند موتورهای جستجو، تحقیقات پزشکی، پیش بینی آب وهوا و برنامه های علمی برای پردازش و تجزیه وتحلیل مقادیر داده ای بزرگ نیازمند محیط های توزیع شده هستند. داده های عظیم همانند سایر فن­آوری ها، فرصت ها و چالش های متعددی را پیشروی استفاده کنندگان قرار داده است، استفاده از فرصت ها و مزایای آن در کسب وکار و مدیریت صحیح چالش ها به یکی از موضوعات داغ در عرصه فن­آوری اطلاعات تبدیل شده است. بنابراین، وجود راه­حلی برای پردازش اطلاعات عظیم با هزینه ای مقرون به صرفه بسیار اهمیت دارد، لذا یکی از بهترین راه حل ها برای رفع مشکل پردازش اطلاعات عظیم استفاده از چارچوب آپاچی هدوپ است. تعریف گارتنر از هدوپ این است که هدوپ یک چارچوب مدیریت داده است که حجم زیادی از داده های دارای ساختار و بدون ساختار را که تقریبا در تمامی لایه های سازمانی اثر می گذارد، در کنار هم می آورد که موجب قرارگیری آن در بطن مراکز داده می شود . هدوپ بخشی از پروژه آپاچی است که بنیاد نرم افزار آپاچی آن را حمایت می کند. در واقع، هدوپ یک چارچوب برنامه نویسی رایگان و مبتنی بر جاوا است که ما را در پردازش مجموعه های عظیمی از داده ها در یک محیط پردازش توزیعی پشتیبانی می کند. لذا در این مقاله قصد داریم مقایسه ای بین پایگاه داده های ساخت یافته و نیافته داشته باشیم و سپس به بررسی معماری آپاچی هدوپ و کاربردهای وسیع آن در داده های عظیم امروزی و همچنین چالش های پیشروی این فناوری نوپا مثل پردازش دسته ای، گلوگاه و پردازش های بلادرنگ بپردازیم.

Authors

محمد درویشی

دانشگاه امام حسین

مهدی نقوی

دانشگاه امام حسین

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Gurusamy, Vairaprakash, S. Kannan, and K. Nandhini. A Study on ...
  • S. Blazhievsky and W. Nice, Introduction to Hadoop and MapReduce, ...
  • K. Grolinger, M. Hayes, A. Higashino, A. L Heureux, and ...
  • Ch. Wong Lee, S. Hong Cho, J. Wook Kim, and ...
  • H. wardhan, Bh. Devendra, and P. Gadekar, A Review Paper ...
  • A. Madaan, et al., Hadoop: Solution to Unstructured Data Handling, ...
  • J. Schnase, D. Duffy, S. Strong, D. Nadeau, and H. ...
  • R. R. Parmar, et al., Large-Scale Encryption in the Hadoop ...
  • S. Sakr, A. Liu, D. M. Batista, and M. Alomari, ...
  • J. Anuradha, A brief introduction on Big Data 5Vs characteristics ...
  • http://www.bigdatacompanies.com/top-5-hadoop-distributions-for-big-data/ ...
  • http://cakesolutions.net/teamblogs/comparison-of-apache-stream-processing-frameworks-part-1 ...
  • J. E. Shalika and E. A. Singh Walia, Big Data ...
  • نمایش کامل مراجع