داده های عظیم یک واژه برای مجموعه داده های بزرگ، ساختار متنوع تر و پیچیده با مشکلات ذخیره سازی، تجزیه و تحلیل فرایندها و یا نتایج است. تجزیه و تحلیل داده های عظیم،روند پژوهش به حجم انبوهی از داده ها با الگوهای پنهان و همبستگی مخفی است. این اطلاعات مفید برای شرکت ها یا سازمان ها با هدف به دست آوردن بینش غنی تر و عمیق تر و بیشتر در رقابت استفاده می شود. به همین دلیل، پیاده سازی داده های بزرگ نیاز به تجزیه و تحلیل و اجرا دقیق تا جایی که ممکن است دارد. امروزه، دادههای صفحات مشاهدهشده در اینترنت، رویدادهای سیستم، و دیگر منابع وابسته به فناوری محوری که ما به آنها اتکا داریم، بیشتر دادههایجدید و نیمهساخت یافته را که سوخت پردازش دادههای بزرگ را فراهم میسازند، تامین میکنند. در آینده، دستگاههای همراه و شناسه اینترنتی اشیا (IOT) که از طریق شناسه فرکانس رادیویی (RFID) و دیگر حسابگرها، به ما امکان میدهند امواج عظیم دادههای جدید را از سیستمهای تولیدی، زیرساختهای حملونقل، تجهیزات طبی و هرگونه داستان از یک صنعت خاص راکه میتوان تصورکرد،جمعآوری وتحلیل کنیم . بنابراین ارزش دارد که از نزدیک اولین نرمافزارهای کاربردی مبتنی بر دادههای بزرگ را بهتدریج که پدیدار میشوند، زیر نظر بگیریم. در این مقاله یک مرور کلی از محتوا، دامنه، نمونه ها، روش ها، مزیت های داده بزرگ و چالش های مورد بحث و نگرانی های مخصوص در آن را مورد بررسی قرار می دهیم