بیگ دیتا یا کلان داده چندسالیست که در ادبیات فناوری اطلاعات به یک اصطلاح فراگیر تبدیل شده است.معمولا ، کلان داده ها به مجموعه داده هایی گفته می شود که توانایی دریافت، اکتساب، مدیریت و پردازش آن ها در یک زمان قابل قبول به وسیله فناوری اطلاعات و ابزارهای نرم افزاری و سخت افزاری سنتی وجود ندارد.عبارت Big Data مدت ها است که برای اشاره به حجم های عظیمی از داده ها که توسط سازمان های بزرگی مانند گوگل یا ناسا ذخیره و تحلیل می شوند مورد استفاده قرار می گیرد. اما به تازگی، این عبارت بیشتر برای اشاره به مجموعه های داده ای بزرگی استفاده می شود که رشد فزاینده ی میزان داده ها به حدی است که با ابزارهای مدیریتی و پایگاه های داده سنتی و معمولی قابل مدیریت نیستند.مشکلات اصلی در کار با این نوع داده ها مربوط به برداشت و جمع آوری، ذخیره سازی، جست وجو، اشتراک گذاری، تحلیل و نمایش آن ها است. این مبحث، به این دلیل هر روز جذابیت و مقبولیت بیشتری پیدا می کند که با استفاده از تحلیل حجم های بیشتری از داده ها، می توان تحلیل های بهتر و پیشرفته تری را برای مقاصد مختلف، از جمله مقاصد تجاری، پزشکی و امنیتی، انجام داد و نتایج مناسب تری را دریافت کرد. تحقیقات در زمینه ی کلان داده ها باید روی چگونگی استخراج ارزش آن ها، چگونگی استفاده از داده ها و چگونگی تبدیل آن ها از گروهی از داده ها به کلان داده ها تمرکز کنند.