امروزه در بسیاری از کاربردهای داده- محور، با حجم انبوهی از داده ها مواجه هستیم که پردازش و بهره برداری از آنها الگوهای گذشته مدیریت داده ها را نیازمند تغییر نموده است. البته این مسیله که به نام داده های عظیم شناخته می شود فراتر از صرفا حجم بالا بوده و دارای سه بعد اساسی حجم بالا، تنوع بالا، و سرعت بالا می باشد. اگرچه در طول سالیان گذشته کارهای فراوانی در خصوص هریک از این سه خصیصه به تنهایی صورت گرفته است، اما مقیاس هریک از این خصیصه ها در کاربردهای امروزی و پیچیدگی ناشی از ترکیب شدن آنها سبب می شود تا راهکارهای قدیمی دیگر به کار نیایند یا ناکارآمد باشند. از طرفی، در بسیاری از کاربردهای جدی نمی توان منتظر ماند تا مبانی نظری مسیله داده های عظیم به تکامل و بلوغ برسد و سپس سامانه ها و ابزارها توسعه داده و ارایه شوند؛ بلکه متولیان این کاربردها خود دست به کار شده و ابزارهایی برای اداره داده های عظیم سازمان و کاربرد خود فراهم و استفاده کرده اند. یکی از اساسی ترین و بنیادی ترین کارهایی که برای مدیریت داده های عظیم باید انجام گیرد، ارایه و استفاده از یک
مدل داده مناسب است. مدل داده، سنگ بنای سایر فعالیت های مربوط به مدیریت داده ها محسوب می شود و روش ها، الگوریتم، سامانه ها، ابزارها و زبان ها مبتنی بر
مدل داده طراحی و ارایه می شوند. در این مقاله،
مدل داده ای مناسب داده های عظیم ارایه شده که بر اساس نیازمندی های ابعاد سه گانه (3Vs) طراحی شده است. اصول مدنظر قرار گرفته در این طراحی و
مدل داده طراحی شده ارایه شده، و مدل به صورت عملی و تجربیه مورد ارزیابی قرار گرفته است. از مهمترین ویژگی های
مدل داده پیشنهادی می توان به این موارد اشاره نمود که ضمن تامین نمودن همه ویژگی های داده های عظیم، کاملا یکپارچه بوده و کارآمد (دارای کارایی و بهره وری قابل قبول) می باشد.