امروزه داده ها قلب تپنده فرایند تجاری بیشتر شرکت ها تلقی می شوند، آن ها فارغ از خرد و کلان بودن نوع صنعت در تمامی صنایع نظیر ارتباطات، تولید، بیمه ،کارت اعتباری و بانکداری از طریق تعاملات در سیستم های عملیاتی شکل می گیرند. با وجود حجم بالای داده ها ی ذخیره شده در این سیستم ها ، به ابزاری نیازاست تا بتوان این داده ها راپردازش کرد و اطلاعات حاصل از آن را در اختیار کاربران قرار داد. در این راستا سازمان های بسیاری در حال استفاده از
داده کاوی برای کمک به مدیریت تمام فازهای ارتباط با مشتری هستند.این سازمان ها می تواند با بررسی ویژگی ها و علت استفاده برخی از مشتریان از کالا ها و یا خدمات خود یا بررسی علل عدم استقبال برخی از مشتریان از برخی کالاها نقاط قوت و ضعف خود را بیابند و در راستای بهبود کیفیت گام بردارند. معمولا کاربران پس از طرح فرضیه ای بر اساس گزارشات مشاهده شده به اثبات یا رد آن می پردازند، در حالی که امروزه به روشهایی نیازداریم که به اصطلاح به کشف دانش بپردازند یعنی روشهائی که با کمترین دخالت کاربر و به صورت خودکار الگوها و رابطه های منطقی را بیان نمایند. یکی از روشهای بسیار مهمی که با آن می توان الگوهای مفیدی را در میان داده ها تشخیص داد،داده کاوی است، این روش که با حداقل دخالت کاربران همراه است اطلاعاتی را در اختیار آنها وتحلیل گران قرار می دهد تا براساس آنها تصمیمات مهم و حیاتی در سازمانشان اتخاذ نمایند. باید توجه داشت که اصطلاح
داده کاوی زمانی به کار برده می شود که با حجم بزرگی از داده ها، در حد مگا یا ترابایت، مواجه باشیم.