امروزه با توجه به گسترش روزافزون اطلاعاتی که بشر با آنها سروکار دارد، بهره گیری از روش هایی نظیر
داده کاوی برای استخراج دانش و اطلاعات نهفته در داده ها، امری غیرقابل اجتناب می باشد.
داده کاوی علمی است که به منظور استخراج دانش جدید و مفید از میان داده های حجیم معرفی شد. از این رو همواره ورودی الگوریتم هیا
داده کاوی داده های خام می باشند، اما همیشه داده ها در یک مکان ذخیره نشده اند و اغلب داده ها بین سرویس دهنده های مختلف پخش شده اند، این امر نیاز به همکاری چند سرویس دهنده برای انجام کاوش دارد که به آن
داده کاوی توزیع شده گویند. تکنولوژی
داده کاوی نه تنها از الگوریتم های کارآمد و موثری تشکیل شده، بلکه مانند هسته مستقلی اجرا می شود.
داده کاوی با برنامه های کاربردی پیچیده در تعاملی بی اهمیت بین اجزای سخت افزاری و نرم افزاری و در محیط های توزیع شده مقیاس بزرگ اجرا می شود. این ویژگی از یک طرف، علت و تاثیر طبیعت ذاتی توزیع داده و از طرف دیگر پیچیدگی فضایی تعداد زیادی از برنامه های
داده کاوی را نتیجه می دهد. با رشد بسیاری از برنامه های کاربردی،
داده کاوی توزیع شده یک تکنولوژی بحرانی است. در این مقاله بعد از مرور مشکلات موجود در
داده کاوی توزیع شده عملیات
داده کاوی را در محیط های گرید توصیف می کنیم و طرحی از سیستم های K-Grid نشان خواهیم داد.