ارائه ی یک روش جدید برای ارزیابی سطح کیفیت داده ها مبتنی بر روشهای دادهکاوی در پایگاه داده های رابطه ای

Publish Year: 1389
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 3,564

This Paper With 16 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IDMC04_055

تاریخ نمایه سازی: 15 دی 1389

Abstract:

کیفیت داده در فرایند کشف دانش در پایگاه داده از اهمیت ویژه ای برخوردار است تاکنون دو رویکرد کلی با استفاده از روشهای اماری و یا تکنیکهای داده کاوی برای ارزیابی سطح کیفیت داده مطرح شده است که روشهای مبتنی بر داده کاوی با تکیه بر دانش استخراج شده بهبود مناسبتری را در ارزیابی سطح کیفیت داده حاصل کرده اند. یکی از موضوعات مورد توجه ارزیابی سطح کیفیت رکوردهای پایگاه داده های رابطه ای، تنها بر مبنای قوانین وابستگی کشف شده بین صفات طبقه ای آنهاست مشکل عمده ی این روش ها نادیده گرفتن صفات عددی داده است ولی در دنیای واقعی داده های بیشماری هستند که هم صفات عددی و هم صفات طبقه ای را تواما دارند. روش پیشنهادی دراین مقاله با تکیه بر مفهوم خوشه بندی رکوردهای پایگاه داده ی رابطه ای استخراج قواعد توصیفی هر خوشه، در نظر گرفتن میزان اهمیت هر صفت از رکورد در ارزیابی کیفیت آن و در نهایت ارزیابی میزان صحت مقدار صفات بصورت سلسله مراتبی توانسته است تا حدودی مشکلات موجود در روشهای پیشین را برطرف سازد.

Authors

حمیدرضا خسروانی

دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران

مهران محسن زاده

استادیار دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران