CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه ی یک روش جدید برای ارزیابی سطح کیفیت داده ها مبتنی بر روشهای دادهکاوی در پایگاه داده های رابطه ای

عنوان مقاله: ارائه ی یک روش جدید برای ارزیابی سطح کیفیت داده ها مبتنی بر روشهای دادهکاوی در پایگاه داده های رابطه ای
شناسه ملی مقاله: IDMC04_055
منتشر شده در چهارمین کنفرانس داده کاوی ایران در سال 1389
مشخصات نویسندگان مقاله:

حمیدرضا خسروانی - دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران
مهران محسن زاده - استادیار دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران

خلاصه مقاله:
کیفیت داده در فرایند کشف دانش در پایگاه داده از اهمیت ویژه ای برخوردار است تاکنون دو رویکرد کلی با استفاده از روشهای اماری و یا تکنیکهای داده کاوی برای ارزیابی سطح کیفیت داده مطرح شده است که روشهای مبتنی بر داده کاوی با تکیه بر دانش استخراج شده بهبود مناسبتری را در ارزیابی سطح کیفیت داده حاصل کرده اند. یکی از موضوعات مورد توجه ارزیابی سطح کیفیت رکوردهای پایگاه داده های رابطه ای، تنها بر مبنای قوانین وابستگی کشف شده بین صفات طبقه ای آنهاست مشکل عمده ی این روش ها نادیده گرفتن صفات عددی داده است ولی در دنیای واقعی داده های بیشماری هستند که هم صفات عددی و هم صفات طبقه ای را تواما دارند. روش پیشنهادی دراین مقاله با تکیه بر مفهوم خوشه بندی رکوردهای پایگاه داده ی رابطه ای استخراج قواعد توصیفی هر خوشه، در نظر گرفتن میزان اهمیت هر صفت از رکورد در ارزیابی کیفیت آن و در نهایت ارزیابی میزان صحت مقدار صفات بصورت سلسله مراتبی توانسته است تا حدودی مشکلات موجود در روشهای پیشین را برطرف سازد.

کلمات کلیدی:
کیفیت داده، داده کاوی، کیفیت کاوی داده، قوانین انجمنی، قوانین وابستگی، پایگاه داده ی رابطه ای

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/109053/