پاکسازی خودکار داده های موجود در پایگاه داده با استفاده از تکنیک های داده کاوی
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 485
This Paper With 15 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IKMC08_331
تاریخ نمایه سازی: 25 آذر 1395
Abstract:
عالماً داده های موجود در پایگاه داده ها از کیفیت مناسبی برخوردار نمی باشند و خطا در ورود داده ها، وجود ناسازگاری ها، اطلاعات ناقص ، داده های غیر استاندارد، اطلاعات تکراری و.... نمونه هایی از علل کاهش کیفیت داده ها می باشد. با توجه به حجم عظیم داده ها در پایگاه های داده موجود، امکان پالایش دستی داده ها وجود ندارد و نیاز به تکنیک های خودکار برای این کار هست. در این مقاله به روش داده کاوی یک تشخیص عفونت های پرت معرفی شده است که سرعت اجرای آن بالاست و با استفاده از آن می توان داده های پرت و ناهمگون با بقیه داده های موجود در پایگاه داده ها را شناسایی کرد و بدین ترتیب برای پالایش خودکار داده های در حجم بسیار زیاد از اهمیت بالایی برخوردار خواهد بود. روش پیشنهادی از توپاز قم تشکیل شده است ابتدا کل داده ها توسط تکنیک داده کاوی k-means کفش و می شوند، سپس روش پیشنهادی با سرعت بالا داده های پرت هر خوشه را آشکار سازی خواهد کرد.
Keywords:
Authors
فتاح بیات
گروه ریاضی، واحد ملایر، دانشگاه آزاد اسلامی
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :