پاکسازی خودکار داده های موجود در پایگاه داده با استفاده از تکنیک های داده کاوی

فتاح بیات

پاکسازی خودکار داده های موجود در پایگاه داده با استفاده از تکنیک های داده کاوی

Publish place: 8th National Conference and 2nd International Conference on Knowledge Management

Publish Year: 1394

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 15 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/532890

شناسه ملی سند علمی:

IKMC08_331

تاریخ نمایه سازی: 25 آذر 1395

Abstract:

عالماً داده های موجود در پایگاه داده ها از کیفیت مناسبی برخوردار نمی باشند و خطا در ورود داده ها، وجود ناسازگاری ها، اطلاعات ناقص ، داده های غیر استاندارد، اطلاعات تکراری و.... نمونه هایی از علل کاهش کیفیت داده ها می باشد. با توجه به حجم عظیم داده ها در پایگاه های داده موجود، امکان پالایش دستی داده ها وجود ندارد و نیاز به تکنیک های خودکار برای این کار هست. در این مقاله به روش داده کاوی یک تشخیص عفونت های پرت معرفی شده است که سرعت اجرای آن بالاست و با استفاده از آن می توان داده های پرت و ناهمگون با بقیه داده های موجود در پایگاه داده ها را شناسایی کرد و بدین ترتیب برای پالایش خودکار داده های در حجم بسیار زیاد از اهمیت بالایی برخوردار خواهد بود. روش پیشنهادی از توپاز قم تشکیل شده است ابتدا کل داده ها توسط تکنیک داده کاوی k-means کفش و می شوند، سپس روش پیشنهادی با سرعت بالا داده های پرت هر خوشه را آشکار سازی خواهد کرد.

Keywords:

داده کاوی , پاکسازی داده , پایگاه داده

Authors

فتاح بیات

گروه ریاضی، واحد ملایر، دانشگاه آزاد اسلامی

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

A.Faritha Banu, C .Chandrasekar, _ Survey _ Deduplication Methods, International ...
Bilal Khan, Azhar Rauf, Sajid H. Shah and Shah Khusro, ...
K. Deepa, R. Rangarajan, "Record Deduplication using Particle Swarm Optimization", ...
Lee, M.L.; Lu, H.; Ling, T.W.; Ko, Y.T.: Cleansing Data ...
Li, W.S.; Clifton, S.: SEMINT: A Tool for Identifying Attribute ...
Monge, A. E. Matching Algorithm within _ Duplicate Detection System. ...
Moises G. de Carvalho, Alberto H.F. Laender, Marcos Andre Goncalve ...
Peter Christen, _ Survey of Indexing Techniques for Scalable Record ...
S. Sarawagi and A. Bhamidipaty, "Interactive Deduplication Using Active Learning", ...
Weifeng su, Jiying Wang, Frederick H. Lochovsky, _ Record Matching ...

نمایش کامل مراجع