الگوریتم خوشه بندی در حذف داده های زائد از انباره داده

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 132

This Paper With 14 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCT17_055

تاریخ نمایه سازی: 26 دی 1401

Abstract:

غالبا داده های موجود در پایگاه داده ها از کیفیت مناسبی برخوردار نمی باشند و خطا در ورود داده ها، وجود ناسازگاری ها، اطلاعات ناقص، داده های غیر استاندارد، اطلاعات تکراری و... نمونه هایی از علل کاهش کیفیت داده ها می باشند. با توجه به حجم عظیم داده ها در پایگاه های داده موجود، امکان پالایش دستی داده ها وجود ندارد و نیاز به تکنیکهای خودکار برای این کار هست. در این مقاله یک روش داده کاوی تشخیص الگوهای پرت معرفی شده است که سرعت اجرای آن بالاست و با استفاده از آن می توان داده های پرت و ناهمگون با بقیه داده های موجود در پایگاه داده ها را شناسایی کرد و بدین ترتیب برای پالایش خودکار داده های در حجم بسیار زیاد از اهمیت بالایی برخوردار خواهد بود. روش پیشنهادی از دو فاز عمده تشکیل شده است، ابتدا کل داده ها توسط تکنیک داده کاوی k-means خوشه بندی می شوند، سپس روش پیشنهادی با سرعت بالا داده های پرت درون هر خوشه را آشکارسازی خواهد کرد.

Authors

فتاح بیات

گروه ریاضی، واحد ملایر، دانشگاه آزاد اسلامی، ملایر، ایران