شناسایی داده های پرت در مجموعه های داده با استفاده از خوشه بندی فازی

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 818

This Paper With 14 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

COMCONF07_255

تاریخ نمایه سازی: 22 مرداد 1399

Abstract:

داده کاوی روشی معتبر، جدید و مفید جهت شناسایی الگوهای قابل درک میباشد و در حال تبدیل شدن به یک ابزار مهم جهت تبدیل داده به دانش است. اگر نمونه ها نماینده خوبی از بدنه بزرگ داده نباشند، این فرایند شکست خواهد خورد. یکی از دلایل اصلی استفاده از داده کاوی تجزیه و تحلیل موثر و کارآمد مجموعه ای از مشاهدات مختلف با توجه به رفتار آنها میباشد. تشخیص داده پرت یک مفهوم بسیار مهم از داده کاوی است که به عنوان پرت کاوی اشاره شده و به مشکل پیدا کردن الگوها در مجموعه داده های بزرگ که مطابق با رفتار مورد انتظار نمی باشند، اشاره دارد. اغلب این الگوهای غیر عادی به عنوان نقاط دورافتاده، ناهنجاری، استثنا، تعجب و گسل نامیده میشوند. مشکلات بسیاری برای تعریف رفتار طبیعی یا ناحیه طبیعی به عنوان نقاط دور افتاده برجسته تر وجود دارند. عدم تشخیص داده پرت تاثیر زیادی درخصوصیات آماری کلی خواهد داشت و حتی ممکن است به نتیجه گیری نادرست منجر شود. از این رو در این تحقیق به بررسی این موضوع خواهیم پرداخت. در این تحقیق، ما از خوشه بندی فازی برای تشخیص داده های پرت استفاده می کنیم. در خوشه بندی کلاسیک هر نمونه ورودی متعلق به یک و فقط یک خوشه میباشد و نمیتواند عضو دو خوشه و یا بیشتر باشد. تفاوت اصلی خوشه بندی کلاسیک و خوشه بندی فازی در این است که یک نمونه میتواند متعلق به بیش از یک خوشه باشد. به منظور ارزیابی روش پیشنهادی، ما عملکرد آن را بر روی دیتابیس Iris مورد ارزیابی قرار دادیم.

Authors

فرشاد غیب الهی

گروه برق ، دانشکده فنی و مهندسی، واحد کازرون ، دانشگاه آزاد اسلامی ، تهران ، ایران

امید مهدیار

استادیار گروه برق، دانشگاه آزاد، کازرون، ایران

امین پیربنیه

استادیار گروه برق، دانشگاه آزاد، کازرون، ایران