بررسی روش های جدید انتخاب ویژگی برای داده ها با ابعاد بالا

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 750

This Paper With 10 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CITCOMP02_404

تاریخ نمایه سازی: 7 اسفند 1396

Abstract:

مسیله انتخاب ویژگی یکی از مسایل مطرح در حوزه یادگیری ماشین و تشخیص الگوها از جمله طبقه بندی می باشد، در مجموعه داده های حوزه بیوانفوماتیک با صدها هزار ویژگی غیرمعمول، استخراج دانش از چنین توده های زیادی از اطلاعات، به روش های جدید نیاز دارد. روش های سنتی بسته بند انتخاب ویژگی که برای داده های کم قابل استفاده هستند و دیگر نمی توانند تعداد بیشتری از ویژگی ها را مدیریت کنند. در این ما با استفاده از افزونه Feature Selection در RapidMiner که شامل اپراتورها با روش های جدید انتخاب ویژگی برای داده های با ابعاد بسیار بالا است، به بررسی و حل مساله ی انتخاب ویژگی می پردازیم. اپراتورها موجود در این افزونه برای انتخاب ویژگی ها و مدل های پراکنده مفید هستند، زمانی که پزشکان به مدل های کوچک و قابل تفسیر نیاز دارند. با استفاده از روش های گروهی، ثبات روش های انتخاب ویژگی را افزایش یافته است. تمام این دستاوردها برای غلبه بر مجموعه داده ها با ابعاد بزرگ است. مجموعه ای از شاخص های تخمین برای ارزیابی و مقایسه روش های مختلف بر روی مجموعه داده ی دیابت از مخزن UCI مورد استفاده قرار گرفته است. نتایج حاصل، قابلیت های الگوریتم ها و اپراتورهای این افزونه را در جستجوی فضای ویژگی برای ترکیب ویژگی های بهینه نشان می دهد.

Authors

علی غفارنژاد

استادیار گروه کامپیوتر و فناوری اطلاعات دانشگاه صنعتی همدان

احسان حیدری

دانشجوی ارشد فناوری اطلاعات دانشگاه امیر کبیر

ناصر باقری محمودابادی

دانشجوی ارشد علوم کامپیوتر دانشگاه سیستان و بلوچستان