CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر روش های انتخاب ویژگی در طبقه بندی داده ها

عنوان مقاله: مروری بر روش های انتخاب ویژگی در طبقه بندی داده ها
شناسه ملی مقاله: CECCONF12_031
منتشر شده در دوازدهمین کنفرانس ملی علوم و مهندسی کامپیوتر و فناوری اطلاعات در سال 1400
مشخصات نویسندگان مقاله:

سیده متین چیره گی - گروه مهندسی کامپیوتر، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
مهدی مزینانی - گروه مهندسی برق، واحد شهر قدس، دانشگاه آزاد اسلامی، تهران، ایران

خلاصه مقاله:
با پیشرفت های به وجود آمده در جمع آوری داده و قابلیت های ذخیره سازی در طی ده ه های اخیر مجموعه های داده ای با ابعاد بالا در علوم مختلف به سرعت در حال افزایش هستند. بسیاری از این مجموعه های داده ای دارای تعداد زیادی ویژگی به نسبت تعداد کم الگوها هستند. بسیاری از این ویژگی ها اغلب نامرتبط و دارای افزونگی هستند که منجر به کاهش عملکرد الگوریتم های طبقه بندی می شوند. از این رو انتخاب ویژگی، برای کاهش ابعاد مسئله و افزایش کارایی الگوریتم های طبقهبندی پیشنهاد شده است. انتخاب ویژگی از دو جهت سبب بهبود الگوریتم طبقه بندی میشوند. ازیک طرف، با کاهش ابعاد مسئله پیچیدگی محاسباتی کاهش پیدا می کند و از طرف دیگر، قابلیت تعمیم الگوریتم طبقه بندی افزایش پیدا می کند و احتمال بیش برازش کاهش می یابد. با توجه به اهمیت مسئله انتخاب ویژگی و کاربرد وسیع آن در اکثر تکنیک های داده کاوی از جمله طبقه بندی، خوشه بندی و ... در این مقاله مروری جامع بر روش های انتخاب ویژگی و دسته بندی راهکارهای مختلف در این حوزه پرداخته می شود. همچنین با توجه به چالش های این حوزه به ارائه راهکارهایی جهت کارهای آتی پرداخته میشود.

کلمات کلیدی:
داده کاوی، یادگیری ماشین، کاهش بعد، انتخاب ویژگی.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1224672/