انتخاب ویژگی بر روی داده های با ابعاد بالا با استفاده از روش نزدیکترین همسایه تصادفی متوالی

محمد, اسدی طاهری; مهدی, اسماعیلی

انتخاب ویژگی بر روی داده های با ابعاد بالا با استفاده از روش نزدیکترین همسایه تصادفی متوالی

عنوان مقاله: انتخاب ویژگی بر روی داده های با ابعاد بالا با استفاده از روش نزدیکترین همسایه تصادفی متوالی
شناسه ملی مقاله: ELECONFK03_120
منتشر شده در سومین کنفرانس ملی مهندسی برق و کامپیوتر سیستمهای توزیع شده و شبکه های هوشمند در سال 1395

مشخصات نویسندگان مقاله:

محمد اسدی طاهری - دانشجوی کارشناسی ارشد مهندسی نرمافزار
مهدی اسماعیلی - استادیار دانشگاه آزاد اسلامی واحد کاشان

خلاصه مقاله:

انتخاب ویژگی 3بر اساس یک دستهبند گروهی به عنوان یک تکنیک حیاتی جهت مدل سازی دادههای با ابعاد بالا شناخته شده است. انتخاب ویژگی بر اساس مدل جنگل تصادفی، که از تجمیع چندین دستهبند از نوع درخت تصمیم ساخته می شود، به طور گستردهای مورد استفاده قرار گرفته است. به هر حال، کمبود ثبات و تعادل در درختهای تصمیم، از مقاومت روش جنگلهای تصادفی 4میکاهد. این محدودیت ما را بر آن داشت که روشی برای انتخاب ویژگی با استفاده از دستهبندهای جدید گروهی بر پایه نزدیکترین همسایه ارایه کنیم. روش پیشنهادی ویژگیهای بارز را با یک روال تکرارشونده پیدا میکند. ما آزمایش این روش را با 20 مجموعه داده از آرایههای ژنی انجام دادیم تا خصوصیات روش پیشنهادی را ارزیابی کرده و عملکرد آن را با روش جنگلهای تصادفی مقایسه کنیم. نتایج میزان مقاومت و تاثیر روش پیشنهادی را نشان میدهد، مخصوصا وقتی که تعداد ویژگیها از تعداد نمونهها بیشتر باشد.

کلمات کلیدی:

انتخاب ویژگی، ابعاد بالا، دستهبندی، جنگلهای تصادفی، نزدیکترین همسایه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/622179/