حل مسیله بهینه سازی برای انتخاب متغیرهای مهم در داده های با بعد بالا

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 508

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICIORS10_274

تاریخ نمایه سازی: 11 شهریور 1397

Abstract:

پیش بینی متغیر پاسخ به کمک چندین متغیر توضیحی همواره مورد توجه محققین است. هدف ساختن مدلی است که متغیر پاسخ را به متغیرهای توضیحی مرتبط کند. وقتی تعداد متغیرهای توضیحی مدل زیاد باشد، تفسیر مدل مشکل تر و هزینه محاسبات افزایش می یابد. لذا، شناسایی متغیرهای توضیحی موثر بر پاسخ بسیار مهم است. در داده های با بعد بالا مانند داده های پزشکی و ژنتیکی که تعداد متغیرهای مهم زیاد است، انتخاب این متغیرها معمولا با استفاده از یک روش بهینه سازی درجه دوم مانند مینیمم کردن مجموع مربعات خطا تحت یک شرط محدودکننده انجام می شود. با استفاده از روش لاگرانژ، میتوان این مسیله را به صورت یک تابع هدف جریمه شده در نظر گرفت. حل این مسیله مینمم سازی مستلزم استفاده از روش های بهینه سازی است. در این مقاله، فرض می کنیم رابطه بین متغیرهای توضیحی و متغیر پاسخ به صورت جمعی ناپارامتری است و برای انتخاب متغیرهای مهم، توابع جریمه مختلف را در نظر می گیریم. حل این مسیله بهینه سازی به وسیله الگوریتم مختصات نزولی گروهی انجام می شود. در پایان، عملکرد این الگوریتم را تحت انواع توابع جریمه، برای متغیرهای گروهی، با یک مثال شبیه سازی بررسی می کنیم.

Authors

محمد کاظمی

گروه آمار دانشگاه صنعتی شاهرود

داود شاهسونی

گروه آمار دانشگاه صنعتی شاهرود

محمد آرشی

گروه آمار دانشگاه صنعتی شاهرود