حل مسیله بهینه سازی برای انتخاب متغیرهای مهم در داده های با بعد بالا

محمد کاظمی; داود شاهسونی; محمد آرشی

حل مسیله بهینه سازی برای انتخاب متغیرهای مهم در داده های با بعد بالا

Publish place: The 10th International Conference of Iranian Operations Research Society

Publish Year: 1396

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 8 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/767008

شناسه ملی سند علمی:

ICIORS10_274

تاریخ نمایه سازی: 11 شهریور 1397

Abstract:

پیش بینی متغیر پاسخ به کمک چندین متغیر توضیحی همواره مورد توجه محققین است. هدف ساختن مدلی است که متغیر پاسخ را به متغیرهای توضیحی مرتبط کند. وقتی تعداد متغیرهای توضیحی مدل زیاد باشد، تفسیر مدل مشکل تر و هزینه محاسبات افزایش می یابد. لذا، شناسایی متغیرهای توضیحی موثر بر پاسخ بسیار مهم است. در داده های با بعد بالا مانند داده های پزشکی و ژنتیکی که تعداد متغیرهای مهم زیاد است، انتخاب این متغیرها معمولا با استفاده از یک روش بهینه سازی درجه دوم مانند مینیمم کردن مجموع مربعات خطا تحت یک شرط محدودکننده انجام می شود. با استفاده از روش لاگرانژ، میتوان این مسیله را به صورت یک تابع هدف جریمه شده در نظر گرفت. حل این مسیله مینمم سازی مستلزم استفاده از روش های بهینه سازی است. در این مقاله، فرض می کنیم رابطه بین متغیرهای توضیحی و متغیر پاسخ به صورت جمعی ناپارامتری است و برای انتخاب متغیرهای مهم، توابع جریمه مختلف را در نظر می گیریم. حل این مسیله بهینه سازی به وسیله الگوریتم مختصات نزولی گروهی انجام می شود. در پایان، عملکرد این الگوریتم را تحت انواع توابع جریمه، برای متغیرهای گروهی، با یک مثال شبیه سازی بررسی می کنیم.

Keywords:

الگوریتم مختصات نزولی , انتخاب متغیرهای مهم , بهینه سازی , داده های با بعد بالا

Authors

محمد کاظمی

گروه آمار دانشگاه صنعتی شاهرود

داود شاهسونی

گروه آمار دانشگاه صنعتی شاهرود

محمد آرشی

گروه آمار دانشگاه صنعتی شاهرود