CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

براورد استوار نسبت به مشاهده های دورافتاده در رگرسیون خطی در حضور هم خطی چندگانه

عنوان مقاله: براورد استوار نسبت به مشاهده های دورافتاده در رگرسیون خطی در حضور هم خطی چندگانه
شناسه ملی مقاله: JR_ISS-22-2_009
منتشر شده در در سال 1396
مشخصات نویسندگان مقاله:

سارا جذن - University of Tehran
سید مرتضی امینی - University of Tehran

خلاصه مقاله:
یکی از عوامل تاثیرگذار در تحلیل آماری داده ها، وجود مشاهده های دورافتاده است. به روش هایی که تحت تاثیر مشاهده های دورافتاده قرار نمی گیرند، روش های آماری استوار گفته می شود. علاوه بر وجود مشاهده های دورافتاده، وجود وابستگی خطی میان متغیرهای پیشگو، که از آن با عنوان هم خطی چندگانه یاد می شود و نیز تعداد زیاد متغیرها در مقابل اندازه کم نمونه، به خصوص در مدل های تنک با بعد بالا، از دیگر مشکلاتی هستند که منجر به کاهش کارایی استنباط های حاصل از روش های کلاسیک رگرسیونی می شوند. در این مقاله، ابتدا معایب روش رگرسیونی کلاسیک کمترین توان های دوم در مقابل مشاهده های دورافتاده، هم خطی چندگانه و مدل های تنک را بررسی می کنیم. سپس به معرفی و بررسی روش های رگرسیون استوار و رگرسیون تاوانیده به عنوان راهکارهای حل این مشکلات می پردازیم. همچنین با در نظر گرفتن مشاهده های دورافتاده و هم خطی چندگانه و یا مدل های تنک به طور هم زمان به بررسی روش های رگرسیون استوار تاوانیده می پردازیم. در نهایت به منظور مقایسه عملکرد براوردگرهای مختلف مطرح شده در این مقاله، ابتدا سه مطالعه شبیه سازی را انجام داده و سپس به تحلیل یک مجموعه داده واقعی با استفاده از روش های رگرسیون استوار تاوانیده می پردازیم.

کلمات کلیدی:
‎Outliers‎, ‎Robust regression‎, ‎Multicollinearity‎, ‎Sparse model‎, ‎Penalized regression‎., مشاهده های دورافتاده, رگرسیون استوار, هم خطی چندگانه, مدل تنک, رگرسیون تاوانیده.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1514511/