عملکرد الگوریتم های ماتریس کواریانس با کمترین دترمینان در تحلیل داده های اکتشافی به روش تحلیل تمایز

Publish Year: 1402
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 74

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

EARTHSCI04_023

تاریخ نمایه سازی: 23 تیر 1403

Abstract:

داده های خارج از ردیف باعث اریب دار شدن بردار میانگین و تورم ماتریس کواریانس برای یک مجموعه داده ی چندمتغیره می شوند. استفاده از چنین بردار و ماتریسی نیز نتایج اشتباهی را در تحلیل های آماری چندمتغیره و داده کاوی به همراه خواهد داشت. برای رفع این مشکل برآوردگرهای مقاوم پیشنهاد شده اند که نسبت به داده های خارج از ردیف پایا هستند. در این مقاله چهار برآوردگر مقاوم Fast-MCD ، Det-MCD ، MRCD و Kernel-MRCD بر اساس کمینه کردن دترمینان ماتریس کواریانس معرفی شده اند که به ترتیب برای حالت های رسیدن سریع به جواب، جواب قطعی، داده ها با بعد زیاد و داده ها با ساختارهای پیچیده کاربرد دارند. کلاسه بندی یک مجموعه داده ی ژئوشیمیایی متعلق به نمونه های رسوبات آبراه های در برگه ۰۰۰ / ۱۰۰:۱ خور در استان اصفهان با بعد ۱۳ × ۱۴۸ و با بردار میانگین و ماتریس کواریانس مرسوم توسط روش تحلیل تمایزنشان داد که صحت کلاسه بندی برای داده های آموزشی و آزمایشی حدود ۷۱ درصد است. در حالی که این صحت کلاسه بندی با برآوردگرهای مقاوم به حدود ۸۵ درصد توسط الگوریتم Fast-MCD ، حدود ۹۳ درصد توسط الگوریتم Det-MCD ، حدود ۹۶ درصد توسط الگوریتم MRCD و حدود ۹۸ درصد توسط الگوریتم Kernel-MRCD می رسد. بنابراین استفاده از برآوردگرهای مقاوم در هنگام تحلیل داده های اکتشافی خصوصا داده های ژئوشیمیایی که احتمال وجود داده ی خارج از ردیف در آنها بالا می باشد، لازم به نظر می رسد.

Authors

حمید گرانیان

دانشیاری گروه مهندسی معدن، دانشگاه صنعتی بیرجند، بیرجند، ایران