بررسی اثر توازن مجموعه داده بر عملکرد الگوریتم های طبقه بندی دودویی

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,321

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CECCONF15_009

تاریخ نمایه سازی: 9 خرداد 1401

Abstract:

امروزه بسیاری از مجموعه داده های مورد استفاده در حل مسائل طبقه بندی با روش های یادگیری ماشین از توزیع یکسانی میان کلاس ها برخوردار نیستند . این موضوع ممکن است موجب کاهش دقت عملکرد مدل های یادگیری ماشین شود. این مطالعه به بررسی اثر مجموعه داده نامتوازن بر عملکرد این روش ها می پردازد. مسئله مورد مطالعه در این پژوهش تشخیص تقلب در تراکنش های بانکی و الگوریتم مورد استفاده رگرسیون لجستیک است. نتایج این پژوهش نشان از تاثیر بسزای توازن داده بر عملکرد مدل است به گونه ای که عملکرد مدل مطابق معیار ارزیابی پوشش در هنگام استفاده از مجموعه داده نامتوازن از ۹۸ به ۵۸ درصد کاهش یافته است.

Authors

پرهام صدری

دانشجوی کارشناسی ارشد، مدیریت کسب و کار، مدیریت سیستم های اطلاعاتی و فناوری اطلاعات، دانشگاه علامه طباطبایی تهران

سیدحسام الدین قشمی

دانشجوی کارشناسی ارشد، مهندسی هوافضا، فناوری ماهواره، دانشگاه تهران