افزایش دقت طبقه بندی در تصاویر ماموگرافی از سرطان سینه با مجموعه داده های نامتعادل با استفاده از روش SMOTE
عنوان مقاله: افزایش دقت طبقه بندی در تصاویر ماموگرافی از سرطان سینه با مجموعه داده های نامتعادل با استفاده از روش SMOTE
شناسه ملی مقاله: CEITCONF07_022
منتشر شده در دومین کنفرانس بین المللی و هفتمین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی در سال 1402
شناسه ملی مقاله: CEITCONF07_022
منتشر شده در دومین کنفرانس بین المللی و هفتمین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی در سال 1402
مشخصات نویسندگان مقاله:
زینب دلشادگنجگاه - دانشجوی دکتری تخصصی مهندسی برق الترونیک دانشگاه لرستان
سلمان کریمی - استادیار، مخابرات سیستم، دانشگاه لرستان
خلاصه مقاله:
زینب دلشادگنجگاه - دانشجوی دکتری تخصصی مهندسی برق الترونیک دانشگاه لرستان
سلمان کریمی - استادیار، مخابرات سیستم، دانشگاه لرستان
در بررسی پایگاه های داده های مختلف چنین به نظر می رسد که اکثر این دادگان نامتعادل هستند و تعداد نمونه های برخیاز کلاس های آن ها کمتر از نمونه های کلاس های دیگر است. به طور مثال در داده های پزشکی, نمونه های عادی معمولابسیار بیشتر از نمونه های بیمار هستند. در آموزش طبقه بندی کننده هایی نظیر ماشین بردار پشتیبان که با استفاده از داده هاینامتعادل آموزش داده می شوند. نمونه های با داده های بیشتر (عادی) بهتر دسته بندی می شوند. مشکل زمانی رخ می دهدکه قصد بر دسته بندی نمونه با داده های کمتر (بیماری) است. این نمونه ها معمولا بیشتر مورد توجه هستند و از آنها دادهکمتری در اختیار است لذا ممکن است در زمره کلاس های دیگر دسته بندی شوند. بنابراین هنگام دسته بندی، این کلاس هااز شانس انتخاب شدن پایین تری به نسبت کلاس های اکثریت برخوردار هستند. در این پژوهش, قصد بر ارائه روش برایبیش نمونه گیری از کلاس اقلیت در سطح تصویر و ایحاد تصاویر مصنوعی است. محموعه داده مورد استفاده - CBISDDSM می باشد که در سه کلاس ابتدایی ابتدایی بدون بازخوانی و پیشرفته دسته بندی شده است. در بین این سهکلاس، کلاس ابتدایی بدون بازخوانی کلاس اقلیت می باشد. بدلیل آنکه کلاس های موجود در این مجموعه داده متقارننمی باشد با استفاده از روش SMOTE داده در کلاس اقلیت افزایش داده شد. نتایج دسته بندی کلاس اقلیت با استفادهاز ماشین بردار پشتیبان قبل از استفاده از SMOTE، احتمال خوش خیم بدون بازخوانی را ۲۰ درصد و بعد از استفاده ازآن ۷۰ درصد پیش بینی کرد که رشد درصد تشخیص نشان دهنده کیفیت روش پیشنهادی است.
کلمات کلیدی: داده نامتعادل، طبقه بندی کننده ماشین بردار پشتیبان، دادگان CBIS-DDSM
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1947659/