بررسی ۶ روش طبقه بندی جهت یافتن بهترین روش پیش بینی سرطان ریهمبتنی داده های نامتعادل
Publish Year: 1402
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 83
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CRIAL01_014
تاریخ نمایه سازی: 7 مرداد 1403
Abstract:
هدف ما از ارائه این مقاله یافتن بهترین الگوریتم جهت پیش بینی سرطان ریه است. این مقاله به بررسی طبقه بندی هاینظارت شده و ارزیابی عملکرد شش روش طبقه بندی می پردازد. در این مقاله، پس از حذف داده های تکراری، با بررسیمجموعه داده های اولیه، عدم تعادل مجموعه داده ها مشخص می شود که تمایل مجموعه داده ها به سمت نمونه های مثبت(مبتلا به سرطان) می باشد. یکی از چالش های مجموعه داده ها عدم تعادل است که بر کارایی مدل تاثیر می گذارد. با اینحال، مجموعه داده به دو بخش آموزش و آزمایش تقسیم می شود و مجموعه داده با تمام الگوریتم ها مدلسازی شدهاست. در مرحله بعد تکنیک وزندهی برای متعادل کردن توزیع داده ها اعمال می شود و تمام الگوریتم ها مجددا رویمجموعه داده اجرا می شود. مقایسه ای بین خروجی هر دو حالت صورت می گیرد و بهترین الگوریتم برای پیش بینی سرطانریه انتخاب می شود. الگوریتم های طبقه بندی نظارت شده روی مجموعه داده اعمال می شوند و نتایج با هم مقایسه میشوند. ارزیابی مدل ها به کمک چهار معیار دقت کلی، نرخ مثبت کاذب، دقت و یادآوری انجام می شود. جهت اجرای مدل هااز زبان برنامه نویسی پایتون استفاده میشود. مجموعه داده مورد استفاده در این بررسی شامل ۳۰۹ رکورد و ۱۶ ویژگی است که از سایت Kaggle به دست آمده است .
Keywords:
Authors
رقیه صادقی
دانشگاه آزاد اسلامی، دانشجوی دکتری مهندسی کامپیوتر ، ایران، کرج
اعظم باستان فرد
دانشگاه آزاد اسلامی، استادیار ، گروه مهندسی کامپیوتر ، ایران ، کرج