ارایه مدلی برای یادگیری داده های نامتوازن و تشخیص پزشکی abstract
درون سیستمهای مراقبت از سلامت انبوهی از داده های بیماران ذخیره شده است. به کمک کشف دانش و داده کاوی، میتوان به دانش مفید، ارتباطات و الگوهای مخفی درون دادهها دست یافت. دانش کشف شده میتواند توسط مدیران مراقبت از سلامت و پزشکان مورد استفاده قرار گیرد تا کیفیت خدمات، بهبود یابد و ازطرفی نیز تعداد خطاهای پزشکی را بتوان کاهش داد از آنجاییکه استفاده از تنها یک الگوریتم داده کاوی، جهت تشخیص و یا پیشگویی بیماری ها کاری دشوار است، بنابراین ما در این مقاله از ترکیبی از مزایای برخی الگوریتم ها استفاده میکنیم تا به نتایج بهتری برای کارایی دست یابیم. اغلب الگوریتم های استاندارد یادگیری برای داده هایی با توزیع ردهها متوازن طراحی شده اند و در بیشتر آنها هزینه رده بندی اشتباه یکسان است. هنگامی که مجموعه های داده نامتوازن است این الگوریتم ها در نمایش مشخصات توزیع دادهها به صورت صحیح دچار مشکل میشوند. در برخی موارد هزینه رده بندی اشتباه ممکن است بسیار بالا باشد. از این جمله میتوان به تشخیص افراد سالم و مبتلا به سرطان اشاره کرد. در این مقاله سعی برآن است که روشی سریع و کارا برای یادگیری در داده های نامتوازن ارایه شود. این روش برای یادگیری در داده های نامتوازن که دارای داده های بسیار کم در رده اقلیت هستند، میباشد. آزمایشهای انجام شده نشان میدهد روش پیشنهادی نسبت به چند الگوریتم پرکاربرد عمومی یادگیری ماشین و نیز چند الگوریتم خاص یادگیری در دادههای نامتوازن، کارایی بیشتری دارد. ضمن اینکه از نظر محاسباتی دارای پیچیدگی کمتری بوده و زمان اجرایی به مراتب سریع تری دارد.
ارایه مدلی برای یادگیری داده های نامتوازن و تشخیص پزشکی Keywords:
داده کاوی و درخت تصمیم و شبکه های عصبی مصنوعی و ماشین برداری پشتیبان