CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

چارچوبی مبتنی بر خط لوله برای پیش بینی زود هنگام بیماری دیابت

عنوان مقاله: چارچوبی مبتنی بر خط لوله برای پیش بینی زود هنگام بیماری دیابت
شناسه ملی مقاله: JR_JHBMI-10-2_002
منتشر شده در در سال 1402
مشخصات نویسندگان مقاله:

کارلو آبنوسیان - Department of Statistics, School of Convergent Sciences and Technoligies, Science and Research Branch, Islamic Azad University, Tehran, Iran
رحمان فرنوش - School of Mathematics, Iran University of Science and Technology, Tehran, Iran
محمدحسن بهزادی - Department of Statistics, School of Convergent Sciences and Technoligies, Science and Research Branch, Islamic Azad University, Tehran, Iran

خلاصه مقاله:
مقدمه: دیابت یک بیماری مزمن است و میزان مرگ و میر آن در حال افزایش است. متخصصان سلامت به دنبال راهکارهای نوآورانه برای تشخیص و درمان زودهنگام آن هستند. پیشرفت های یادگیری ماشینی تشخیص بیماری را بهبود داده است. با این حال، به دلیل کمبود داده های برچسب گذاری شده، مقادیر ناقص و نامتعادل بودن داده ها، ایجاد یک پیش بین بهینه برای تشخیص بیماری به یک چالش بزرگ تبدیل شده است. هدف این مطالعه ارائه یک چارچوب طبقه بندی مبتنی بر خط لوله برای تشخصیص دیابت در دو مجموعه داده هندی (دو کلاس: بیمار و سالم) و عراقی (سه کلاس: بیمار، سالم و در شرف ابتلا به دیابت) است. روش: بخش مهم این چارچوب پیش پردازش است. مدل های مختلف یادگیری ماشین مبتنی بر رویکرد One-Vs-One برای حالت سه کلاسه، در چارچوب پیشنهادی پیاده سازی شده اند. به دلیل نامتعادل بودن مجموعه داده، علاوه بر معیار ارزیابی دقت طبقه بندی، مساحت زیر منحنی مشخصه عملکرد گیرنده نیز استفاده می شود. با هدف افزایش مساحت زیر منحنی مشخصه عملکرد گیرنده و دقت طبقه بند، فراپارامترهای هریک از مدل ها با روش های بهینه سازی جستجوی شبکه ای و بیزین بهینه سازی می شوند برای ساختن مدلی قدرتمند با زمان کم آموزش و آزمایش از روش های مختلف انتخاب ویژگی استفاده می شود. نتایج: از طریق شبیه سازی، چارچوب پیشنهادی برای تشخیص بیماری دیابت در دو مجموعه داده هندی و عراقی مورد آزمایش قرار گرفت. نتایج نشان داد که با استفاده از AdaBoost در مجموعه داده هندی ( ۹۴/۱۱AUC=، ۸۹/۹۸ACC=) و با استفاده از جنگل تصادفی در مجموعه داده عراقی  (۹۸/۶۲AUC=، ۹۸/۶۶ACC=)، دقت و عملکرد مطلوبی به دست آمد. نتیجه گیری: از نظر معیارهای ACC، دقت، صحت، یادآور و F۱-Score، چارچوب پیشنهادی مبتنی بر خط لوله عملکرد بهینه ای دارد و می تواند در سامانه های پزشکی به عنوان یک برنامه کاربردی مورد استفاده قرار گیرد.

کلمات کلیدی:
Diabetes Prediction, Machine Learning, Classification, Pipeline, Feature Selection, The Area Under the Receiver Operating Characteristic Curve (AUC), پیش بینی بیماری دیابت, یادگیری ماشین, طبقه بندی, خط لوله, انتخاب ویژگی, مساحت زیر منحنی مشخصه عملکرد

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/2036068/