دسته بندی داده های دیابت نوع ۲ و سنجش کیفیت داده ها به کمک سیستم های دسته بند یادگیر XCSR

احمدرضا, پاکرائی

دسته بندی داده های دیابت نوع ۲ و سنجش کیفیت داده ها به کمک سیستم های دسته بند یادگیر XCSR

عنوان مقاله: دسته بندی داده های دیابت نوع ۲ و سنجش کیفیت داده ها به کمک سیستم های دسته بند یادگیر XCSR
شناسه ملی مقاله: CSCCI01_022
منتشر شده در اولین همایش ملی رایانش نرم و هوش محاسباتی در سال 1400

مشخصات نویسندگان مقاله:

احمدرضا پاکرائی - مربی گروه کامپیوتر، دانشگاه آزاد اسلامی واحد داراب، داراب، ایران؛

خلاصه مقاله:

مقدمه: دیابت یکی از شایع ترین بیماریهای شناخته شده در جهان و به ویژه ایران است. میلیونها نفر در دنیا با دیابت زندگی میکنند در حالی که بسیاری از افراد مبتلا به بیماری، تشخیص و درمان نشده اند. تاخیر در تشخیص و درمان بیماری میتواند منجر به عوارض جبران ناپذیری گردد. کشف الگوهای پنهان مفید از دادههای بیماران میتواند کمک شایانی در تشخیص و پیشگیری از عوارض این بیماری خطرناک باشد . هدف اولیه این تحقیق ساخت مدلی جهت تشخیص دیابت نوع ۲ به کمک یکی از مهمترین روشهای داده کاوی یعنی دسته بندی است. هدف ثانویه سنجش کیفیت مجموعه داده مورد استفاده به کمک مدل استخراج شده است.روشها: ما از مجموعه داده دیابتی پیما استفاده کردیم که یکی از مجموعه داده های واقعی پزشکی موجود در مخازن داده یادگیری ماشین UCI است. پیما حاوی اطلاعات مربوط به ۷۶۸ زن با حداقل سن ۲۱ سال است که برای ابتلا به دیابت بر طبق معیار های سازمان جهانی بهداشت مورد آزمایش قرارگرفته اند. در این تحقیق در ابتدا چارچوبی مناسب برای انجام مراحل مختلف یک وظیفه داده کاوی پیشنهاد شده است. سپس از سه روش مشهور به همراه روش کمتر شناخته شده XCSR ، برای دسته بندی مجموعه داده پیما استفاده شده و نتایج به دست آمده با یکدیگر مقایسه شده اند. نهایتا طی یک سری آزمایش تجربی و به کمک XCSR کیفیت مجموعه داده پیما ارزیابی شده است یافته ها: نتایج حاصل از تحقیق نشان داد الگوریتم XCSRبا میانگین دقت۷۵/۳۷ درصد نسبت به الگوریتم های مشهوری نظیر بیز و C۴.۵ بر روی مجموعه داده پیما کارایی بهتری داشته است. نتیجه گیری: به کمک الگوریتم کمتر شناخته شدهای با عنوان XCSR موفق به دستهبندی مجموعه داده پیما با دقت پیشبینی بالاتری نسبت به الگوریتم های مشهوری نظیر بیز و C۴.۵ شدیم. از مزیتهای این الگوریتم ارائه مدلی واضح و روشن، تفسیرپذیر)مبتنی بر قانون(، فشرده و تعمیم پذیر برای تشخیص دیابت نوع دوم بود . همچنین بررسی نتایج حاصل ازآزمایشهای متعدد بر روی مجموعه داده پیما نشان داد که ماهیت دادهها چگونه میتواند بر روی کارایی الگوریتم های داده کاوی تاثیرداشته باشد.

کلمات کلیدی:

سیستم دسته بند یادگیر XCSR ، دیابت نوع ۷، داده کاوی، دسته بندی، مجموعه داده پیما

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1447746/