دسته بندی داده های دیابت نوع ۲ و سنجش کیفیت داده ها به کمک سیستم های دسته بند یادگیر XCSR

Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 175

This Paper With 20 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CSCCI01_022

تاریخ نمایه سازی: 26 اردیبهشت 1401

Abstract:

مقدمه: دیابت یکی از شایع ترین بیماریهای شناخته شده در جهان و به ویژه ایران است. میلیونها نفر در دنیا با دیابت زندگی میکنند در حالی که بسیاری از افراد مبتلا به بیماری، تشخیص و درمان نشده اند. تاخیر در تشخیص و درمان بیماری میتواند منجر به عوارض جبران ناپذیری گردد. کشف الگوهای پنهان مفید از دادههای بیماران میتواند کمک شایانی در تشخیص و پیشگیری از عوارض این بیماری خطرناک باشد . هدف اولیه این تحقیق ساخت مدلی جهت تشخیص دیابت نوع ۲ به کمک یکی از مهمترین روشهای داده کاوی یعنی دسته بندی است. هدف ثانویه سنجش کیفیت مجموعه داده مورد استفاده به کمک مدل استخراج شده است.روشها: ما از مجموعه داده دیابتی پیما استفاده کردیم که یکی از مجموعه داده های واقعی پزشکی موجود در مخازن داده یادگیری ماشین UCI است. پیما حاوی اطلاعات مربوط به ۷۶۸ زن با حداقل سن ۲۱ سال است که برای ابتلا به دیابت بر طبق معیار های سازمان جهانی بهداشت مورد آزمایش قرارگرفته اند. در این تحقیق در ابتدا چارچوبی مناسب برای انجام مراحل مختلف یک وظیفه داده کاوی پیشنهاد شده است. سپس از سه روش مشهور به همراه روش کمتر شناخته شده XCSR ، برای دسته بندی مجموعه داده پیما استفاده شده و نتایج به دست آمده با یکدیگر مقایسه شده اند. نهایتا طی یک سری آزمایش تجربی و به کمک XCSR کیفیت مجموعه داده پیما ارزیابی شده است یافته ها: نتایج حاصل از تحقیق نشان داد الگوریتم XCSRبا میانگین دقت۷۵/۳۷ درصد نسبت به الگوریتم های مشهوری نظیر بیز و C۴.۵ بر روی مجموعه داده پیما کارایی بهتری داشته است. نتیجه گیری: به کمک الگوریتم کمتر شناخته شدهای با عنوان XCSR موفق به دستهبندی مجموعه داده پیما با دقت پیشبینی بالاتری نسبت به الگوریتم های مشهوری نظیر بیز و C۴.۵ شدیم. از مزیتهای این الگوریتم ارائه مدلی واضح و روشن، تفسیرپذیر)مبتنی بر قانون(، فشرده و تعمیم پذیر برای تشخیص دیابت نوع دوم بود . همچنین بررسی نتایج حاصل ازآزمایشهای متعدد بر روی مجموعه داده پیما نشان داد که ماهیت دادهها چگونه میتواند بر روی کارایی الگوریتم های داده کاوی تاثیرداشته باشد.

Keywords:

Authors

احمدرضا پاکرائی

مربی گروه کامپیوتر، دانشگاه آزاد اسلامی واحد داراب، داراب، ایران؛