استفاده از تکنیک های داده کاوی جهت بهبود دقت تشخیص بیماری دیابت

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 902

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CECCONF05_014

تاریخ نمایه سازی: 1 دی 1397

Abstract:

امروزه، داده کاوی یکی از تکنیکهای پرکاربرد میباشد که پردازش خود را روی داده های انبوه انجام میدهد. با توجه به فراوانی داده های پزشکی و بیماریها، این موضوع میتواند بستر مناسبی برای به کارگیری تکنیکهای مختلف دادهکاوی باشد. تشخیص زودرس افراد مبتلا به یک بیماری مخفی مانند دیابت از اهمیت زیادی برخوردار است. به طوری که میتوان اقدامات فوری برای جلوگیری از پیشرفت بیماری و یا آسیب رساندن به اعضای بدن را انجام داد . دیابت بیماریای است که توانایی بدن برای تولید یا پاسخ دادن به هورمون انسولین ضعیف است، که منجر به متابولیسم غیر طبیعی کربوهیدراتها و افزایش سطح گلوکز در خون و ادرار میشود .همه میتوانند از آن رنج ببرند و تاکنون درمان برای آن وجود ندارد. در این تحقیق از مجموعه داده UCI Machine Learning Repository استفاده شده است که شامل 101766 رکورد با 50 ویژگی و حاوی دادههای بیماران دیابتی از 130 بیمارستان در ایالات متحده که طی 10 سال (2008-1999) جمعآوری شده است میباشد. سپس برای کار با دادهها از متدولوژی CRISP-DM استفاده شد. در ادامه برای مدلسازی از 3 الگوریتم درخت تصمیم، بیز ساده و KNN (با K=1، K=5 و (K=10 استفاده شد. با استفاده از روش X-Validation جهت ارزیابی مدل سازی های انجام شد، روش درخت تصمیم بالاترین دقت (%100) را کسب کرده و به عنوان مدل برتر انتخاب شده است. با روش بیز ساده نیز دقت قابل قبولی (%98.58) بدست آمده است.

Keywords:

دیابت , داده کاوی , الگوریتم های داده کاوی , متدولوژی CRISP-DM و انتخاب ویژگی

Authors

امین کشانی

دانشجوی کارشناسی ارشد مهندسی نرم افزار، گروه کامپیوتر، دانشگاه شهید اشرفی اصفهانی، اصفهان

ناصر نعمت بخش

استادیار، گروه مهندسی کامپیوتر، دانشگاه شهید اشرفی اصفهانی، اصفهان

بهزاد سلیمانی نیسیانی

مدرس مدعو، گروه مهندسی کامپیوتر، دانشگاه شهید اشرفی اصفهانی، اصفهان