جایگذاری مقادیر گمشده در مجموعه داده های دیابت و سرطان سینه با استفاده از شبکه عصبی پرسپترون دو لایه

الهام پورجانی; سارا نجف زاده; نادر جعفرنیا دابانلو

جایگذاری مقادیر گمشده در مجموعه داده های دیابت و سرطان سینه با استفاده از شبکه عصبی پرسپترون دو لایه

Publish place: Journal of Health Information Management، Vol: 18، Issue: 1

Publish Year: 1400

نوع سند: مقاله ژورنالی

زبان: Persian

This Paper With 6 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1553626

شناسه ملی سند علمی:

JR_HIM-18-1_002

تاریخ نمایه سازی: 24 آبان 1401

Abstract:

مقدمه: جایگذاری مقادیر گمشده در مجموعه داده های اطلاعاتی پزشکی، یکی از چالش های مهم در مسایل داده کاوی به شمار می رود. بنابراین، پژوهش حاضر با هدف جایگذاری مقادیر گمشده برخی از ویژگی های مجموعه داده های دیابت و سرطان سینه انجام شد.روش بررسی: در این مطالعه توصیفی، از مجموعه داده سرطان سینه شامل ۶۹۹ نمونه که ۴۵۸ نمونه خوش خیم و ۲۴۱ نمونه بدخیم و مجموعه داده دیابت شامل ۷۶۸ نمونه که ۵۰۰ نمونه فاقد بیماری دیابت و ۲۶۸ نمونه دیگر دارای بیماری دیابت بودند، استفاده گردید. برای جایگذاری مقادیر گمشده در این دو مجموعه داده، مدلی بر پایه شبکه عصبی پرسپترون دو لایه طراحی شد. به منظور ارزیابی، ماشین بردار پشتیبان SVM (Support Vector Machine) و آزمون t مورد استفاده قرار گرفت. یافته ها: میزان میانگین مربعات خطا MSE (Mean Squared Error) به دست آمده در مدل شبکه عصبی پرسپترون دو لایه در مجموعه داده دیابت، حدود ۰۳/۰ و در مجموعه داده سرطان سینه، حدود ۰۴/۰ کمتر از MSE های به دست آمده در روش جایگذاری با مقدار میانگین گزارش گردید. مقادیر جایگذاری شده با استفاده از مدل نسبت به مقادیر جایگذاری شده با مقدار میانگین، به مقدار واقعی نزدیک تر بود. صحت و حساسیت طبقه بندی بیماری در حالتی که مقادیر گمشده توسط شبکه عصبی پرسپترون جایگذاری شده بود، در مقایسه با دو روش مرسوم مقدار میانگین و روش حذف مقادیر گمشده در مجموعه داده دیابت به ترتیب در حدود ۲، ۴، ۲ و ۴ درصد و در مجموعه داده سرطان سینه به ترتیب در حدود ۱، ۳، ۲، ۵ درصد بیشتر شد. تفاوت معنی داری بین دو روش جایگذاری مقادیر گمشده با مقدار میانگین و جایگذاری مدل وجود داشت.نتیجه گیری: جایگذاری مقایر گمشده در مجموعه داده های پزشکی توسط شبکه عصبی پرسپترون دو لایه نسبت به دو روش جایگذاری با مقدار میانگین و روش حذف مقادیر گمشده، نتایج بهتری در طبقه بندی بیماری نشان می دهد.

Keywords:

داده کاوی , مدل های شبکه عصبی , ماشین بردار پشتیبان

Authors

الهام پورجانی

دانشجوی کارشناسی ارشد، هوش مصنوعی و رباتیک، گروه مهندسی کامپیوتر، دانشکده مکانیک، برق و کامپیوتر، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران

سارا نجف زاده

استادیار، شبکه، گروه کامپیوتر، دانشکده مهندسی برق، واحد یادگار امام (ره)، دانشگاه آزاد اسلامی، شهرری، ایران

نادر جعفرنیا دابانلو

دانشیار، الکترونیک، گروه مهندسی برق، دانشکده علوم و فن آوری های پزشکی، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Ispirova G, Eftimov T, Seljak BK. Evaluating missing value imputation ...
Ayilara OF, Zhang L, Sajobi TT, Sawatzky R, Bohm E, ...
Folguera L, Zupan J, Cicerone D, Magallanes JF. Self-organizing maps ...
Purwar A, Singh SK. Hybrid prediction model with missing value ...
de Silva H, Perera AS. Missing data imputation using Evolutionary ...
Jea K, Hsu C, Tang L. A missing data imputation ...
Duan Y, Lv Y, Liu YL, Wang FY. An efficient ...
Deb R, Liew AW-C. Missing value imputation for the analysis ...
Silva-Ramirez EL, Pino-Mejias R, Lopez-Coello M, Cubiles-de-la-Vega MM-D. Missing value ...
de Goeij MC, van DM, Jager KJ, Tripepi G, Zoccali ...

نمایش کامل مراجع