جایگذاری مقادیر گمشده در مجموعه داده های دیابت و سرطان سینه با استفاده از شبکه عصبی پرسپترون دو لایه
Publish place: Journal of Health Information Management، Vol: 18، Issue: 1
Publish Year: 1400
نوع سند: مقاله ژورنالی
زبان: Persian
View: 177
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_HIM-18-1_002
تاریخ نمایه سازی: 24 آبان 1401
Abstract:
مقدمه: جایگذاری مقادیر گمشده در مجموعه داده های اطلاعاتی پزشکی، یکی از چالش های مهم در مسایل داده کاوی به شمار می رود. بنابراین، پژوهش حاضر با هدف جایگذاری مقادیر گمشده برخی از ویژگی های مجموعه داده های دیابت و سرطان سینه انجام شد.روش بررسی: در این مطالعه توصیفی، از مجموعه داده سرطان سینه شامل ۶۹۹ نمونه که ۴۵۸ نمونه خوش خیم و ۲۴۱ نمونه بدخیم و مجموعه داده دیابت شامل ۷۶۸ نمونه که ۵۰۰ نمونه فاقد بیماری دیابت و ۲۶۸ نمونه دیگر دارای بیماری دیابت بودند، استفاده گردید. برای جایگذاری مقادیر گمشده در این دو مجموعه داده، مدلی بر پایه شبکه عصبی پرسپترون دو لایه طراحی شد. به منظور ارزیابی، ماشین بردار پشتیبان SVM (Support Vector Machine) و آزمون t مورد استفاده قرار گرفت. یافته ها: میزان میانگین مربعات خطا MSE (Mean Squared Error) به دست آمده در مدل شبکه عصبی پرسپترون دو لایه در مجموعه داده دیابت، حدود ۰۳/۰ و در مجموعه داده سرطان سینه، حدود ۰۴/۰ کمتر از MSE های به دست آمده در روش جایگذاری با مقدار میانگین گزارش گردید. مقادیر جایگذاری شده با استفاده از مدل نسبت به مقادیر جایگذاری شده با مقدار میانگین، به مقدار واقعی نزدیک تر بود. صحت و حساسیت طبقه بندی بیماری در حالتی که مقادیر گمشده توسط شبکه عصبی پرسپترون جایگذاری شده بود، در مقایسه با دو روش مرسوم مقدار میانگین و روش حذف مقادیر گمشده در مجموعه داده دیابت به ترتیب در حدود ۲، ۴، ۲ و ۴ درصد و در مجموعه داده سرطان سینه به ترتیب در حدود ۱، ۳، ۲، ۵ درصد بیشتر شد. تفاوت معنی داری بین دو روش جایگذاری مقادیر گمشده با مقدار میانگین و جایگذاری مدل وجود داشت.نتیجه گیری: جایگذاری مقایر گمشده در مجموعه داده های پزشکی توسط شبکه عصبی پرسپترون دو لایه نسبت به دو روش جایگذاری با مقدار میانگین و روش حذف مقادیر گمشده، نتایج بهتری در طبقه بندی بیماری نشان می دهد.
Keywords:
Authors
الهام پورجانی
دانشجوی کارشناسی ارشد، هوش مصنوعی و رباتیک، گروه مهندسی کامپیوتر، دانشکده مکانیک، برق و کامپیوتر، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
سارا نجف زاده
استادیار، شبکه، گروه کامپیوتر، دانشکده مهندسی برق، واحد یادگار امام (ره)، دانشگاه آزاد اسلامی، شهرری، ایران
نادر جعفرنیا دابانلو
دانشیار، الکترونیک، گروه مهندسی برق، دانشکده علوم و فن آوری های پزشکی، واحد علوم و تحقیقات، دانشگاه آزاد اسلامی، تهران، ایران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :