CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود ترکیب نمونه انتخاب برای انتساب داده های گمشده با کمک الگوریتم های ماشین بردار پشتیبان وجستجوی گرانشی

عنوان مقاله: بهبود ترکیب نمونه انتخاب برای انتساب داده های گمشده با کمک الگوریتم های ماشین بردار پشتیبان وجستجوی گرانشی
شناسه ملی مقاله: ELCM02_146
منتشر شده در دومین کنفرانس ملی مهندسی برق و کامپیوتر در سال 1396
مشخصات نویسندگان مقاله:

بتول نخعی - هنرآموز رایانه استان کرمان ناحیه ۲ دانشگاه غیرانتفاعی بهمنیارکرمان
روح الله ذوالفقاری - هنرآموز رایانه استان سمنان شهرستان دامغان دانشگاه آزاد اسلامی علوم و تحقیقات واحد سمنان

خلاصه مقاله:
گمشد ه گی داده در تمامی پژوهش های علوم اجتماعی، رفتاری، پزشکی وجود دارد. در آمار ،گم شدن داده به وضعیتی گفته می شود که تعدادی از اطلاعات داده ها گزارش نشده باشند. گمشده گی داده باعث کاهش تطابق جامعه نمونه با جامعه کل شده و می تواند منجر به نتیجه گیری اشتباه در مورد جمعیت اصلی شود. گمشده گی داده یک اتفاق معمول بوده و بسته به میزان آن، می تواند اثر قابل توجهی در نتیجه گیری به دست آمده از داده ها داشته باشد. تمامی روش های برآورد پارامترها بر پایه فرض کامل بودن مجموعه داده ها استوار است و تحت برقراری این شرایط منجر به برآوردهایی نااریب می شوند؛ و البته با افزایش نسبت گمشدگی، مقدار اریبی نیز افزایش خواهد یافت.در این پژوهش بدین صورت عمل گردیده است که یک سری مجموعه داده واقعی بر حسب درصد گمشده گی مقادیری را از دست می دهند سپس بر اساس الگوریتم جستجوی گرانشی مقادیر گمشده تخمین زده می شوند وبر اساس معیارمیانگین خطای مطلق میزان درصد خطای بدست آمده از روش جستجوی گرانشی نسبت به مقادیر واقعی محاسبه می شود که این معیار بر اساس نتایج ارزیابی ، خطای کمتری را نشان میدهد و هر چه داده ها بیشتر باشند این معیار نیز به تناسب بیشتر می شود.سپس با استفاده از الگوریتم طبقه بندی svm برای طبقه بندی داده ها بر اساس مقادیر تعیین شده توسط الگوریتم جستجوی گرانشی دقت حاصل با دقت طبقه بندی بر روی داده های حاصل ازپر کردن با میانگین ویژگی وهمچنین پرکردن داده ها با الگوریتم نزدیکترین همسایگی (K-NN) مقایسه می گردد.که در بخش ارزیابی نتایج نشان داده می شود که دقت طبقه بندی بر روی داده های بدست آمده از روش جستجوی گرانشی نسبت به روش های دیگر بالاتر است و هرچه درصد گمشدگی بیشتر شود این دقت کمتر می شود.

کلمات کلیدی:
داده های گمشده، جستجوی گرانشی،داده کاوی، الگوریتم طبقه بندی svm، دقت طبقه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/731145/