مقایسه روشهای نزدیکترین همسایه مجاور و نیو - بیز برای رده بندی داده ها

آرش, رضایی; رضا, انتظاری ملکی; بهروز, مینایی بیدگلی

مقایسه روشهای نزدیکترین همسایه مجاور و نیو - بیز برای رده بندی داده ها

عنوان مقاله: مقایسه روشهای نزدیکترین همسایه مجاور و نیو - بیز برای رده بندی داده ها
شناسه ملی مقاله: IDMC02_086
منتشر شده در دومین کنفرانس داده کاوی ایران در سال 1387

مشخصات نویسندگان مقاله:

آرش رضایی
رضا انتظاری ملکی
بهروز مینایی بیدگلی

خلاصه مقاله:

در این مقاله دقت تکنیک های NB,k-NN برای رده بندی داده ها با توجه به معیار سطح زیرمنحنی مقایسه شده است تاثیر عواملی مانند اندازه مجموعه داده، تعداد صفات پیوسته و گسسته ی مستقل و عدم وجود داده نامعلوم در شرایط استقلال مجموعه داده از مسئله خاص مورد بررسی قرار گرفته است. نتایج بدست آمده بیانگر آن است که K-NN در اکثر موارد بهتر از NB عمل می نماید در شرایطی که ترکیبی از صفات پیوسته و گسسته داشته باشیم و نسبت تعداد صفات پیوسته به گسسته بیشتر باشد NB خیلی ضعیف تر از K-NN عمل می کند. اما زمانی که این نسبت کمتر می شود، دقت NB بهبود می یابد ولی همواره کمتر از K-NN است.

کلمات کلیدی:

روش نیو - بیز، نزدیکترین همسایه مجاور، مجموعه داده ها، ناحیه زیرمنحنی، تولید داده های تصادفی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/70476/