CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استفاده از روش دومرحله ای انتخاب ویژگی و دسته بندهای بیزساده در دسته بندیمتون لاتین

عنوان مقاله: استفاده از روش دومرحله ای انتخاب ویژگی و دسته بندهای بیزساده در دسته بندیمتون لاتین
شناسه ملی مقاله: KAUCEE01_203
منتشر شده در کنفرانس ملی پژوهش های نوین در برق، کامپیوتر و مهندسی پزشکی در سال 1396
مشخصات نویسندگان مقاله:

حدیث پورعباسی - دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران
ماشالله عباسی دزفولی - استادیار، گروه مهندسی کامپیوتر، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران

خلاصه مقاله:
در روند جستجو در موتورهای جستجوگر کاربران با تعداد بسیار زیادی صفحه وب روبرو هستند که پیدا کردن اطلاعات موردنظر در میان این صفحات کار بسیار دشواری است. بنابراین وجود متدهایی که با انتخاب سریع اطلاعات مرتبط بتواند به کاربران کمک کند ضروری می باشد. ما در این پژوهش به توسعه دسته بندی صفحات وب با استفاده از روش های یادگیری ماشین پرداخته ایم و با استفاده از ترکیبی از روش های انتخاب ویژگی فیلتری و پوششی به بهبود کارایی در دسته بندی متون رسیدیم. ما در این پژوهش از مزایای هر دو روش فیلتری و پوششی به منظور بهبود عمل دسته بندی استفاده کرده ایم. در طی ارزیابی روش پیشنهادی با استفاده از ابزار داده کاوی وکا ابتدا پیش پردازش مناسبی بر روی داده ها انجام داده ایم تا داده ها را به صورت مناسبی برای الگوریتم های دسته بندی درآوریم. سپس در مرحله انتخاب ویژگی با استفاده از ترکیبی از الگویتم های فیلتری و پوششی به نتایج بهینه ای دست یافتیم. در ارزیابی نهایی این پژوهش استفاده از روش فیلتری بهره اطلاعاتی و روش پوششی با دسته بند DMNB در مرحله انتخاب ویژگی و استفاده از دسته بند MNB در مرحله دسته بندی کارایی بالایی را به ما داده است، که نسبت به روش های پیشین بهبود خوبی داشته است.

کلمات کلیدی:
انتخاب ویژگی، پیش پردازش، دسته بندی، فیلتری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/658223/