CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

دسته بندی متون فارسی با استفاده از الگوریتم SVM و بررسی روشهای کاهش خصیصه

عنوان مقاله: دسته بندی متون فارسی با استفاده از الگوریتم SVM و بررسی روشهای کاهش خصیصه
شناسه ملی مقاله: IDMC03_044
منتشر شده در سومین کنفرانس داده کاوی در سال 1388
مشخصات نویسندگان مقاله:

نصراله مقدم چرکری - استادیار دانشکده برق و کامپیوتر
مهناز زمانیان - دانشجوی کارشناسی ارشد مهندسی فناوری اطلاعات دانشگاه تربیت مدرس

خلاصه مقاله:
در دسته بندی متون بطور معمول از کلمات متن به عنوان خصیصه های آن متن استفاده می شود در نتیجه روشهای دسته بندی متون با تعداد زیادی خصیصه مواجه می باشند به منظور کاهش تعدا د خصیصه ها و انتخاب خصیصه های مرتبط از روشهای متعددی استفاده می شود دراین مقاله به مقایسه روشهای مورد استفاده در دسته بندی متون و معرفی بهترین روش می پردازیم از جمله روشهای موجود در دسته بندی متون می توان به روشهی بیزین ساده KNN Rocchio رگرسیون، درختهای تصمیم گیری ، شبکه های عصبی، SVM، مبتنی بر قاعده و تکاملی اشاره نمود روش SVM یکی از بهترین روشها در دسته بندی متون می باشد دراین روش که یکی از روشهای یادگیری با سرپرستی میباشد اطلاعات را ازفضای حاضر به فضای برداری دیگری عموما با ابعاد بیشتر که در آن الگوریتم های یادگیری خطی قابل کاربرد است نگاشت می کند.

کلمات کلیدی:
انتخاب خصیصه، دسته بندی متون ، روش SVM، استخراج خصیصه، فضای برداری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/108916/