CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

رده بندی متون با استفاده از تکنیک ترکیبی مبتنی بر زیرمجموعه ویژگی

عنوان مقاله: رده بندی متون با استفاده از تکنیک ترکیبی مبتنی بر زیرمجموعه ویژگی
شناسه ملی مقاله: NCCSE01_128
منتشر شده در همایش ملی علوم و مهندسی کامپیوتر در سال 1391
مشخصات نویسندگان مقاله:

سمانه شریفیان - دانشکده مهندسی شهید چمران اهواز
علیرضا عصاره - دانشکده مهندسی شهید چمران اهواز
بیتا شادگار - دانشکده مهندسی شهید چمران اهواز

خلاصه مقاله:
با رشد جشم گیر اسناد متنی دیجیتال نیاز به یافتن اطلاعات مفید از این متون افزایش یافته و رده بندی خودکار متون، تکنولوژی کلیدی برای پاسخ به این نیاز است. به ازای هر سند متنی، واژه ها نقش ویژگی را در رده بندی ایفا می کنند که با توجه به حجم زیاد واژه، رده بند با مشکل ابعاد زیاد ویژگی مواجه است. هدف از این پژوهش، طراحی یک سیستم رده بندی کاراست که با حداقل ویژگی، کارایی نهایی یادگیرنده را افزایش دهد. در این سیستم یک روش ترکیبی همگن، مبتنی بر زیرمجموعه های متفاوت ویژگی بررسی شده است که باعث بهبود کارایی رده بند پایه در حداقل تعداد ویژگی می گردد. به منظور تولید زیرمجموعه ها از تکنیک های فیلتری و در مرحله ی یادگیری، رده بند SVM استفاده شده است. نتایج به دست آمده بر روی مجموعه داده ی رویترز – 21578، نشان دهنده ی کارایی بالای سیستم ارائه شده نسبت به رده بند منفرد است. به طوری که کارایی 0/97 در معیار میکرو- F1 و 0/921 در معیار ماکرو- F1 به دست آمده است.

کلمات کلیدی:
رده بندی متون، SVM، ترکیب رده بند، زیرمجموعه ویژگی، انتخاب ویژگی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/228380/