رده بندی متون با استفاده از تکنیک ترکیبی مبتنی بر زیرمجموعه ویژگی
Publish place: National Conference on Computer Science and Engineering
Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 726
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCSE01_128
تاریخ نمایه سازی: 9 بهمن 1392
Abstract:
با رشد جشم گیر اسناد متنی دیجیتال نیاز به یافتن اطلاعات مفید از این متون افزایش یافته و رده بندی خودکار متون، تکنولوژی کلیدی برای پاسخ به این نیاز است. به ازای هر سند متنی، واژه ها نقش ویژگی را در رده بندی ایفا می کنند که با توجه به حجم زیاد واژه، رده بند با مشکل ابعاد زیاد ویژگی مواجه است. هدف از این پژوهش، طراحی یک سیستم رده بندی کاراست که با حداقل ویژگی، کارایی نهایی یادگیرنده را افزایش دهد. در این سیستم یک روش ترکیبی همگن، مبتنی بر زیرمجموعه های متفاوت ویژگی بررسی شده است که باعث بهبود کارایی رده بند پایه در حداقل تعداد ویژگی می گردد. به منظور تولید زیرمجموعه ها از تکنیک های فیلتری و در مرحله ی یادگیری، رده بند SVM استفاده شده است. نتایج به دست آمده بر روی مجموعه داده ی رویترز – 21578، نشان دهنده ی کارایی بالای سیستم ارائه شده نسبت به رده بند منفرد است. به طوری که کارایی 0/97 در معیار میکرو- F1 و 0/921 در معیار ماکرو- F1 به دست آمده است.
Keywords:
Authors
سمانه شریفیان
دانشکده مهندسی شهید چمران اهواز
علیرضا عصاره
دانشکده مهندسی شهید چمران اهواز
بیتا شادگار
دانشکده مهندسی شهید چمران اهواز
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :