رده بندی متون با استفاده از تکنیک ترکیبی مبتنی بر زیرمجموعه ویژگی

Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 700

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

NCCSE01_128

تاریخ نمایه سازی: 9 بهمن 1392

Abstract:

با رشد جشم گیر اسناد متنی دیجیتال نیاز به یافتن اطلاعات مفید از این متون افزایش یافته و رده بندی خودکار متون، تکنولوژی کلیدی برای پاسخ به این نیاز است. به ازای هر سند متنی، واژه ها نقش ویژگی را در رده بندی ایفا می کنند که با توجه به حجم زیاد واژه، رده بند با مشکل ابعاد زیاد ویژگی مواجه است. هدف از این پژوهش، طراحی یک سیستم رده بندی کاراست که با حداقل ویژگی، کارایی نهایی یادگیرنده را افزایش دهد. در این سیستم یک روش ترکیبی همگن، مبتنی بر زیرمجموعه های متفاوت ویژگی بررسی شده است که باعث بهبود کارایی رده بند پایه در حداقل تعداد ویژگی می گردد. به منظور تولید زیرمجموعه ها از تکنیک های فیلتری و در مرحله ی یادگیری، رده بند SVM استفاده شده است. نتایج به دست آمده بر روی مجموعه داده ی رویترز – 21578، نشان دهنده ی کارایی بالای سیستم ارائه شده نسبت به رده بند منفرد است. به طوری که کارایی 0/97 در معیار میکرو- F1 و 0/921 در معیار ماکرو- F1 به دست آمده است.

Authors

سمانه شریفیان

دانشکده مهندسی شهید چمران اهواز

علیرضا عصاره

دانشکده مهندسی شهید چمران اهواز

بیتا شادگار

دانشکده مهندسی شهید چمران اهواز

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • G. M. Di Nunzio, "Using Scatterplots to Understand and Improve ...
  • N. Azam and J. T. Yao, "Comparison of Term Frequency ...
  • S. Wang, et al., "A feature selection method based on ...
  • F. Debole and F Sebastiani, "Supervised Term Weighting for Automated ...
  • J. Chen, et al., "Feature selection for text classification with ...
  • _ _ _ ; _ _ _ _ _ _ ...
  • W. Shang, et al., "A Novel Feature Selection Algorithm for ...
  • A. McCallum and K. Nigam, "A Comparison of Event Models ...
  • S. B. Kim, et al., "Some Effective Techniques for Naive ...
  • Z. Sun, et al., "A Cluster Tree Method For Text ...
  • T. Joachims, "Text Categorization with Support Vector Machines: Learning with ...
  • M. Lan, et al., "Supervised and Traditional Term Weighting Methods ...
  • I. K. Ludmila, "Relationships Between Combination Methods and Measures of ...
  • _ _ _ _ _ _ _ _ Text Classification; ...
  • Y. Bi, et al., "Combining Multiple Classifiers Using Dempster s ...
  • K. Sarinnapakorn and M. Kubat, "Combining subclassifiers in text categorization: ...
  • F. Sebastiani, "Machine Learning in Automated Text Categorization, " ACM ...
  • H. T. Ng, et al, "Feature selection, perceptron learning , ...
  • L. Galavotti, et al., "Experiments on the use of feature ...
  • Z. Zheng and R. Srihari, "Optimally combining positive and negative ...
  • G. P. C. Fung, et al., "A balanced ensemble approach ...
  • R. Bryll, et al., "Attribute bagging: improving accuracy of classifier ...
  • E. Yu and S. Cho, "Constructing response model using ensemble ...
  • M. Galar, et al., "A Review o Ensembles for the ...
  • Reuters-2157 Dataset, (september 2012). Available: http://www. daviddlewis. com/res ourc es/tes ...
  • M. H. Aghdam, et al., "Text feature selection using ant ...
  • نمایش کامل مراجع