انتخاب خصیصه به روش ترکیبی فیلتری - روکشی در دسته بندی متون

Publish Year: 1381
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,844

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI08_072

تاریخ نمایه سازی: 18 بهمن 1386

Abstract:

در دستهبندی متون، بطور معمول از کلمات متن بعنوان خصیصههای آن متن استفاده میشود . در نتیجه روشهای دستهبندی متون با تعداد زیادی خصیصه مواجه می باشند . به منظور کاهش تعداد خصیصهها و انتخاب خصیصههای مرتبط، از روشهای متعددی استفاده شده است . این مقاله روشی جهت بهبود انتخاب خصیصهها در دستهبندی متون پیشنهاد می کند و نیز به ارزیابی مقایسهای روش پیشنهادی با روشهای موجود انتخاب خصیصه می پردازد . تمرکز این مقاله روی حذف حریصانه خصیصههاست و سعی دارد با حفظ دقت دستهبند، تا حد ممکن خصیصهها را کاهش دهد . به طور کلی روشهای انتخاب خصیصه با توجه به وابستگی و یا عدم وابستگیشان به دستهبندها به دو گروه مختلف روشهای فیلتری و روشهای روکشی تقسیم می شوند . در این مقاله، ترکیبی از یک روش فیلتری و یک روش روکشی پیشنهاد شده که ابتدا با استفاده از روش فیلتری Relief-F تعدادی از خصیصهها با هزینه محاسباتی کمی انتخاب میشوند و سپس از خصیصههای انتخاب شده با استفاده از روش روکشی SFS یا SBS به صورت دقیقتری با کمک دستهبند متون، خصیصههای نامرتبط حذف می شوند . روش انتخاب خصیصه پیشنهادی با روشهای انتخاب خصیصه موجود، روی مجموعه دادههای مختلف آزمون و با یکدیگرمقایسه شدهاند . روش پیشنهادی با داشتن هزینه محاسباتی بیشتری نسبت به روشهای فیلتری، کارائی بهتری نسبت به این روشها از خود نشان میدهد . علاوه بر آن، با استفاده از این روش به همراه دستهبند SVM Light روی مجموعه دادههای رویتر، %٩٤ خصیصهها ضمن بهبود دقت دسته بندی، از فضای خصیصههای اولیه حذف شدهاند . ضم ن - اً روش Relief-F بعنوان یک روش حذف خصیصه فیلتری در ناحیه غیر متون، نتایج بسیار خوبی در حذف خصیصههای متنی از خود نشان می دهد

Authors

سعید جلیلی

دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، گروه کامپیوتر

مهدی بیطرفان

دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، گروه کامپیوتر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • بیطرفان مهدی، بهبود روش انتخاب خصیصه در دسته‌بندی متون، دانشگاه ...
  • Yang Y. and Pedersen J.A, Comparative Study on Feature Selection ...
  • Lewis D., An Introduction to Information Retrieval. _ Int. ACM ...
  • Sahami M, Using Machine Learning to Improve Information Access. In ...
  • Cardie C., Using decision tree to improve case based learning. ...
  • Aggarwal C. and Yu P, Data Mining Techniques for Associations, ...
  • Yang Y., An Evaluation of Statistical Approaches to Text C ...
  • Kohavi R., and Sommerfield D., Feature Subset selection using Wrapper ...
  • Joachims T, Text C ategorization with Support Vector Machines: Learning ...
  • Lewis D., The Reuters-2 1578 Collection, 2000. ...
  • Ichino M. and Sklansky J., Optimum feature selection by Zero-one ...
  • Dash M. and Liu H., Feature Selection for C lassification. ...
  • Kira K. and Rendell L., The Feature Selection Problem: Traditional ...
  • Narendra P.M. and Fukonaga K., A branch and bound algorithm ...
  • Koller D. and Sahami M., Toward optimal feature selection, ICML, ...
  • Langly P., Selection of relevant features in machine learning, AAAI, ...
  • Almuallim H., Dietterich and T.G., Learning Boolean Concepts in the ...
  • Kononenko I., Estimating attributes: Analysis and extention of RELLIEF. ECML, ...
  • Xu L. and Yan P., Best first Strategy for feature ...
  • Sheinvald J. and Dom B., A Modeling Approach to feature ...
  • Modrzejewski M., Feature selection using rough set theory, ECML, 1993, ...
  • Galavotti L., Fabrizio S. and Simi M., Feature Selection and ...
  • نمایش کامل مراجع