بررسی اثر روابط بین خصیصه های سندها و دست هها در ضابط ههای روش های آماری انتخاب خصیصه در بهبود دسته بندی متون

Publish Year: 1382
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 944

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICEE11_037

تاریخ نمایه سازی: 18 تیر 1391

Abstract:

در دسته بندی متون، معمولا از کلمات یک تائی متون بعنوان خصیصه استفاده می شود. در این مقاله تاثیر استفاده از کلما ت دوتائی، روی کارائی الگوریتم های دسته بندی بررسی می شود. نتایج بدست آمده نشان می دهد استفاده از ترکیبات دوتا ئی کلمات در متون، اطلاعات ارزشمندی در رابطه با دسته بندی به مجموعه اطلاعات اولیه اسناد (کلمات یک تائی) اضافه می کند و به این طریق کارائی روش های دسته بندی افزایش می یابد. بنابراین استفاده از روش نمایش اسناد به صورت مجموعه ای از خصیصه های یک تائی و دوتائی می تواند بعنوان روشی مناسب جهت نمایش اسناد در دست هبندی متون استفاده گردد. همچنین با توجه به وجود تعداد بسیار زیاد خصیصه متنی، روش هائی نیز به منظور کاهش تعداد خصیص ه ها و انتخاب خصیصه های مرتبط، پیشنهاد شده است. اکثر روش های انتخاب خصیصه از دو رابطه مثبت و دو رابطه منفی بین خصیصه های سندها و دسته استفاده می کنند که در این مقاله با در نظر گرفتن کلیه روابط مثبت و منفی بین خصیصه های سندها و دسته ها در ضابط ههای انتخاب خصیصه، یکبار کلیه روابط مثبت و منفی را با اثر مثبت و بار دیگ ر روابط مثبت را با اثر مثبت و روابط منفی را با اثر منفی در ضابطه انتخاب خصیصه لحاظ می کند . ضمن ارزیابی های انجام گرفته روی مجموعه های داده ای رویتر و نیگام، ملاحظه می شود که کلیه روابط مثبت و منفی، نقش موثری را در تعیین دسته سندها دارند و همچنین بهتر بودن نتایج ضابطه دوم، نشان دهنده تاثیر بیشتر روابط مثبت، نسبت به روابط منفی م یباشد

Authors

سعید جلیلی

دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، گروه کامپیوتر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • بیطرفان مهدی، بهبود روش انتخاب حصیصه در دسته‌بندی متون، دانشگاه ...
  • I15] جلیلی سعید، بیطرفان مهدی، انتخاب خصیصه به روش ترکیبی ...
  • Sahami M, Using Machine Learning to Improve Information Access. In ...
  • Lewis D., _ Introduction to Information Retrieval. 17" A». Int. ...
  • Yang Y., An Evaluation of Statistical Approaches to Text Classificatio. ...
  • Ichino M. and Sklansky J., Optimum feature selection by Zero-One ...
  • Cardie C, , Using decision tree to improve case based ...
  • Yang Y. and Pedersen J.A, Comparative Study on Feature Selection ...
  • Development in Information Retrieval, 1994. ...
  • Galavotti L., Fabrizio S. and Simi M., Feature Selection and ...
  • Lewis D., The Reuters-2157 Collection, 2000. ...
  • Kohavi R., and Sommerfield D., Feature Subset selection using Wrapper ...
  • Kira K. and Rendell L. The Feature Selection Problem: Traditional ...
  • Langly P., Selection of relevant features in machine learning, AAAI, ...
  • Joachims T., Text Categorization with Support Vector Machines: Learning with ...
  • Aggarwal C. and Yu P, Data Mining Techniques for Associations, ...
  • th ICEE, May 2003, Vol. 1 ...
  • نمایش کامل مراجع