مقایسه ی روشهای وزن دهی ویژگی درفرآیند طبقه بندی مستندات

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,586

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

BPJ01_447

تاریخ نمایه سازی: 29 دی 1392

Abstract:

محوری ترین موضوع درحوزه متن کاوی طبقه بندی مستندات است اساس کارطبقه بندی مستندات برپایه کلمات کلیدی ومهمی است که ازمستندات استخراج میشود این کلمات یاهمان ویژگیها مضمون اصلی مطلب رابه مخاطب می رسانند ویانکات اصلی مطلب رابرمیگیرند بعدازاین مرحله فرایند وزن دهی به ویژگیها است وزن هرویژگی نشان دهنده قدرت ویژگی دربیان مفهوم کلی یک مستند است این دومرحله جز تکنیکهای پیش پردازش درحوزه طبقه بندی مستندات به شمار میرود بدیهی است انتخاب روشهای کارامد درشناسایی استخراج ووزن دهی ویژگی نقش مهمی دربالا بردن کارایی و دقت طبقه بندی کننده مستندات است درروشهای انتخاب ویژگی مواردی همچون میزان وابستگی ویژگی به مستندات تعدادتکرار ویژگی قدرت ویژگی درجداسازی مستندات و وابستگی ویژگیها به طبقات مورد بررسی قرارمیگیرد همچنین درموضوع وزن دهی روشهای مبتنی برتعدادتکرار کلمه IF روشهای مبتنی برتعدادتکرار کلمه درمستندات مختلف IDF,روشهای ترکیبی IDF,TF مطرح هستند بعدازمقایسه ی روشهای مطرح وزن دهی معلوم شد برخی ازآنها دربرابر افزیاش تعدادمستندات افزایش طول مستندات افزایش تعدادویژگیها افزایش طبقات و یاناهمگونی ماهیت ویژگیها درعملکرد و دقت دچار ضعف میشوند

Authors

مصطفی کریمی منش

دانشگاه پیام نورمرکزتهران

حسین شیرازی

دانشیاردانشگاه صنعتی مالک اشترتهران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • F. Sebastiani, "Machine Learning _ Automated Text Categorization, " ACM ...
  • Y. Yang, J. O. Pedersen, _ Comparative Study on Feature ...
  • S. Giri, XML Classification, B.E. Thesis, Madras University, India, 2004. ...
  • G. Salton, C. Buckley, _ _ erm-Weighting Approaches in Automatic ...
  • _ _ _ for Semi- structured Document Categorization, " Information ...
  • E. Leopold, J. Kindermann, _ Categorization with Support Vector Machines. ...
  • _ _ _ 3 _ Storage and Retrieval, vol. 9, ...
  • _ _ _ _ 546-551, 2005. ...
  • M. Maleki, A. Abdollahzadeh, "TFCRF: A Novel Feature Weighting Method ...
  • G. Salton, C. Buckley, _ _ erm-Weighting Approaches in Automatic ...
  • _ _ _ New York, US, ...
  • _ _ 1 Categorization 2 Clustering ...
  • Accuracy 15 Precision 16 Recall ...
  • نمایش کامل مراجع