طبقه بندی خودکار متون فارسی

Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 5,296

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI13_180

تاریخ نمایه سازی: 25 آبان 1386

Abstract:

طبقه بندی خودکار متون از موارد کاربرد الگوریتمهای یادگیری ماشینی در مبحث بازیابی اطلاعات میباشد. در این مقاله نیز نتایج طبقه بندی خودکار متون فارسی با استفاده از معیارهای شاخصگذاری3 -gram, ٤-gram و کلمه ارائه شدهاست . در ضمن نتایج در دو حالت با حذفstop word و بدون حذف stop word های متون نیز مقایسه شدهاند. به منظور دستهبندی متون از الگوریتم یادگیری ماشینی نزدیکترینk همسایه همسایه استفاده شده است و در نهایت به منظور ارزیابی و مقایسه نتایج، دو معیار دقت و یادآوری برای هر روش شاخصگذاری نیز محاسبه شدهاند. نتایج بدست آمده نشان داد که بهترین روش شاخصگذاری متون فارسیgram میباشد و حذف stop word ها نتایج را اندکی بهبود میبخشد.

Authors

بهاره بینا

قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک

مسعود رهگذر

قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک

آذین ده موبد

قطب علمی کنترل و پردازش هوشمند، پردیس دانشکدههای فنی، دانشکده برق و ک

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Alireza Mokhtaripour, Saber Jahanpour "Introduction to ACM اه15 _ nevv ...
  • Fabriz Sebastiani, Machine Learning in Text Catego rization, ACM Computing ...
  • Kjersti Aas, Line Eikvil, Text Catego rization: _ Survey , ...
  • Laila Khreisat, Arabic Text Classification Using N-Gram Frequency Statistics, Tech. ...
  • Teresa Goncalves, Paulo Quaresma, Evaluating preprocessing techniques in a text ...
  • Yang, Y., Pedersen J.P. A Comparative Study on Feature Selection ...
  • Peter Nather, N-gram Based Text Ca tegorization, Diploma thesis, 2005 ...
  • W. B. Cavnar and J. M. Trenkle, N-gram-based text categorization. ...
  • Andras Kornai, J.Micheal Richards, Linear Discriminant Text Classification in High ...
  • Helmut Berger, Dieter Merkl, A Comparision of Text- Ca tegorization ...
  • Darrudi, E., Hejazi, M. R, Oroumchian, F. Assessment of a ...
  • Hadi Amiri, Abolfazl AleAhmad, Farhad Oroumchian, Caro Lucas, Masoud Rahgozar, ...
  • Abolfazl Aleahmad, Parsia Hakimian, Farzad Mahdikhani and Farhad O roumchian. ...
  • G. K. Zipf, ،Huran Behavior and the Principle of Least ...
  • Ciya Liao, Shamim Alpha, Paul Dixon, Feature Preparation in Text ...
  • Thorsten Joachims, Text Ca tegorization with Support Vector Machines ...
  • نمایش کامل مراجع