تکنیکهای یادگیری ماشین برای دسته بندی متون فارسی

Publish Year: 1384
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,361

This Paper With 5 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI11_138

تاریخ نمایه سازی: 5 آذر 1390

Abstract:

امروزه با گسترش روزافزون متون و نوشتار الکتریکی برای زبان فارسی وجود ابزارهای دسته بندی اتوماتیک متون اجتناب ناپذیر کرده است دراینجا با بررسی الگوریتمهای مختلف موجود برای زبانهای دیگر و در نظر گرفتن ویژگیهای ساختاری و نوشتاری زبان فارسی تهیه یک مجموعه داده مناسب استاندارد و همچنین دقت این الگوریتم ها برای زبان فارسی بحث میشود از سوی دیگر با توجه به نامشخص بودن مرز دقیق کلمات در رسم الخط فارسی موجود بدلیل ابهام، جدایی ذاتی و وندهای آزاد با پیشنهاد استفاده از توالی کلمات بجای خود کلمات در تئوری بیز دقت دسته بندی را افزایش داده است.

Keywords:

یادگیر ماشین , دسته بندی اتوماتیک متون , زبان فارسی , مجموعه داده ها برای زبان فارسی , یادگیری با ناظر

Authors

لقمان براری

دانشگاه علم و صنعت ایران

مرتضی آنالویی

دانشگاه علم و صنعت ایران

مهران گرمه

دانشگاه صنعتی شریف