تکنیکهای یادگیری ماشین برای دسته بندی متون فارسی
Publish place: 11th Annual Conference of Computer Society of Iran
Publish Year: 1384
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,361
This Paper With 5 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI11_138
تاریخ نمایه سازی: 5 آذر 1390
Abstract:
امروزه با گسترش روزافزون متون و نوشتار الکتریکی برای زبان فارسی وجود ابزارهای دسته بندی اتوماتیک متون اجتناب ناپذیر کرده است دراینجا با بررسی الگوریتمهای مختلف موجود برای زبانهای دیگر و در نظر گرفتن ویژگیهای ساختاری و نوشتاری زبان فارسی تهیه یک مجموعه داده مناسب استاندارد و همچنین دقت این الگوریتم ها برای زبان فارسی بحث میشود از سوی دیگر با توجه به نامشخص بودن مرز دقیق کلمات در رسم الخط فارسی موجود بدلیل ابهام، جدایی ذاتی و وندهای آزاد با پیشنهاد استفاده از توالی کلمات بجای خود کلمات در تئوری بیز دقت دسته بندی را افزایش داده است.
Keywords:
یادگیر ماشین , دسته بندی اتوماتیک متون , زبان فارسی , مجموعه داده ها برای زبان فارسی , یادگیری با ناظر
Authors
لقمان براری
دانشگاه علم و صنعت ایران
مرتضی آنالویی
دانشگاه علم و صنعت ایران
مهران گرمه
دانشگاه صنعتی شریف