یک روش پیش پردازش کارآمد و قوی برای متون فارسی
Publish place: 21th Iranian Conference on Electric Engineering
Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,503
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE21_247
تاریخ نمایه سازی: 27 مرداد 1392
Abstract:
دراین مقاله به طراحی و ارایه الگوریتمی درزمینه ریشه یابی کلمات درمتون فارسی پرداخته شده است این روش که برمبنای ساختار ریخت شناسی زبان فارسی عمل می کند ازجداول جستجوو برای ریشه یابی کلمات بهره گرفته است روال کار به این صورت است که دراغاز کلمات متن جداسازی شده و کاراکتر ها و کلمات زائد آن حذف میشوند ازانجایی که تعداد افعال کاربردی زبان فارسی محدود است ابتدا با فرض اینکه کلمات فعل هستند ریشه یابی می شوند درصورتی پس ازاتمام ریشه یابی کلمه فعل تشخیص داده شود مصدر آنذخیره میشود درغیر این صورت روال ریشه یابی کلمات غیرفعل اجرا خواهد شد نتایج ازمایشات ما روی مجموعه ای ازاسناد فارسی نشان دهنده نتایج قابل قبولی برای الگوریتم ارایه شده است
Keywords:
Authors