شناسایی گرامر زبان فارسی با استفاده از تجزیه گر پیشگو

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 575

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ETECH03_107

تاریخ نمایه سازی: 1 مرداد 1397

Abstract:

تجزیه و ترکیب نحوی زبانهای طبیعی یکی از چالشهای پیشروی پژوهشگران حوزه پردازش زبان طبیعی است که دارای دو بخش عمده میباشد. اول ارایه گرامری که بتواند با ترکیب واژگان یک زبان، جملاتی با ساختار نحوی درست بسازد و دوم طراحی تجزیه گری که با بکارگیری گرامر، منجر به تجزیهی جملات به ساختارهای نحوی آنها شود. در این مقاله، ابتدا یک گرامر مستقل از متن برای زبان فارسی ارایه شده که شامل مجموعه ای از 128 قانون گرامری میباشد. نمونه هایی از این قوانین در این مقاله آورده شده است. این گرامر تولید کننده ی جملات باترتیب و فعل-انتها در زبان فارسی است . سپس یک تجزیه گر پیشگو که مبتنی بر گرامر پیشنهادی میباشد، ارایه شده است. همراه با تجزیهگر، جدول تجزیه ای ساخته شده است که به تجزیه ی جملات زبان فارسی کمک میکند. با بکارگیری جدول تجزیه، خطاهای نحوی جملات فارسی شناسایی می شوند. رویکرد پیشنهادی مبتنی بر متدهای تجزیه بالا به پایین است و برای کاهش ابهام در تجزیه گر، عمل فاکتورگیری بر روی گرامر اولیه صورت پذیرفته است. در ارزیابی این گرامر، از جملات برچسب گذاری شده ی پیکره ی وابستگی نحوی زبان فارسی استفاده کردهایم. تجزیه گر پیشنهادی با نرخ پذیرش %71,8 موفق به تجزیه جملات فارسی شده است، که افزایش نرخ پذیرش، با توسعه گرامر امکانپذیر است.

Authors

سودابه محمدی

دانشکده فناوری اطلاعات، دانشگاه صنعتی کرمانشاه کرمانشاه، ایران