شناسایی محل کسره اضافه در زبان فارسی با استفاده از گرامر مستقل از متن احتمالاتی
Publish place: 13th Annual Conference of Computer Society of Iran
Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 4,294
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ACCSI13_100
تاریخ نمایه سازی: 25 آبان 1386
Abstract:
در این مقاله به ارائه روشی برای شناسایی کسره اضافه در متون فارسی، با استفاده از گرامر مستقل ازمتن احتمالاتی و آمار کلمات، همراه با آنالیز لغوی پرداخته می شود. پس از تبیین اهمیت مسئله با ارائه چند جمله نمونه و توضیح نظریات زبانشناسی پیرامون حوضه اضافه و بررسی این حوضه از نظر تلحیل نحوی و قواعد دستوری زبان فارسی، به بیان روش پیشنهادی و ارائه نتایج حاصل از تست آن با استفاد ه از 1000 جمله معیار پرداخته ایم. در روش بکار رفته، ابتدا با توجه به قوانین گرامری زبان فارسی و خصوصیات کسره اضافه که از بررسی نتایج بدست امده توسط زبانشناسان در رابطه با حوزه اضافه حاصل گردیده، سعی شده است تا با تولید بانک درختی ازگروه های اسمی در زبان فارسی و آموزش گرامر مستقل از متن احتمالاتی با استفاده از این بانک درخت، و همچنین پارسر پایین به بالا، کلیه گروه های اسمی جملات ورودی استخراج شده و گروه های با احتمال بالاتر انتخاب شوند. سپس با استفاده از آنالیز لغوی کلمات و استفاده از احتمال کسره دار بودن هر کلمه و همچنین استفاده از گروه های اسمی انتخاب شده در فاز قبل و کمک گرفتن ازکلمات قبل و بعد کلمه مورد نظر و با استفاده از دو درخت تصمیم، کسره دار بودن یا نبودن هر کلمه موجود درجمله ورودی مشخص می گردد، کارایی بدست امده بر اساس ضریب کاپا برابر 0/74 است که بهتر از نتایج بدست امده در تحقیقات قبلی در این زمینه می باشد، ضمن اینکه مجموعه تست مورد استفاده با داشتن 1000 جمله نسبت به مجموعه تست تحقیقات قبلی دارای تعداد جملات و تنوع بیشتر موضوعات می باشد.
Keywords:
کسره اضافه , حوزه اضافه , گروه اسمی , گرامر PCFG , آنالیز لغوی , آنالیز نحوی , چارت پارسر , درخت CART , زبانشناسی نظری
Authors
شهریار عیسی پور
دانشجوی کارشناسی ارشد آزمایشگاه سیستم های هوش صوتی - گفتاری، دانشگاه م
محمدمهدی همایون پور
عضو هیات علمی آزمایشگاه سیستم های هوش صوتی - گفتاری، دانشگاه مهندسی کا
محمود بی جن خان
عضو هیات علمی دانشکده ادبیات و علوم انسانی، دانشگاه تهران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :