سامانه رفع ابهام معنایی از حروف اضافه در زبان فارسی با استفاده از قالب های معنایی

Publish Year: 1397
نوع سند: مقاله ژورنالی
زبان: Persian
View: 275

This Paper With 20 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_JOLR-9-1_006

تاریخ نمایه سازی: 27 اردیبهشت 1400

Abstract:

رفع ابهام معنایی از کلمات در بافت یکی از مهم ترین چالش ها در حوزه پردازش زبان طبیعی و زبان شناسی رایانشی است. در این میان حروف اضافه، به خصوص در زبان فارسی، در پژوهش های مربوط به رفع ابهام معنایی همواره نادیده انگاشته شده اند. ازاین رو، پژوهش حاضر قصد دارد با ارائه الگوریتمی جدید مبتنی بر قالب های معنایی، سامانه ای قاعده مند جهت رفع ابهام معنایی از حروف اضافه «از»، «در»، «با» و «تا» در زبان فارسی ارائه دهد. روش به کار گرفته شده در این پژوهش و الگوریتم پیشنهادی منحصربه فرد است. دادگان مورداستفاده در این پژوهش شامل ۱۰۰۰ جمله داده آموزشی، ۱۰۰ جمله داده توسعه و ۵۰۰ جمله داده تست است که از منابع اینترنتی و شبکه های اجتماعی همچون یوتیوب جمع آوری گردیده است. جهت انجام کار، تمام حروف اضافه موردنظر پژوهش برچسب دهی معنایی شده و برای آن ها در پیکره آموزشی، قالب های معنایی بر اساس زبان قالب بنیاد مینسکی (۱۹۷۵) تعریف شدند. همچنین برای کلمات قبل و بعد حروف اضافه در پیکره نیز قالب هایی تهیه و در فایل داده مدخل ها وارد سامانه گردیدند. الگوریتم پژوهش در سه مسیر با استفاده از اطلاعات موجود در قالب ها، اقدام به تعیین معنای حروف اضافه در جملات می کند. نتایج آزمایش های داده تست، نشان دهنده دقت بالای عملکرد سامانه (۱۶/۹۹%) در رفع ابهام معنایی از حروف اضافه در زبان فارسی است.

Authors

زهرا مظفری

دانشجوی دکترای زبان شناسی همگانی، دانشگاه سیستان و بلوچستان

گیتی تاکی

استادیار زبان و ادبیات انگلیسی، دانشگاه سیستان و بلوچستان

مجتبی صباغ جعفری

استادیار گروه مهندسی کامپیوتر، دانشگاه ولی عصر رفسنجان

پاکزاد یوسفیان

استادیار زبان و ادبیات انگلیسی، دانشگاه سیستان و بلوچستان

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • انوری، حسن (۱۳۸۲). فرهنگ فشرده سخن. تهران، انتشارات آگاه ...
  • انوری، حسن و احمدی گیوی، حسن (۱۳۸۹). دستور زبان فارسی، ...
  • خطیب رهبر، خلیل (۱۳۶۷). دستور زبان فارسی: کتاب حروف اضافه ...
  • صفوی، کوروش (۱۳۹۲). درآمدی بر معناشناسی، تهران، هرمس ...
  • Agirre, E and Edmonds, Ph. ۲۰۰۷. Word sense disambiguation algorithms ...
  • Arenas, G.A., Villanueva, D., Rasgado, A.D. and Juarez, O. ۲۰۱۴.Using ...
  • Buecheler, S. ۲۰۰۰. Social movement in advanced capitalism, Oxford: Oxford ...
  • Fillmore, C. J. ۱۹۷۶. Frame semantics and the nature of ...
  • ۱۹۷۷b. Topics in lexical semantics, In Current Issues in Linguistics, ...
  • ۱۹۸۲b. Frame semantics, In the Linguistics Society of Korea, eds ...
  • ۱۹۸۵a. Frames and the semantics of understanding. Quaderni de Semantica, ...
  • ۱۹۹۷. Toward a frame based lexicon: the semantics of RISK ...
  • Goffman, E. ۲۰۱۳. The presentation of self in the online ...
  • Litkowski, K. and Hargraves, O. ۲۰۰۷. Word sense disambiguation of ...
  • Minsky, M. ۱۹۷۵. A framework for representing knowledge, The Psychology ...
  • نمایش کامل مراجع