ترجمه ماشینی مبتنی بر مدل مبدل برای گویش های لری بویراحمدی و یزدی به فارسی معیار و گسترش منابع زبانی رایانشی مرتبط

Publish Year: 1402
نوع سند: مقاله ژورنالی
زبان: Persian
View: 32

This Paper With 20 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_LSI-19-37_007

تاریخ نمایه سازی: 21 شهریور 1403

Abstract:

با وجود تلاش های گسترده رایانشی بر روی گویش معیار فارسی، سایر لهجه ها و گویش ها و زبان های ایرانی کمتر مورد توجه محققین حوزه زبان شناسی رایانشی قرار گرفته اند. یکی از مهم ترین چالش های کار رایانشی بر روی این تمایز های زبانی، نبود یک مجموعه داده دیجیتال و استاندارد است. در این پژوهش اولین مجموعه داده تک زبانه و نیز داده موازی بر روی گویش های لری و یزدی که گویش هایی با منابع محدود محسوب می شوند، در مقابل فارسی معیار ارائه شده است. در ادامه مدل های یادگیری ژرف ترجمه ماشینی کدگذار-کدگشا در دو نوع مدل شبکه عصبی بازگشتی و مدل ژرف مبدل برای این گویش ها به فارسی معیار توسعه یافته و ارزیابی گردیده است. در این پژوهش که اولین تلاش محاسباتی روی این دو گویش محسوب می شود، برای ترجمه لری به فارسی و فارسی به لری به امتیاز BLEU به ترتیب ۳۹/۷ و ۲۹/۳ رسیدیم. این امتیاز برای گویش یزدی به فارسی معیار و برعکس به ۷۳/۰ و ۷۷/۰ رسید. که نشان می دهند پژوهش های فراتری برای توسعه منابع زبانی برای این زبان نیاز است.

Keywords:

پردازش زبان طبیعی , گویش لری , گویش یزدی , ترجمه تمایزهای زبانی ایرانی , مدل یادگیری ژرف ترجمه ماشینی

Authors

زهرا بهمنی

۱PhD. Student, Department of Computer Engineering, Sharif University of Technology, AI Group

محدثه میربیگی

دانشجوی دکتری، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی

نگین هاشمی دیجوجین

دانشجوی کارشناسی ارشد، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی

مرضیه نوری

پژوهشگر، دانشگاه صنعتی شریف، آزمایشگاه پردازش هوشمند متن و زبان، گروه هوش مصنوعی

مهسا امانی

دانشجوی کارشناسی، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی

احسان الدین عسگری

آزمایشگاه پردازش هوشمند متن و زبان و علوم انسانی محاسباتی

مهدیه سلیمانی باغشاه

دانشیار، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی

حمید بیگی

دانشیار، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی

علی موقر

استاد، دانشگاه صنعتی شریف، دانشکده مهندسی کامپیوتر، گروه هوش مصنوعی