شباهت معنایی جملات فارسی با استفاده از تطبیق فضای برداری و یادگیری عمیق

Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 700

This Paper With 21 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICTI04_062

تاریخ نمایه سازی: 20 مهر 1400

Abstract:

امروزه، شناسایی متون مشابه، موضوعی با کاربردهای فراوان می باشد که با توجه به اهمیت آن توسط پژوهشگران زبان های مختلف مورد تحلیل و بررسی قرار گرفته است. در گذشته اغلب برای درک جملات توسط سیستم های کامپیوتری، جملات به صورت مجموعه کلمات مورد بررسی قرار می گرفتند. اما امروزه با گسترش فناوری و استفاده از شبکه های عصبی عمیق، می توان از خود جملات، مفهوم اصلی را استخراج نمود. بنابراین، رسیدن به مدلی که بتواند جملات را کدگذاری کرده و مفهوم اصلی جمله را با دقت هرچه بیشتر استخراج نماید، یکی از نیازهای ضروری برای این هدف به شمار می رود. این مقاله قصد دارد تا میزان شباهت جملات را از نقطه نظر معنایی بدست آورد که از روش های یادگیری عمیق استفاده می کند. از آنجایی که روش های یادگیری عمیق نیاز به داده آموزشی زیادی دارند. این مقاله از ایده نگاشت بین زبانی بهره می برد. روش پیشنهادی، فضای برداری تعبیه کلمات انگلیسی را به فارسی نگاشت کرده و با کمک مدل آموزش داده شده در زبان انگلیسی، شباهت جملات فارسی به دست می آید. در نهایت، نتایج نهایی با امتیازات انسانی مورد مقایسه قرار گرفته است. نتایج حاصل از روش پیشنهادی، میزان دقت این سیستم پیشنهادی را ۸۹ درصد ارائه می دهد که نسبت به سایر مدل های یادگیری عمیق برتری دارد.

Authors

مینا حاجی غلامرضا

دانشگاه صنعتی مالک اشتر، ایران

سیعده سادات سدیدپور

دانشگاه صنعتی مالک اشتر، ایران

محمدرضا محمدزاده

دانشگاه صنعتی مالک اشتر، ایران