شباهت معنایی جملات فارسی با استفاده از تطبیق فضای برداری و یادگیری عمیق

Publish Year: 1401
نوع سند: مقاله ژورنالی
زبان: Persian
View: 201

This Paper With 15 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_PADSA-10-2_005

تاریخ نمایه سازی: 24 بهمن 1401

Abstract:

امروزه، شناسایی متون مشابه، موضوعی با کاربردهای فراوان می باشد که با توجه به اهمیت آن، توسط پژوهشگران زبان های مختلف مورد‍ تحلیل و بررسی قرار گرفته است. در گذشته اغلب برای درک جملات توسط سامانه­های رایانه ای، جملات به صورت مجموعه کلمات مورد بررسی قرار می­گرفتند. اما امروزه، با گسترش فناوری و استفاده از شبکه­های عصبی عمیق، می توان از خود جملات، مفهوم اصلی را استخراج نمود. بنابراین، رسیدن به مدلی که بتواند جملات را کدگذاری کرده و مفهوم اصلی جمله را با دقت هر چه بیشتر استخراج نماید، یکی از نیازهای ضروری برای این هدف به شمار می­رود. این مقاله قصد دارد تا میزان شباهت جملات را از نقطه نظر معنایی به دست آورد که از روش های یادگیری عمیق استفاده می کند. از آنجایی که روش های یادگیری عمیق نیاز به داده آموزشی زیادی دارند، این مقاله از ایده نگاشت بین زبانی بهره می برد. روش پیشنهادی، فضای برداری تعبیه کلمات انگلیسی را به فارسی نگاشت کرده و با کمک مدل آموزش داده شده در زبان انگلیسی، شباهت جملات فارسی به دست می آید. درنهایت، نتایج نهایی با امتیازات انسانی مورد مقایسه قرار گرفته است. نتایج حاصل از روش پیشنهادی، میزان دقت این سامانه پیشنهادی را ۸۹ درصد ارائه می دهد که نسبت به سایر مدل­های یادگیری عمیق برتری دارد.

Authors

سعیده سادات سدیدپور

استادیار، دانشگاه صنعتی مالک اشتر، تهران، ایران

مینا حاجی غلامرضا

کارشناسی ارشد، دانشگاه صنعتی مالک اشتر، تهران، ایران

محمدرضا محمدزاده

کارشناسی ارشد، دانشگاه صنعتی مالک اشتر، تهران، ایران

سید محمدرضا محمدی

کارشناسی ارشد، دانشگاه صنعتی مالک اشتر، تهران، ایران

محمدعلی کیوانراد

استادیار، دانشگاه صنعتی مالک اشتر، تهران، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • R., Mihalcea, C. Corley, and C. Strapparava, "Corpus-based and Knowledge-based ...
  • V. Bahel and A. Thomas, "Text Similarity Analysis for Evaluation ...
  • S. Mizzaro, M. Pavan, and I. Scagnetto, "Content-based Similarity of ...
  • Z. Sepehrian, S. S. Sadidpour, and H. Shirazi, "An Approach ...
  • Z. Wang, W. Hamza, and R. Florian, "Bilateral Multi-perspective Matching ...
  • J. Mueller and A. Thyagarajan, "Siamese Recurrent Architectures for Learning ...
  • W. H. Gomaa and A. A. Fahmy, "A Survey of ...
  • M. Farouk, "Measuring Sentences Similarity: A Survey," arXiv:۱۹۱۰.۰۳۹۴۰v۱, July ۲۰۱۹ ...
  • Y. Wang, X. Di, J. Li, H. Yang, and L. ...
  • T. Mikolov, K. Chen, G. Corrado, and J. Dean, "Efficient ...
  • Y. Doval, J. Camacho-Collados, L. Espinosa-Anke, and S. Schockaert, "Improving ...
  • A. Conneau, G. Lample, M. A. Ranzato, L. Denoyer, and ...
  • M. Artetxe, G. Labaka, and E. Agirre, "Learning Bilingual Word ...
  • J. Devlin, M. W. Chang, K. Lee, and K. Toutanova, ...
  • H., Huang, Y. Liang, N. Duan, M. Gong, L. Shou, ...
  • G. Lample and A. Conneau, "Cross-lingual Language Model Pretraining," ArXiv ...
  • H. Gonen, S. Ravfogel, Y. Elazar, and Y. Goldberg, "It's ...
  • R. Samuel, G. A. Bowman, and C. Potts, "The Stanford ...
  • نمایش کامل مراجع