شباهت معنایی جملات فارسی با استفاده از تطبیق فضای برداری و یادگیری عمیق

سعیده سادات سدیدپور; مینا حاجی غلامرضا; محمدرضا محمدزاده; سید محمدرضا محمدی; محمدعلی کیوانراد

شباهت معنایی جملات فارسی با استفاده از تطبیق فضای برداری و یادگیری عمیق

Publish place: Electronic and cyber defense، Vol: 10، Issue: 2

Publish Year: 1401

نوع سند: مقاله ژورنالی

زبان: Persian

This Paper With 15 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > یادگیری عمیق

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1602312

شناسه ملی سند علمی:

JR_PADSA-10-2_005

تاریخ نمایه سازی: 24 بهمن 1401

Abstract:

امروزه، شناسایی متون مشابه، موضوعی با کاربردهای فراوان می باشد که با توجه به اهمیت آن، توسط پژوهشگران زبان های مختلف مورد‍ تحلیل و بررسی قرار گرفته است. در گذشته اغلب برای درک جملات توسط سامانههای رایانه ای، جملات به صورت مجموعه کلمات مورد بررسی قرار میگرفتند. اما امروزه، با گسترش فناوری و استفاده از شبکههای عصبی عمیق، می توان از خود جملات، مفهوم اصلی را استخراج نمود. بنابراین، رسیدن به مدلی که بتواند جملات را کدگذاری کرده و مفهوم اصلی جمله را با دقت هر چه بیشتر استخراج نماید، یکی از نیازهای ضروری برای این هدف به شمار میرود. این مقاله قصد دارد تا میزان شباهت جملات را از نقطه نظر معنایی به دست آورد که از روش های یادگیری عمیق استفاده می کند. از آنجایی که روش های یادگیری عمیق نیاز به داده آموزشی زیادی دارند، این مقاله از ایده نگاشت بین زبانی بهره می برد. روش پیشنهادی، فضای برداری تعبیه کلمات انگلیسی را به فارسی نگاشت کرده و با کمک مدل آموزش داده شده در زبان انگلیسی، شباهت جملات فارسی به دست می آید. درنهایت، نتایج نهایی با امتیازات انسانی مورد مقایسه قرار گرفته است. نتایج حاصل از روش پیشنهادی، میزان دقت این سامانه پیشنهادی را ۸۹ درصد ارائه می دهد که نسبت به سایر مدلهای یادگیری عمیق برتری دارد.

Keywords:

استخراج مفهوم جملات , تعبیه کلمات , یادگیری عمیق , مشابهت یابی , تطبیق فضای برداری

Authors

سعیده سادات سدیدپور

استادیار، دانشگاه صنعتی مالک اشتر، تهران، ایران

مینا حاجی غلامرضا

کارشناسی ارشد، دانشگاه صنعتی مالک اشتر، تهران، ایران

محمدرضا محمدزاده

کارشناسی ارشد، دانشگاه صنعتی مالک اشتر، تهران، ایران

سید محمدرضا محمدی

کارشناسی ارشد، دانشگاه صنعتی مالک اشتر، تهران، ایران

محمدعلی کیوانراد

استادیار، دانشگاه صنعتی مالک اشتر، تهران، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

R., Mihalcea, C. Corley, and C. Strapparava, "Corpus-based and Knowledge-based ...
V. Bahel and A. Thomas, "Text Similarity Analysis for Evaluation ...
S. Mizzaro, M. Pavan, and I. Scagnetto, "Content-based Similarity of ...
Z. Sepehrian, S. S. Sadidpour, and H. Shirazi, "An Approach ...
Z. Wang, W. Hamza, and R. Florian, "Bilateral Multi-perspective Matching ...
J. Mueller and A. Thyagarajan, "Siamese Recurrent Architectures for Learning ...
W. H. Gomaa and A. A. Fahmy, "A Survey of ...
M. Farouk, "Measuring Sentences Similarity: A Survey," arXiv:۱۹۱۰.۰۳۹۴۰v۱, July ۲۰۱۹ ...
Y. Wang, X. Di, J. Li, H. Yang, and L. ...
T. Mikolov, K. Chen, G. Corrado, and J. Dean, "Efficient ...
Y. Doval, J. Camacho-Collados, L. Espinosa-Anke, and S. Schockaert, "Improving ...
A. Conneau, G. Lample, M. A. Ranzato, L. Denoyer, and ...
M. Artetxe, G. Labaka, and E. Agirre, "Learning Bilingual Word ...
J. Devlin, M. W. Chang, K. Lee, and K. Toutanova, ...
H., Huang, Y. Liang, N. Duan, M. Gong, L. Shou, ...
G. Lample and A. Conneau, "Cross-lingual Language Model Pretraining," ArXiv ...
H. Gonen, S. Ravfogel, Y. Elazar, and Y. Goldberg, "It's ...
R. Samuel, G. A. Bowman, and C. Potts, "The Stanford ...

نمایش کامل مراجع