بررسی روش های تعبیه ی کلمات در پردازش متون
Publish place: 8th International Conference on Innovative Technologies in Science, Engineering and Technology
Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 558
This Paper With 10 Page And PDF and WORD Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
TETSCONF08_035
تاریخ نمایه سازی: 26 شهریور 1400
Abstract:
بازنمایی کلمات، پایه و اساس بسیاری از وظایف پردازش زبان طبیعی (NLP) می باشد که معنا و مفهومویژگان را در قالب دنباله ای از اعداد به مدل های پردازش متن منتقل می کند. رویکردهای اخیر برایبازنمایی کلمات که به آنها مدل های تعبیه ی کلمات نیز گفته می شود، دانش موجود در متون را درفضای چند بعدی اعداد حفظ می کند. این رویکردها موجب ارتقای دقت در بسیاری از وظایف NLP مانندطبقه بندی متن، پاسخ به پرسش، استنتاج در متن و تحلیل احساسات شده اند. مدل های تعبیه کلمات کهاکثرا مبتنی بر شبکه های عصبی می باشند، ویژگی های متفاوتی دارند که منجر به تفاوت در نوع و میزانانتقال دانش از متن به مدل می شوند. اگرچه برخی مدل های جدید در وظایف مختلف عملکرد بهتریداشته اند اما هیچ کدام نسبت به دیگری ارجحیت نداشته و در پژوهش های مختلف خواص متفاوتی ازخود نشان داده اند. در این پژوهش ما مهمترین مدل های تعبیه ی کلمات را در دو دسته ی «مدل های مستقل از زمینه کلمات» و «مدل های مبتنی بر زمینه کلمات» مرور کرده ایم و ضمن معرفی روش کار آن ها، به نقد و بررسی چالش های هر مدل پرداخته ایم. ما همچنین به شرح مهمترین ویژگی های اینمدل های تعبیه کلمات و مقایسه ی آنها با هم پرداخته ایم.
Keywords:
پردازش زبان طبیعی , یادگیری ماشین , بازنمایی کلمات , تعبیه های مستقل از زمینه کلمات , تعبیه های مبتنی بر زمینه کلمات
Authors
محمد آذری جعفری
کارشناسی ارشد مهندسی فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه قم