بازنمایی کلمات، پایه و اساس بسیاری از وظایف
پردازش زبان طبیعی (NLP) می باشد که معنا و مفهومویژگان را در قالب دنباله ای از اعداد به مدل های پردازش متن منتقل می کند. رویکردهای اخیر برایبازنمایی کلمات که به آنها مدل های تعبیه ی کلمات نیز گفته می شود، دانش موجود در متون را درفضای چند بعدی اعداد حفظ می کند. این رویکردها موجب ارتقای دقت در بسیاری از وظایف NLP مانندطبقه بندی متن، پاسخ به پرسش، استنتاج در متن و تحلیل احساسات شده اند. مدل های تعبیه کلمات کهاکثرا مبتنی بر شبکه های عصبی می باشند، ویژگی های متفاوتی دارند که منجر به تفاوت در نوع و میزانانتقال دانش از متن به مدل می شوند. اگرچه برخی مدل های جدید در وظایف مختلف عملکرد بهتریداشته اند اما هیچ کدام نسبت به دیگری ارجحیت نداشته و در پژوهش های مختلف خواص متفاوتی ازخود نشان داده اند. در این پژوهش ما مهمترین مدل های تعبیه ی کلمات را در دو دسته ی «مدل های مستقل از زمینه کلمات» و «مدل های مبتنی بر زمینه کلمات» مرور کرده ایم و ضمن معرفی روش کار آن ها، به نقد و بررسی چالش های هر مدل پرداخته ایم. ما همچنین به شرح مهمترین ویژگی های اینمدل های تعبیه کلمات و مقایسه ی آنها با هم پرداخته ایم.