CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص موجودیت های اسمی بر پایه شبکه های عصبی با حافظه بلندمدت-کوتاه مدت

عنوان مقاله: تشخیص موجودیت های اسمی بر پایه شبکه های عصبی با حافظه بلندمدت-کوتاه مدت
شناسه ملی مقاله: JR_CSJI-5-1_002
منتشر شده در در سال 1399
مشخصات نویسندگان مقاله:

نعیمه علی پور - دانشجوی کارشناسی ارشد، دانشکده مهندسی فناوری اطلاعات و کامپیوتر دانشگاه صنعتی ارومیه ارومیه ایران
جعفر طهمورث نژاد - استادیار دانشکده مهندسی فناوری اطلاعات و کامپیوتر دانشگاه صنعتی ارومیه ارومیه ایران

خلاصه مقاله:
مسئله شناسایی موجودیت های اسمی به عنوان یکی از شاخه های پردازش زبان طبیعی و زیرمجموعه ای از استخراج اطلاعات به شمار می رود. هدف اصلی در تشخیص موجودیت های اسمی، دسته بندی اسامی خاص متن با برچسب هایی مانند شخص، مکان و سازمان است. امروزه اکثر روش هایی که برای این منظور معرفی شده اند سعی در استفاده از ویژگی هایی دارند که مختص به یک زبان خاص نیست. از جمله این روش ها می توان به استفاده از شبکه عصبی با حافظه بلند مدت – کوتاه مدت اشاره کرد. آموزش این شبکه های عصبی به وسیله استخراج ویژگی ها از بردارهای کلمات در سطح نویسه و بردارهای کلمات از پیش آموزش دیده انجام می گیرد. دراین مقاله مدل جدیدی برای ساخت نمایش های برداری کلمات پیشنهاد می شود که از ترکیب بردار نحوی کلمه با دو بردار کلمه قبلی به دست می آید. بردار نحوی کلمه شامل اطلاعات نحوی موجود در جمله مانند موقعیت کلمه در جمله، نقش کلمات و ارتباط نحوی آن ها با یکدیگر است. استفاده از این روش باعث توسعه سیستم هایی می شود که کمترین وابستگی را به دامنه دارند. کارایی روش پیشنهادی بر روی مجموعه داده موجودیت های اسمی مورد ارزیابی قرار گرفته است. نتایج به دست آمده، نشان دهنده بهبود قابل ملاحظه ای در مقایسه با سایر روش های مطرح در حوزه تشخیص موجودیت های اسمی می باشد.

کلمات کلیدی:
پردازش زبان طبیعی, تشخیص موجودیتهای اسمی, نمایش برداری کلمات, شبکه عصبی با حافظه بلند مدت – کوتاه مدت پایدار

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1901515/