CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

درک معنا در سامانه محاوره مبتنی بر متن برای حوزه ذخیره بلیت

عنوان مقاله: درک معنا در سامانه محاوره مبتنی بر متن برای حوزه ذخیره بلیت
شناسه ملی مقاله: JR_PAZAND-8-30_003
منتشر شده در در سال 1391
مشخصات نویسندگان مقاله:

پریا جمشیدلو - دانشجوی کارشناسی ارشد، زبان شناسی رایانشی، مرکز زبان ها و زبان شناسی، دانشگاه صنعتی شریف
محمد بحرانی - استادیار، گروه زبان شناسی رایانشی، مرکز زبان ها و زبان شناسی، دانشگاه صنعتی شریف

خلاصه مقاله:
درک زبان محاوره حوزه خاصی از درک زبان طبیعی را شامل می شود که در آن جملات بیان شده توسط کاربر به اندازه جملات زبان نوشتاری تابع دستور زبان نیستند. در این مقاله، سامانه محاوره مبتنی بر متن برای استخراج معنای جملات محاوره‎ای مربوط به حوزه ذخیره بلیت معرفی می­شود. در طراحی این سامانه از شیوه های مبتنی بر داده استفاده شده است. معماری آن شامل دو بخش اصلی استخراج متغیرها و انتساب محتمل ترین برچسب های معنایی به دنباله ای از کلمات است. برای این کار از الگوی مخفی مارکوف استفاده می­شود. برچسب زنی معنایی دنباله کلمات با استفاده از الگوریتم ویتربی صورت می گیرد. بدین منظور، ابتدا پیکره ای از جملات مورد استفاده در حوزه ذخیره بلیت جمع آوری و سپس به هر کلمه یا ترکیبی از کلمات یک برچسب معنایی تخصیص داده می­شود. در مرحله آموزش با استفاده از پیکره برچسب خورده، دنباله برچسب های ممکن برای توالی کلمات مختلف یاد گرفته می شود. در مرحله آزمون با استفاده از احتمالات استخراج شده از مرحله آموزش، محتمل ترین برچسب معنایی برای هر کلمه یا ترکیبی از کلمات پیدا می شود. بر اساس آزمایش های انجام شده، دقت سامانه پیشنهادی در تشخیص سه برچسب کلیدی مبدا، مقصد و تاریخ ۹۱ درصد است.    

کلمات کلیدی:
درک معنا, سامانه محاوره ای, روش مبتنی بر داده, الگوی مخفی مارکوف, الگوریتم ویتربی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1381700/