شناسایی کنش گفتار با استفاده از ویژگی های آماری و ساختاری در زبان فارسی
Publish place: 11th Intelligent Systems Conference
Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 862
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICS11_001
تاریخ نمایه سازی: 14 مهر 1392
Abstract:
هدف از این پژوهش یافتن کنش گفتاری برای استفاده در سامانه های هوشمند پردازش متن فارسی مانند تبدیل متن به گفتار، ترجمه ماشینی، بازیابی اطلاعات، خلاصه سازی متون حساس به کنش های گفتاری می باشد. در این مقاله شش روش مختلف برای انتخاب ویژگی ها در ماشین شناسایی کنش گفتاری مورد آزمایش قرار گرفت. پنج عدد از این الگوریتم ها براساس روش یادگیری ماشین و استخراج ویژگی ها برمبنای TF-IDF و مقوله واژگانی، آموزش و تست شدند. یک روش نیز براساس ویژگی های ساختاری جملات فارسی، مورد بررسی قرار گرفت. درستی هر شش الگوریتم براساس ارزیابی متقاطع 5 باره 1 ارزیابی شد، با توجه به آزمون های تجربی که بروی یک مجموعه داده واحد انجام گردید، الگوریتمی که ویژگی های آن براساس TF-IDF – Unigarm و TF-IDF – bigram و ساختار جملات فارسی پیاده سازی شده است، بیشترین درستی (معادل 93 %) را در برداشت.
Keywords:
Authors
آرش خوشنود
دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر
محمدمهدی همایونپور
هیات علمی دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی امیرکبیر
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :