CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

سیستم پرسش و پاسخ به زبان طبیعی در حوزه زندگی نامه به زبان فارسی

عنوان مقاله: سیستم پرسش و پاسخ به زبان طبیعی در حوزه زندگی نامه به زبان فارسی
شناسه ملی مقاله: IDMC02_112
منتشر شده در دومین کنفرانس داده کاوی ایران در سال 1387
مشخصات نویسندگان مقاله:

مسلم محمدی
مرتضی آنالویی
بهروز مینایی بیدگلی

خلاصه مقاله:
در این مقاله یک روش مبتنی بر رده بندی و وز ندهی کلمات برای پاس خدهی به سوالات در حوزه زندگی نامه پیشنهاد شده است. با استفاده از یک پیکره از پاس خهایی که به صورت دستی استخراج شد هاند، کلمات فنی در این حوزه، تعیین م یشوند و سپس این کلمات وزن دهی شده و برای رد هبندی سوالات مطرح شده و جملات کاندید برای پاسخ ، مورد استفاده قرار می گیرند. ما در این حوزه انواع سوالات را به سوالات در زمینه " ناریخ ولادت" ،" تاریخ وفات" ، "محل ولادت"، "محل وفات" ویا ترکیبی از آنها محدود کرده ایم. ابتدا پرسش به زبان طبیعی در زمین ههای ذکز شده پرسیده م یشود و سپس نوع سوال با توجه به کلمات به کار رفته در آن و کلمات فنی هر نوع سوال، تعیین می شود. در مرحله بعدی اسناد مرتبط با پرسش استخراج شده و به قطعات کوچکتر شکسته می شود. در این مرحله، جملات موجود در قطعه مت نها، رده بندی شده و جملات ه منوع با پرسش، استخراج شده و میزان مشابهت آن با پرسش ارزیابی می گردد. در انتها جملاتی که بیشترین مشابهت را دارند به عنوان پاسخ برگردانده م یشوند. با استفاده از این روش در واقع از تمام الگوهای پاسخ استفاده می شود ولی هیچ نیازی به ایجاد الگوها نمی باشد و در واقع یک روش مبتنی بر بازیابی اطلاعات توسعه داده شده می باشد. در این روش میزان بازخوانی پائین بوده ولی میزان دقت خیلی امیدوار کننده است

کلمات کلیدی:
سیستم پرسش و پاسخ ، بازیابی اطلاعات ، پردازش زبان طبیعی ، سوالات با جواب کوتاه ، زبان فارسی ، حوزه زندگی نامه، تحلیل پرسش، تطبیق الگو

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/70502/