بیست و هشتمین کنفرانس بین المللی انجمن کامپیوتر ایران تهیە دادگان و مدل پایه برای گفتگوگر با قابلیت استخراج اطلاعات

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 322

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CSICC28_024

تاریخ نمایه سازی: 27 اسفند 1401

Abstract:

گفتگو گر در چت بات یکی از اجزای اصلی در هوشمند سازی تعامل انسان و رایانه به شمار آمده و در سال های اخیر پژوهش های زیادی در این زمینه شکل گرفته است.در این مقاله،گفتگوگری فارسی پیشنهاد شده است که می تواند با کاربر حول مسائل روزمره گفتگو کره و اطلاعات شخصی همچون نام فرد،سن،شغل،تعداد فرزندان و ... را استخراج نماید.بنابراین ،سیستم باید حداقل سوال مستقیم را مطرح کرده و در عوض،خود را ترغیب به بیان اطلاعات نماید.اطلاعات استخراج شده از این گفتگو می تواند در گام بعد در سیستم هایی همچون توصیه گرها مورد استفاده قرار گیرد.برای این منظور،مجموعه داده ای به روش خزش،ترجمه بخشی از پیکره پرسوناچت و همچنین راه اندازی سامانه ای بر خط جمع آوری شد و بعد از برچسب زنی،با مدلی مبتنی بر برت،پایه ای برای توسعه واحد درک معنا قرار گرفت.با افزونه سازی نیمه خودکار این داده ها برای سه شکاف پر تکرار نام،شغل و سرگرمی ،عملکرد مدل برای شکاف بر اساس F۱ به ۸۱٪ و بر حسب دقت هم برای تعیین موضوع کلی گفته به ۱/۹۰٪ رسید.در واحد تولید پاسخ هم با آموزش مدل دنباله به دنباله بر روی تمام داده ها،سرگشتگی بر روی مجموعه آزمون به ۸۱/۱ و ROUGE – ۱ به ۷/۰ رسید

Authors

پگاه صفری

دانشجوی دکتری هوش مصنوعی و رباتیکز ، دانشکده برق و کامپیوتر ، دانشگاه شهید بهشتی، تهران

مهرنوش شمس فرد

دانشیار، گروه هوش مصنوعی ، رباتیک و رایانش شناختی، دانشگاه شهید بهشتی ، تهران