مروری بر پرسش و پاسخ جهت استخراج کلمات کلیدی ظاهر نشده و استفاده همزمان از آن با کلمات کلیدی ظاهر شده در متن

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 426

This Paper With 17 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CMECE02_002

تاریخ نمایه سازی: 15 مهر 1399

Abstract:

کلمات کلیدی شامل اطلاعات اصلی است که به افراد کمک می کند تا محتوای متن را درک کنند . استخراج چنین کلماتی، شناسایی خودکار اصطلاحات مهمی است که عناوین اصلی یک سند خاص داده شده را بطور دقیق و مختصر ضبط می کند که مسلماً، این فرآیند یک کار غیر بدیهی است که به تکنیک های پردازش زبان طبیعی زیادی احتیاج دارد. با توجه به اهمیت و ارتباط استخراج کلمات کلیدی با سایر کارهای NLP ، روش های مختلفی برای این فرآیند مطرح شده است. رویکردهای موجود به طور معمول از الگوریتم های یادگیری ماشین استفاده می کنند و انواع ویژگی ها را برای آموزش مدل های خود استخراج می نمایند و به بازدهی عالی می رسند . این رویکردها به طور کلی به سه دسته ی یادگیری با نظارت، بدون نظارت و رویکردهای مبتنی بر یادگیری عمیق تقسیم می شوند . در این مقاله به مرور برخی از کارهای صورت گرفته در دو حوزه ی استخراج کلمات کلیدی و پرسش و پاسخ پرداخته شده است و برای کارهای گفته شده نیز ارزیابی هایی صورت گرفته شده است. نتایج نیز حاکی است که در قسمت پرسش و پاسخ شبکه های LSTM با توجه به ماهیت آن ها برای متن های طولانی بهتر هستند در حالی که شبکه های CNN برای بدست آوردن نمره مطابقت در سطوح مختلف یک سند (سطح کلمه، سطح عبارت، سطح جمله) مناسب می باشند

Keywords:

استخراج کلمات کلیدی ظاهر شده , استخراج کلمات کلیدی ظاهر نشده , حوزه پرسش و پاسخ , حوزه NLP , یادگیری عمیق

Authors

مصطفی رمضانیان

گروه مهندسی کامپیوتر، واحد نیشابور، دانشگاه آزاد اسلامی، نیشابور، ایران

مهرداد جلالی

دانشیار گروه مهندسی کامپیوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران

رضا قائمی

استادیار گروه مهندسی کامپیوتر، واحد قوچان، دانشگاه آزاد اسلامی، قوچان، ایران