خلاصه سازی چند سندی با استفاده از متن کاوی و راهکار گراف های رویداد

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,359

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICIKT08_054

تاریخ نمایه سازی: 5 بهمن 1395

Abstract:

با توجه به افزایش حجم اسناد متنی برای پاسخگویی به نیازهای اطلاعاتی کاربران، تکنیک های بازیابی اطلاعات موجود به تنهایی از کارایی مناسب برخوردار نیستند. مطالعه حجم زیاد متن ها برای کاربران بسیار سخت و زمان گیر است و در اختیار داشتن خلاصه ای از مطالب مهم می تواند بسیار مفید باشد. باتوجه به اینکه تعداد اسناد خبری مرتبط با رویدادهای جهان واقعی و اطلاعات رویدادگرا، بهسرعت درحال رشد است بازیابی کارآمد و ارائه اطلاعات مختصر مرتبط با رویداد از اهمیت بسیاری در جلب نظر مخاطبان برخوردار است. در این مقاله راهکاری جدید مبتنی بر گراف رویداد به منظور بازیابی اطلاعات و خلاصه سازی چند سندی معرفی میگردد. در ابتدا از روش فضای بردار وزنی برای تشخیص عبارات تکراری استفاده شده و سپس میزان شباهت نمونه های خبری درقالب اسنیپت های خبری از پیکره متن اصلی و پرس جو با استفاده از ضریب تشابه دوبردار محاسبه میگردد. سپس با استفاده از گراف رویداد، یک مدل نمایش سند مبتنی بر رویداد برای معناشناسی رویدادهای سطح جمله محاسبه می گردد که بر اساس آن اطلاعات مرتبط با رویدادهای توصیف شده در متن فیلتر شده و بازسازی میشود. در این روش با استفاده از هسته گراف ضرب تنسور و کونرمال، شباهت بین پرسوجوها و سندها اندازه گیری می شود. با توجه به کامل نبودن مدلهای موجود، راهکار معرفی شده در این مقاله با تکیه بر گراف رویداد شباهت بین پرسوجوها و سندها با تفکیک هم رخدادی رئوس غیرمتناظر با استفاده از روش استخراج روابط معنایی موجود درمتن و تکنیک های برچسب زنی معنایی لغات، اندازه گیری میشود و همچنین روابط زمانی بین آنها نیز تعیین می گردد. در گام بعد اسناد بر اساس نمرات شباهت بدست آمده رتبه بندی شده. نتایج ارزیابی چهار روش فوق دلالت بر افزایش چشمگیرصحت و دقت مدل پیشنهادی این مقاله در مقایسه با مدلهای فضای بردار وزنی، گراف ضرب کونرمال و گراف ضرب تنسور بر روی مجموعه های آزمایشی رویدادگرای خبری دارد.

Authors

مریم داستانی داکدره

دانشجوی کارشناسی ارشد مهندسی کامپیوتر- نرم افزار - دانشگاه آزاد رشت

فاطمه احمدی آبکناری

استادیار- گروه مهندسی کامپیوتر و فناوری اطلاعات- دانشگاه پیام نور رشت

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • گراسمن، دیوید و افیر فریدر، بازیابی اطلاعات، الگوریتمها و روشهای ...
  • I. Mani, Automatic summarization, Jon Benjamins Publishing Company, 2001. ...
  • Hovy, E., Lin, C. Y., "Automated text summarizatio and the ...
  • A. Mohamed, S. Rajasekaran, "Query-Based Summarization Based on Document Graphs", ...
  • S. Gemnari, P, Sloman, S. A, Malt, B. C, & ...
  • N. Daniel, D.Radev, & T.Allison, "Sub-event based multi- document summarizatiot ...
  • E. Filatova, &V. Hatz ivassiloglou, "Event-based extractive summarization ", In ...
  • R. Mihalcea, P. Tarau, "An algorithm for language independet single ...
  • W.Li, M.Wu, Q.Lu, W. Xu, C. Yuan, Extractive summarizatio using ...
  • J. Atkinson, &R. Munoz, "Rhetoric s-based multi-do cument summarization ", ...
  • E. Canhasi, &I, Kononenko, " Weighted archetypal analysis of the ...
  • Y.Y. Zhao, B. Qin, W.X. Che, and T. Liu, Research ...
  • نمایش کامل مراجع