ارائه یک مدل جدید مبتنی بر گراف جهت خلاصه سازی چند سندی متون

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,101

This Paper With 14 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

COMCONF01_081

تاریخ نمایه سازی: 8 آذر 1394

Abstract:

با توجه به رشد روزافزون مستندات و منابع اینترنتی، نیاز به سیستمهای خلاصهساز بیشتر احساس میشود. سیستمهای خلاصه ساز چندسندی سیستم هایی هستند که مفاهیم اصلی اسناد ورودی را در چندین جمله بیان میکنند. افزونگی، پوشش محتوا و پیوستگی بین جملات، سه چالش اصلی این سیستم ها محسوب میشود .بررسی سیستمهای امروزی نشان میدهد که این چالشها هنوز رفع نشده اند .در این مقاله یک معماری جدید سه لایه مبتنی بر گراف معرفی میشود .هر جمله نشاندهنده ی یک راس در گراف میباشد و شباهت بین جملات، یال های این گراف را تشکیل میدهد. در مرحلهی اول با استفاده از استخراج ویژگیها، برای هر جمله ارزشی تعیین میشود .در مرحلهی دوم یک الگوریتم خوشه بندی معرفی میشود .با استفاده از این الگوریتم، جملاتی که باعث افزونگی میشوند، حذف میشود .در مرحله ی سوم با استفاده از الگوریتم رتبه بندی و تابع هدف، پوشش و پیوستگی جملات خلاصه افزایش مییابد .مهمترین مزیت این مقاله این است که هر سه چالش بیان شده را با هم بهبود میدهد .برای ارزیابی سیستم ارائه شده از مجموعه دادهای DUC استفاده میگردد .بر اساس معیار استاندارد 2002 F ، بهبود قابل توجه سیستم پیشنهادی در مقایسه با سایر سیستم ها مشهود میباشد

Authors

سمیرا مهرنوش

دانشجوی کارشناسی ارشد مهندسی نرم افزار بخش علوم و مهندسی کامپیوتر و فناوری اطلاعات دانشگاه شیراز ایران

سید مصطفی فخر احمد

استادیار بخش علوم و مهندسی کامپیوتر و فناوری اطلاعات دانشگاه شیراز ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • citation-based summarization of Coherentه 4. Abu-Jbara, A. and Radev, D. ...
  • Text Automatic؛" 1.Neto, J. L, Freitas, A. A. and Kaestner, ...
  • text summarization and the SUMMARISI Automated:ه 2. Hovy, E. and ...
  • Radev, _ Allison, T., Blair- Goldensohn, S. and Blitzer, J. ...
  • Wan, X. and Yang, J. (2008), ، 0Multi -document summarization ...
  • Erkan, G. and Radev, D. (2004), Lexrank: graph-based lexical centrality ...
  • Mihalcea, R. (2004), "Graph-based ranking algorithms for sentence extraction, applied ...
  • Mihalcea, R. (2005), "Language independent extractive summarization, _ Proceedings of ...
  • Feng, J., He, X., Konte, B., Bohm, C. and Plant, ...
  • Hatzivas siloglou, V., Klavans, J. L., Holcombe, M. L., Barzilay, ...
  • Radev, D., Jing, H., Stys, M. and Tam, D. (2004), ...
  • Ramanathan, K., S ankaras ubramaniam, Y., Mathur, N. and Gupta, ...
  • Kumar, N., Srinathan, K and Varma, v. (2012), "Using wikipedia ...
  • Gupta, V. K. and Siddiqui, T. J. (2012), ، 0Multi ...
  • Erkan, G. and Radev, D. (2004), "Lexpagerank: prestige in multi ...
  • Mihalcea, R. (2008), "Random Walks on Text Structures, " CICLing, ...
  • Wan, X. (2008), _ _ cument-based hits model for multi- ...
  • Zhang, Z., Ge, S. S. and He, H. (2012), ، ...
  • Chen, H., Jin, H. and Zhao, F. (2014), "Psg: A ...
  • Samei, B., Eshtiagh, M., Keshtkar, F. and Hashemi, S. (2014), ...
  • Ferreira, R., de Souza Cabrat L., Freitas, F., Lins, R. ...
  • Lin C. (2004), Rouge: A package for automatio evaluation of ...
  • نمایش کامل مراجع