استخراج کلمات کلیدی بصورت مستقل از زبان

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 769

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCC03_102

تاریخ نمایه سازی: 6 اردیبهشت 1396

Abstract:

بحث اطلاعات، بازیابی و مدیریت آن از منظر اقتصادی، اجتماعی، سیاسی و امنیتی اهمیت بسیار زیادی برای کشورهایمختلف و کمپانی های بزرگ حوزه اطلاعات و فن آوری اطلاعات دارند. اولین گام در این حوزه، شناسایی و استخراج کلمات کلیدی از متون می باشد. یکی از چالش های عمده بر سر راه این امر، وجود زبان های بسیار متنوع برای اطلاعات متنی و وابستگی روش های موجود استخراج کلمات کلیدی به نوع زبان و ساختار کلامی آن زبان خاص می باشد. لذا هدف این پژوهش، طراحی الگوریتمی مستقل از زبان به منظور استخراج کلمات کلیدی می باشد. از این رو با تمرکز روی خاصیت تکرار کلمات کلیدی در هر متن و نسبت تکرار آن در سایر متون و با کمک از الگوریتم TF_IDF این امر انجام شده است و در نهایت میانگین بیشترین تکرار به عنوان کلمه کلیدی انتخاب می گردد. عملکرد الگوریتم پیشنهادی نیز توسط معیار نرخ دقت تشخیص مورد ارزیابی قرار گرفته است. اگرچه کارهای مشابه در این زمینه به صورت مستقل از زبان وجود نداشته ولی مقایسه عملکرد با کارهای نزدیک در حوزه استخراج کلمات کلیدی وابسته به زبان، حکایت از عملکرد قابل قبول الگوریتم پیشنهادی را دارد. لازم به ذکر است که این الگوریتم با الگوریتم مبتنیبر گراف که فقط برای زبان انگلیسی پیاده سازی شده مقایسه گردیده است، که نرخ دقت کلی الگوریتم پیشنهادی83.34 درصد بوده است.

Authors

بهاره هاشم زاده

مربی گروه کامپیوتر و فناوری اطلاعات، دانشگاه تربت حیدریه

علی ماروسی

استادیار گروه کامپیوتر و فناوری اطلاعات، دانشگاه تربت حیدریه

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Abilhoa, W. D., & de Castro, L. N. (2014). A ...
  • Ali, C. B., Wang, R., & Haddad, H. (2015). A ...
  • Balagopalan, A., Ba lasu bramanian, L. L., Ba lasu bramanian, ...
  • Beliga, S., Mestrovic, A., & Martincic-I psic, S. (2015). An ...
  • Bellachia, A., & Al-Dhelaan, M. (2012). Ne-rank: A novel graph-based ...
  • Boudin, F., & Morin, E. (2013). Keyphrase Extraction for N-best ...
  • Cambria, E., & White, _ (2014). Jumping NLP curves: a ...
  • Caragea, C., Bulgarov, F. A., Godea, A., & Gollapalli, . ...
  • Ferrara, E., De Meo, P., Fiumara, G., & Baumgartner, R. ...
  • Gupta, A., Dixit, A., & Sharma, A. (2014). A novel ...
  • Habibi, M., & Popescu-Belis, A. (2015). Keyword extraction and clustering ...
  • Haggag, M. H. (2013). Keyword Extraction using Semantic Analysis. International ...
  • Hashemi, H. B., & Shakery, A. (2014). Mining a Persia ...
  • Jain, V., & Prasad, S. (2014). Ontology based information retrieval ...
  • Jiang, J. (2012). Information extraction from text Mining text data ...
  • Kim, S. N., Medelyan, O., Kan, M.-Y., & Baldwin, T. ...
  • Lee, L. H., Isa, D., Choo, W. O., & Chue, ...
  • Luo, Z., Tang, J., & Wang, T. (2013). Improving keyphrase ...
  • Nabhan, A. R., & Shaalan, K. (2016). Keyword Identification Using ...
  • Onan, A., Korukoglu, S., & Bulut, H. (2016). Ensemble of ...
  • Rousseau, F., & Vazirgiannis, M. (2015). Main core retention on ...
  • Savic, M., Rakic, G., Budimac, Z., & Ivanovic, M. (2014). ...
  • Sheeba, J., & Viveka nandan, K. (2012). Improved Unsupervised Framework ...
  • Shrawankar, U., & Wankhede, K. (2016). Construction of News Headline ...
  • Siddiqi, S., & Sharan, A. (2015). Keyword and keyphrase extraction ...
  • Ghahremani, P., Zhang, X., et al. (2014). A , Trmal, ...
  • Wang, R., Liu, W., & Mcdonald, C. (2014). How preprocessing ...
  • Xie, F., Wu, X., & Zhu, X. (2014). Docu ment-specific ...
  • V. L., & Cramer, N. O. (2012). Rapid automatic , ...
  • نمایش کامل مراجع