ارائه روشی برپایه متن کاوی برای استخراج اطلاعات آب و هوا

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 568

This Paper With 13 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

FBFI01_151

تاریخ نمایه سازی: 9 مرداد 1395

Abstract:

با توجه به ازدیاد بیش از حد داده ها در فضای مجازی و همچنین زیاد شدن تعداد پایگاه های اینترنتی، داده های ساخت نیافته مانند داده های متنی و وب نیز روز به روز در حال افزایش هستند. با اکتشاف در این داده ها می توان الگوهای جذابی را از آن ها استخراج نمود. یکی از روش های استخراج الگو در این نوع داده ها روش های متن کاوی و داده کاوی می باشند که الگوریتم های متعددی را به منظور کشف دانش از داده های متنی موجود در وب محیا کرده اند. از طرف دیگر، هر روز نیاز بیشتری در خصوص استفاده از داده های موجود به منظور استخراج دانش و استفاده از این دانش در زندگی روزمره احساس می شود. بعنوان مثال می توان براساس داده ها و اخبار موجود آب و هوا که در وب سایت های مختلف منتشر می شوند، مدلی به منظور پیش بینی وضعیت آب و هوا بطور خودکار تهیه نمود که وضعیت لحظه ای آب و هوا را براساس استخراج متون و متن کاوی و با استفاده از روش های داده کاوی تحلیل نماید. در این تحقیق هدف پیش بینی آب و هوا براساس متن کاوی اخبار می باشد. به این منظور در حدود 320 اخبار از سایت های مختلف جمع آوری و برچسب گذاری شدند. این دسته بندی دو رده هوای مطلوب و هوای نامطلوب را شامل می شود. سپس با استفاده از تکنیک های متن کاوی مانند قطعه قطعه کردن متن، ویژگی های متنی استخراج گردید. در مرحله آماده سازی روش انتخاب ویژگی های تأثیرگذار برروی داده ها اعمال شد. سپس با استفاده از الگوریتم های مدل سازی شبکه های عصبی مصنوعی، درخت تصمیم، بیز ساده و K نزدیکترین همسایگی مدل سازی به منظور پیش بینی محتوای متن صورت پذیرفت. درنهایت مشخص شد که روش شبکه های عصبی مصنوعی با استفاده از انتخاب ویژگی های تأثیرگذار به روش شاخص سود اطلاعاتی با کسب شاخص دقت 97% و شاخص F برابر با 96% از سایر روش ها عملکرد بهتری در تشخیص متون داشته است.

Authors

توحید باقری زنده دل

گروه کامپیوتر، واحد گرمی، دانشگاه آزاد اسلامی، گرمی، ایران

محمدعلی بالافر

گروه فناوری اطلاعات، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Azevedo A. Santos M. 2008. KDD, SEMMA and CRISP-DM: a ...
  • Berry M. Linoff G. 1997. Data mining techniques: for marketing, ...
  • Dorre J. Gerstl P. Seiffert R. 1999. "Text Mining: Finding ...
  • Fayyad U. Piatetsky -Shapiro G. Smyth P. 1996. From data ...
  • Ghosh S. Nag A. 2011. Weather Data Mining using Artificial ...
  • Han J. Kamber M. Pei J. 2006. Data mining: concepts ...
  • Hand D. Henley W. 1997. Statistical classificatio methods in conSumeg ...
  • IBM. 201 1. Available from: http ://www _ storagenew sletter. ...
  • Larose D. 2005. Discovering knowledge in data: an introduction to ...
  • Naisbitt J. 1986. Megatrends, 6th ed., Warner Books, New York. ...
  • Nikam V. Veermata J. 2013. Modeling Rainfall Prediction Using Data ...
  • Piatetsky- Shapiro G. 2013. Available from: http : //www .kdnuggets ...
  • Raymond J, Mooney U, Nahm Y. 2002. Text Mining with ...
  • Rohanizadeh S. Moghadam M. 2009. A Proposed Data Mining Methodology ...
  • نمایش کامل مراجع