The Application of Machine Learning Algorithms for Text Mining based on Sentiment Analysis Approach

Publish Year: 1397
نوع سند: مقاله ژورنالی
زبان: English
View: 181

This Paper With 23 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_JITM-10-2_003

تاریخ نمایه سازی: 26 بهمن 1400

Abstract:

Classification of the cyber texts and comments into two categories of positive and negative sentiment among social media users is of high importance in the research are related to text mining. In this research, we applied supervised classification methods to classify Persian texts based on sentiment in cyber space. The result of this research is in a form of a system that can decide whether a comment which is published in cyber space such as social networks is considered positive or negative. The comments that are published in Persian movie and movie review websites from ۱۳۹۲ to ۱۳۹۵ are considered as the data set for this research. A part of these data are considered as training and others are considered as testing data. Prior to implementing the algorithms, pre-processing activities such as tokenizing, removing stop words, and n-germs process were applied on the texts. Naïve Bayes, Neural Networks and support vector machine were used for text classification in this study. Out of sample tests showed that there is no evidence indicating that the accuracy of SVM approach is statistically higher than Naïve Bayes or that the accuracy of Naïve Bayes is not statistically higher than NN approach. However, the researchers can conclude that the accuracy of the classification using SVM approach is statistically higher than the accuracy of NN approach in ۵% confidence level.

Authors

رضا سمیع زاده

Assistant Prof. of Industrial Engineering, Alzahra University, Tehran, Iran

الناز محمودی سعید آباد

MSc. Student of Industrial Engineering, Alzahra University, Tehran, Iran

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • اسماعیلی، مهدی (۱۳۹۱). مفاهیم و تکنیک‎های داده‎کاوی، تهران، نیاز دانش ...
  • نیکنام، فرزاد؛ نیک نفس، علی اکبر (۱۳۹۵). بهبود روش‎های متن‎کاوی ...
  • ReferencesAggarwal, C. C., & Zhai, C. (Eds.). (۲۰۱۲). Mining text data. ...
  • Bhadane, C., Dalal, H., & Doshi, H. (۲۰۱۵). Sentiment analysis: ...
  • Esmaili, M. (۲۰۱۲). Concepts and techniques of data mainig.Niaz Danesh ...
  • He, W., Zha, S., & Li, L. (۲۰۱۳). Social media ...
  • Irfan, R., King, C. K., Grages, D., Ewen, S., Khan, ...
  • Jeyapriya, A., & Selvi, C. K. (۲۰۱۵, February). Extracting aspects ...
  • Jotheeswaran, J., & Kumaraswamy, Y. S. (۲۰۱۳). Opinion mining using ...
  • Kennedy, A., & Inkpen, D. (۲۰۰۶). Sentiment classification of movie ...
  • Medhat, W., Hassan, A., & Korashy, H. (۲۰۱۴). Sentiment analysis ...
  • Moraes, R., Valiati, J. F., & Neto, W. P. G. ...
  • Mosley Jr, R. C. (۲۰۱۲). Social media analytics: Data mining ...
  • Niknam, F., Niknafas, A.A. (۲۰۱۶). Improving Text Mining Methods in ...
  • Ravichandran, M., & Kulanthaivel, G. (۲۰۱۴). Twitter Sentiment Mining (TSM) ...
  • Smeureanu, I., & Bucur, C. (۲۰۱۲). Applying supervised opinion mining ...
  • Vinodhini, G., & Chandrasekaran, R. M. (۲۰۱۲). Sentiment analysis and ...
  • Xu, K., Liao, S. S., Li, J., & Song, Y. ...
  • نمایش کامل مراجع