بررسی نظرکاوی جملات فارسی با تکنیک های N-grams

Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 229

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

STCONF04_149

تاریخ نمایه سازی: 26 مهر 1400

Abstract:

در سال های اخیر رشد انبوه محتوای تولید شده توسط کاربران مانند شبکه های اجتماعی و سایت های بازاریابی آنلاین به مردم اجازه می دهد تا احساسات و نظرات خود را در بسیاری از نظرهای مربوط به محصولات و خدمات مختلف به اشتراک بگذارند. تجزیه و تحلیل احساسات منبع مهمی برای تصمیم گیری بهتر می باشد که با استفاده از پردازش زبان طبیعی NLP ، تکنیک های محاسباتی و تجزیه و تحلیل متن برای استخراج قطبیت اسناد بدون ساختار و روش های یادگیری ماشین تحت نظارت و روش های یادگیری عمیق بررسی می شود. پیچیدگی زبان های انسانی و تحلیل احساسات یک زمینه تحقیقاتی چالش برانگیز در علوم رایانه و زبان شناسی محاسباتی ساخته اند. در این پژوهش با استفاده از نظرات فارسی تلفن همراه سایت دیجی کالا در تکنیک های مختلف N-grams و با الگوریتم های یادگیری ماشین از جمله بیز ساده، ماشین بردار پشتیبان، کاهش گرادیان تصادفی، رگرسیون لجستیک و جنگل تصادفی و همچنین استفاده این الگوریتم ها در تکنیک های مختلف N-grams در هفت برند مختلف تلفن همراه از جمله Huawei ، LG ، Samsung ، Sony ، HTC ، Nokia و Apple و به منظور دستیابی به عملکرد آنها براساس پارامترهایی مانند صحت، بازیابی و دقت مورد بررسی قرار داده ایم. در نتیجه در همه روش های N-grams به جز روش سه واژه ای دقت و صحت و بازیابی به دست آمده توسط الگوریتم جنگل تصادفی بین ۸۸ تا ۹۱ درصد و همچنین دقت به دست آمده توسطالگوریتم جنگل تصادفی با میانگین ۹۹ درصد و الگوریتم کاهش گرادیان تصادفی با میانگین ۹۸ درصد در تمام برندهای مختلف عملکرد بهتری نسبت به الگوریتم های دیگر دارند.

Authors

عماد نعمتی

دانشجوی ارشد مهندسی نرم افزار کامپیوتر دانشگاه آزاد اسلامی تهران غرب

پریسا دانشجو

استادیار گروه مهندسی نرم افزار کامپیوتر دانشگاه آزاد اسلامی تهران غرب