CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تحلیل احساسات کاربران در زبان فارسی مبتنی بر ترکیب روابط معنایی و جنگل تصادفی

عنوان مقاله: تحلیل احساسات کاربران در زبان فارسی مبتنی بر ترکیب روابط معنایی و جنگل تصادفی
شناسه ملی مقاله: ICCONF08_102
منتشر شده در هشتمین همایش ملی مطالعات و تحقیقات نوین در حوزه علوم کامپیوتر، برق و مکانیک ایران در سال 1401
مشخصات نویسندگان مقاله:

محمد روستائی - دانشجوی کارشناسی ارشد هوش مصنوعی و رباتیکز دانشگاه جامع امام حسین (ع)
محمدعلی جوادزاده - استادیار دانشگاه جامع امام حسین (ع)

خلاصه مقاله:

تجزیه و تحلیل احساسات نقش مهمی در شرکت ها. به ویژه فروشگاه ها دارد. افزایش دقت در تعیین احساس نظرات مشتریان در مورد محصولات، کمک می کند تا شرایط رقابتی خود را حفظ نمایند. در سال های اخیر عامیانه نوشتن در زبان فارسی رواج بافته است که ساختارمشخصی ندارد. این امر موجب می گردد مرحله پیش پردازش بسیار دشوار گردد. این مشکل اصلی تجزیه و تحلیل احساسات به زبان فارسی است. آنجه این مشکل را تشدید می کند، نبود کتابخانه های مناسب برای پیش پردازش زبان فارسی است؛ در حالی که بیشتر کتابخانه های موجود روی زبان انگلیسی تمرکز دارند. در این پژوهش جهت تشخیص احساسات کاربران سایت دیجی کالا، از نظرات ثبت شده در این سایت استفاده شده است. در تحلیل نظر، از یک فرآیند چند مرحله ای بهره گرفته شده است. در مرحلهی نخست عملیات پاکسازی داده ها صورتمی گیرد و سپس عملیات استخراج ویژگی براساس روابط معنایی FastText انجام می پذیرد. در بخش سوم، عملیات کاهش ویژگی توسط شبکه های باد گیری عمیق انجام شده است. در بخش پایانی جهت طبقه بندی نظرات از الگوریتم جنگل تصادفی بهره گرفته شده است.معیارهای ارزیایی مورد استفاده در این پژوهش دقت، صحت، فراخوان و معیار F بوده که از نتایج آزمایشات به ترتیب مقادیر ۹۸.۵، ۹۷، ۹۸ و۹۷ به دست آمده است. نتایج آزمایش ها نشان دهنده ی برتری روش پیشنهادی در شناسایی تحلیل احساسات کاربران است. این نتایج باروش های TF-IDF و CNN مورد مقایسه قرار گرفته است.



کلمات کلیدی:
تجزیه و تحلیل احساسات، استخراج ویژگی، کاهش ویژگی، شبکه های یادگیری عمیق، طبقه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1620943/