تشخیص هرزنظرهای کاربران در زبان فارسی با کاربست الگوریتم های یادگیری با نظارت: مطالعه موردی درحوزه هتلداری داخلی

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 502

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICFUZZYS19_011

تاریخ نمایه سازی: 11 اردیبهشت 1400

Abstract:

همگام با توسعه شبکه های اجتماعی، استفاده روزافزون کاربران از نظرات درج شده برای تصمیم گیری در حوزه هایی چون خرید، رای دادن در انتخابات و... به پدیده ای با کاربرد چشمگیر بدل شده است. چالش این حوزه، وجود هرزنظر با تکیه بر این واقعیت است که یک فرد بدون ترس از افشای هویت واقعی از هر نقطه جهان می تواند به راحتی به بیان نظرات خود با اهداف مخرب در رسانه های اجتماعی اقدام کند. از این رو نظرات جعلی و هرز را برای ترویج یا بی اعتبار کردن محصولات، خدمات، سازمان ها یا افراد، منتشر سازد. تشخیص صحیح هرزنظر یک مساله مهم در حوزه نظرکاوی است زیرا علاوه بر وابستگی بسیار زیاد الگوریتم به ساختارهای زبانی، اعمال الگوریتم های هرزنظر از یک زبان به زبان دیگر سخت و یا غیرممکن است بنابراین یافتن نظرات جعلی و ساخت الگوریتمی قدرتمند تنها با تکیه بر اطلاعات موجود در متن نظر، ممکن نیست. مقاله حاضر با نوآوری در سه بخش در این حوزه به ترتیب با کار در زبان فارسی، استخراج نظر در سطح جمله و سند و ارائه مجموعه ای از ویژگی های بدیع ترکیب شده از اطلاعات متن، فراداده های آن، خصوصیات موجودیت و ویژگی های احساسی، به نظرکاوی نظرات فارسی درج شده کاربران هتل های ایران می پردازد و مساله تشخیص هرزنظر را به عنوان یک مساله دسته بندی دو دسته ای نگریسته و با هشت روش یادگیری با نظارت، مدلسازی می نماید. برای ارزیابی نتایج با استفاده از پارامترهای صحت، فراخوانی و دقت، درخت تصمیم به همراه دو دسته بند ترکیبی AdaBoost , Bagging به عنوان بهترین دسته بندها در تشخیص هرزنظر با مجموعه ویژگی های طراحی شده در این پژوهش شناسایی شدند. همچنین تشخیص هرزنظر مبتنی بر مجموعه ویژگی های این مقاله، با دو مجموعه جامع دیگر از ویژگی ها در سایر پژوهش ها، مقایسه شد. نتایج حاکی از برتری هفت مدل مقاله با مجموعه ویژگی های ارائه شده نسبت به دو مجموعه مقالات دیگر است.

Authors

سپیده جمشیدی نژاد

دانشجوی دکتری، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی واحد رشت

فاطمه احمدی آبکناری

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه پیام نور رشت

پیمان بیات

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه آزاد اسلامی واحد رشت