ارایه یک روش در طبقه بندی نظرات کاربران با استفاده از یادگیری ماشین و الگوریتم رای گیری

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 842

This Paper With 6 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CMTS01_263

تاریخ نمایه سازی: 17 آبان 1396

Abstract:

با پیشرفت تکنولوژی و گسترش شبکه جهانی وب، وب بستر مناسبی برای آگاهی از یک محصول یا خدمات یا خرید محصول یا خدمات شده است. در بسیاری از شبکه های اجتماعی مثل اینستاگرام یا بلاگ های شخصی یا وبسایت کمپانی ها کاربران نظرات خود را راجع به یک محصول یا خدمات درج نموده اند. این نظرات از آن جهت با ارزش است که باعث جذب یا دفع مشتری بالقوه می شود یا می تواند کمپانی را در گرفتن بازخورد از یک محصول و ارایه یک محصول بهتر یا استراتژی تولید محصول جدید یاری دهد. در نتیجه حجم زیادی اطلاعات به صورت غیر ساخت یافته وجود دارد که استخراج اطلاعات دلخواه از آنها کار دشواری است. عقیده کاوی فرآیند تحلیل نظرات، عقاید و احساسات کاربران است که از نقد ها و نظراتی که در مورد یک موضوع خاص نوشته اند استخراج می شود. بیشترین و موفق ترین روش هایی که انجام شده با استفاده از روش های یادگیری ماشین است. در این مقاله، در بین انواع روش های مختلف یادگیری ماشین، از الگوریتمی ابداعی به نام رای دهی استفاده شده است. این الگوریتم از تلفیق الگوریتم های موجود و رای گرفتن از تمام آنها اقدام به جمع آوری رای ها کرده و رای خود را مطابق رای اکثریت تعیین می کند. در این الگوریتم یک سری مجموعه استاندارد نظرات کاربران در مورد فیلم ها، برای آموزش و ارزیابی الگوریتم به کار گرفته شده و این نمونه ها پیش پردازش و کلمات زاید آن ها حذف شده است. ویژگی های اساسی این نظرات به کمک روش های انتخاب واژگان انتخاب می شود و با توجه به داده های آموزشی که برچسب مثبت یا منفی دارند مشخص می گردد که کدام کلمات بار مثبت و منفی دارند سپس با استفاده از الگوریتم های پردازش زبان طبیعی همچون بیز مدل آموزشی ساخته می شود. الگوریتم هایی که با این داده های آموزشی مدل می سازند 7 مورد هستند که عبارتند از 1- بیز ساده شامل گاوسین ، مالتی نو مینال و برنولی 2- ماشین بردار پشتیبان شامل svc و svc خطی 3- مدل های خطی شامل رگرسیون منطقی و کلاسیفایر گرادیان نزولی تصادفی . حالا الگوریتم ارایه شده با نام الگوریتم رای دهی برای هر قلم داده بررسی می کند که رای اکثریت با چیست و رای خود را رای اکثریت قرار می دهد. هدف از روش پیشنهادی ارایه یک الگوریتم جدید برای شناسایی نظرات مثبت و منفی با بهترین مقادیر ارزیابی نسبت به سایر روش ها می-باشد.

Authors

الهام مجیدی

گروه کارشناسی ارشد، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، اصفهان، ایران

ایوب باقری

استادیار گروه مهندسی کامپیوتر، دانشگاه کاشان، کاشان، اصفهان، ایران