افزایش دقت در تجمیع داده های بلادرنگ بزرگ با استفاده از کاهش ویژگی غیرموثر

صبا, چهل امیران

افزایش دقت در تجمیع داده های بلادرنگ بزرگ با استفاده از کاهش ویژگی غیرموثر

عنوان مقاله: افزایش دقت در تجمیع داده های بلادرنگ بزرگ با استفاده از کاهش ویژگی غیرموثر
شناسه ملی مقاله: JR_JWS-1-1_004
منتشر شده در پاییز در سال 1399

مشخصات نویسندگان مقاله:

صبا چهل امیران - دپارتمان مهندسی برق و کامپیوتر، دانشکده زینب کبری، دانشگاه فنی و حرفه ای استان همدان، همدان، ایران

خلاصه مقاله:

اصطلاح داده های بزرگ برای داده های محاسباتی و یا اطلاعاتی که می تواند تجزیه و تحلیل شود یا برای استفاده از تکنیک هاو ابزارهای سنتی یادگیری ماشین به کار رود، مفید است. تعریف کلی از داده های بزرگ نشان می دهد که داده های محاسباتی بیش ازحد سریع، گسترده و یا بیش از حد برای پردازش سخت هستند. مسئله انتخاب ویژگی، یکی از مسائلی است که در مبحث یادگیریماشین و همچنین شناسایی الگوی آماری مطرح است. این مسئله در بسیاری از کاربردها (مانند طبقه بندی) اهمیت زیادی دارد، زیرادر این کاربردها تعداد زیادی از ویژگی ها وجود دارد که بسیاری از آنها یا بلااستفاده هستند و یا اینکه بار اطلاعاتی چندانی ندارند.حذف نکردن این ویژگی ها مشکلی از لحاظ اطلاعاتی ایجاد نمی کند، ولی بار محاسباتی را برای کاربرد مورد نظر بالا می برد؛ و علاوه براین باعث می شود که اطلاعات غیرمفید زیادی را به همراه داده های مفید ذخیره گردد. در این پژوهش با استفاده از استخراج ویژگی والگوریتم ژنتیک روشی ارائه شده است تا تحلیل نظرات کاربران درباره فیلم های سینمایی را انجام گیرد، در این روش با انتخاب ویژگیهر نظر در قالب یک برداری عددی ذخیره می شود و سپس توسط الگوریتم ژنتیک نوع جمله از نظر مثبت و منفی بودن مشخص شدهو تحلیل آماری انجام می شود.

کلمات کلیدی:

انتخاب ویژگی، الگوریتم ژنتیک، نظرکاوی، شبکه های اجتماعی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1351976/