CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

افزایش دقت در تجمیع داده های بلادرنگ بزرگ با استفاده از کاهش ویژگی غیرموثر

عنوان مقاله: افزایش دقت در تجمیع داده های بلادرنگ بزرگ با استفاده از کاهش ویژگی غیرموثر
شناسه ملی مقاله: ECTCONF02_022
منتشر شده در دومین کنفرانس ملی مهارت های نوین در مهندسی برق، کامپیوتر و فن آوری ارتباطات در سال 1399
مشخصات نویسندگان مقاله:

صبا چهل امیران - دپارتمان مهندسی برق و کامپیوتر - دانشکده زینب کبری - دانشگاه فنی و حرفه ای استان همدان ایران

خلاصه مقاله:
اصطلاح داده های بزرگ برای داده های محاسباتی و یا اطلاعاتی که می تواند تجزیه و تحلیل شود یا برای استفاده از تکنیک ها و ابزارهای سنتی یادگیری ماشین بکار رود، مفید است. تعریف کلی از داده های بزرگ نشان می دهد کاهش داده های محاسباتی بیش از حد سریع، گسترده و یا بیش از حد برای پردازش سخت هستند. مسئله انتخاب ویژگی، یکی از مسائلی است که در مبحث یادگیری ماشین و همچنین شناسایی الگوی آماری مطرح است. این مسئله در بسیاری از کاربردها (مانند طبقه بندی) اهمیت زیادی دارد، زیرا در این کاربردها تعداد زیادی از ویژگی ها وجود دارد که بسیاری از آنها یا بلا استفاده هستند و یا اینکه بار اطلاعاتی چندانی ندارند. حذف نکردن این ویژگی ها مشکلی از لحاظ اطلاعاتی ایجاد نمی کند ولی بار محاسباتی را برای کاربرد مورد نظر بالا می برد؛ علاوه بر این باعث می شود که اطلاعات غیرمفید زیادی را به همراه داده های مفید ذخیره کنیم ما در این پایان نامه با استفاده از استخراج ویژگی و الگوریتم ژنتیک توانستیم روشی اراله دهیم تا تحلیل نظرات کاربران درباره فیلم های سینمایی را انجام دهیم، در این روش با انتخاب ویژگی هر نظر در قالب یک برداری عددی ذخیره می شود و سپس توسط الگوریتم ژنتیک نوع جمله از نظر مثبت و منفی بودن مشخص شده و تحلیل آماری انجام می شود.

کلمات کلیدی:
انتخاب ویژگی، الگوریتم ژنتیک، نظر کاوی، شبکه های اجتماعی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1041698/