تولید یک مجموعه ی دادگان برای طبقه بندی سیاسی توییت های فارسی و کاربرد آن در پیشبینی گرایش سیاسی افراد

مهدی, دهقان; مهدی, فخیمی کامران

تولید یک مجموعه ی دادگان برای طبقه بندی سیاسی توییت های فارسی و کاربرد آن در پیشبینی گرایش سیاسی افراد

عنوان مقاله: تولید یک مجموعه ی دادگان برای طبقه بندی سیاسی توییت های فارسی و کاربرد آن در پیشبینی گرایش سیاسی افراد
شناسه ملی مقاله: ECMECONF12_025
منتشر شده در دوازدهمین کنفرانس ملی پژوهش های کاربردی در علوم برق، کامپیوتر و مهندسی پزشکی در سال 1401

مشخصات نویسندگان مقاله:

مهدی دهقان - کارشناسی ارشد هوش مصنوعی، ربانیکز و رایانش شناختی از دانشگاه شهید بهشتی تهران
مهدی فخیمی کامران - دانشجوی دکتری شناخت اجتماعی و پژوهشگر علوم شناختی از دانشگاه شهید بهشتی تهران

خلاصه مقاله:

با ظهور وب ۲,۰، ارتباطات یک طرفه در اینترنت به ارتباطات دو طرفه تبدیل شده است که در آن کاربران میتوانند آزادانه درباره ی ایده ها، اخبار، محصولات، تصاویر، فیلمها و ... بحث کنند. درنتیجه، با فعالیت گسترده ی کاربران در فضای مجازی شاهد افزایش حجم و تنوع اطلاعات در دسترس هستیم، اما پاسخگویی به نیازهای اطلاعاتی جدید از میان این حجم زیاد از اطلاعات امری دشوار است. توییتر یکی از شبکه های اجتماعی فعال و نخبگانی در بستر وب میباشد که شامل منبعی غنی از اطلاعات است. جهت استخراج سریع دانش از میان این حجم عظیم اطلاعات یکی از روشها استفاده از مدلهای طبقه بندی خودکار است. تشخیص گرایش سیاسی یک توییت و یک شخص مسئله ای مهم و کاربردی است که در زبان فارسی تاکنون به آن پرداخته نشده است. در این پژوهش برآنیم که ابتدا با استفاده از روشهای جمع سپاری یک مجموعه ی داده ی مناسب برای این مسئله ی کاربردی تولید کنیم. در گام دوم قصد داریم با ارائه ی یک دستهبند خودکار، توییتها را در چهار گروه اصلاح طلب، اصول گرا، برانداز و سایر (یا بدون گرایش سیاسی) طبقه بندی کرده و در نهایت با ارائه روش مبتنی بر رایگیری جهتگیری یا گرایش سیاسی یک شخص را استخراج کنیم.

کلمات کلیدی:

توییتر، برت، گرایش سیاسی، طبقه بندی خودکار، جمع سپاری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1490344/