تولید یک مجموعه ی دادگان برای طبقه بندی سیاسی توییت های فارسی و کاربرد آن در پیشبینی گرایش سیاسی افراد

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 341

This Paper With 15 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ECMECONF12_025

تاریخ نمایه سازی: 4 مرداد 1401

Abstract:

با ظهور وب ۲,۰، ارتباطات یک طرفه در اینترنت به ارتباطات دو طرفه تبدیل شده است که در آن کاربران میتوانند آزادانه درباره ی ایده ها، اخبار، محصولات، تصاویر، فیلمها و ... بحث کنند. درنتیجه، با فعالیت گسترده ی کاربران در فضای مجازی شاهد افزایش حجم و تنوع اطلاعات در دسترس هستیم، اما پاسخگویی به نیازهای اطلاعاتی جدید از میان این حجم زیاد از اطلاعات امری دشوار است. توییتر یکی از شبکه های اجتماعی فعال و نخبگانی در بستر وب میباشد که شامل منبعی غنی از اطلاعات است. جهت استخراج سریع دانش از میان این حجم عظیم اطلاعات یکی از روشها استفاده از مدلهای طبقه بندی خودکار است. تشخیص گرایش سیاسی یک توییت و یک شخص مسئله ای مهم و کاربردی است که در زبان فارسی تاکنون به آن پرداخته نشده است. در این پژوهش برآنیم که ابتدا با استفاده از روشهای جمع سپاری یک مجموعه ی داده ی مناسب برای این مسئله ی کاربردی تولید کنیم. در گام دوم قصد داریم با ارائه ی یک دستهبند خودکار، توییتها را در چهار گروه اصلاح طلب، اصول گرا، برانداز و سایر (یا بدون گرایش سیاسی) طبقه بندی کرده و در نهایت با ارائه روش مبتنی بر رایگیری جهتگیری یا گرایش سیاسی یک شخص را استخراج کنیم.

Authors

مهدی دهقان

کارشناسی ارشد هوش مصنوعی، ربانیکز و رایانش شناختی از دانشگاه شهید بهشتی تهران

مهدی فخیمی کامران

دانشجوی دکتری شناخت اجتماعی و پژوهشگر علوم شناختی از دانشگاه شهید بهشتی تهران