تحلیل آماری اخبار جعلی فارسی مربوط به کوید-۱۹
Publish place: Iranian Journal of Sociolinguistics، Vol: 5، Issue: 4
Publish Year: 1401
نوع سند: مقاله ژورنالی
زبان: Persian
View: 111
This Paper With 18 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_SOCG-5-4_004
تاریخ نمایه سازی: 5 اردیبهشت 1402
Abstract:
در این پژوهش تلاش می شود با استفاده از تحلیل آماری،ویژگی های اخبار جعلی فارسی مربوط به کوید-۱۹ بررسی گردد.برای این هدف،ابتدا یک پیکره زبانی که حاوی اخبار موثق و جعلی در حوزه کرونا است تهیه می شود.سپس الگوهای زبانی این دو دسته داده و همچنین دو تحلیل آماری مقدار اطلاعات و خوانایی اخبار موثق و جعلی مورد بررسی قرار گرفته و با یکدیگر مقایسه می شود.براساس اطلاعات استخراج شده و نتایج عملی به دست آمده از پیکره خبرهای جعلی،الگوهای زبانی مشترک بین این دو دسته داده وجود دارد.همچنین،مقدار اطلاعات در اخبار موثق براساس دو معیار آنتروپی و شگفتی بیشتر از اخبار جعلی است.همچنین سطح خوانایی خبرهای جعلی با استفاده از تساوی های اندازه گیری خوانایی متن مورد ارزیابی قرار گرفت و این نتیجه به دست آمد که اخبار جعلی در مقایسه با اخبار موثق عمدتا ساده بوده و دشوار نیست.در فرایند برچسب گذاری خودکار خبرهای موثق و جعلی براساس سطح دشواری حجم زیادی از اخبار جعلی ساده تشخیص داده شد.اگرچه سطح دشوار برای تعدادی خبر جعلی تشخیص داده شد،تعدادشان کمتر از اخبار موثق با سطح زبانی دشوار بود.علاوه بر این دستاورد و بررسی آماری ویژگی های زبانی براساس میزان اطلاعات و خوانایی اخبار جعلی،جنبه کاربردی این اطلاعات آماری جهت تشخیص خبر جعلی با استفاده از روش های یادگیری ماشینی مورد مطالعه قرار گرفت.
Keywords:
Authors
مسعود قیومی
پژوهشکده زبان شناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی