تحلیل آماری اخبار جعلی فارسی مربوط به کوید-۱۹

مسعود قیومی

تحلیل آماری اخبار جعلی فارسی مربوط به کوید-۱۹

Publish place: Iranian Journal of Sociolinguistics، Vol: 5، Issue: 4

Publish Year: 1401

نوع سند: مقاله ژورنالی

زبان: Persian

This Paper With 18 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1639736

شناسه ملی سند علمی:

JR_SOCG-5-4_004

تاریخ نمایه سازی: 5 اردیبهشت 1402

Abstract:

در این پژوهش تلاش می شود با استفاده از تحلیل آماری،ویژگی های اخبار جعلی فارسی مربوط به کوید-۱۹ بررسی گردد.برای این هدف،ابتدا یک پیکره زبانی که حاوی اخبار موثق و جعلی در حوزه کرونا است تهیه می شود.سپس الگوهای زبانی این دو دسته داده و همچنین دو تحلیل آماری مقدار اطلاعات و خوانایی اخبار موثق و جعلی مورد بررسی قرار گرفته و با یکدیگر مقایسه می شود.براساس اطلاعات استخراج شده و نتایج عملی به دست آمده از پیکره خبرهای جعلی،الگوهای زبانی مشترک بین این دو دسته داده وجود دارد.همچنین،مقدار اطلاعات در اخبار موثق براساس دو معیار آنتروپی و شگفتی بیشتر از اخبار جعلی است.همچنین سطح خوانایی خبرهای جعلی با استفاده از تساوی های اندازه گیری خوانایی متن مورد ارزیابی قرار گرفت و این نتیجه به دست آمد که اخبار جعلی در مقایسه با اخبار موثق عمدتا ساده بوده و دشوار نیست.در فرایند برچسب گذاری خودکار خبرهای موثق و جعلی براساس سطح دشواری حجم زیادی از اخبار جعلی ساده تشخیص داده شد.اگرچه سطح دشوار برای تعدادی خبر جعلی تشخیص داده شد،تعدادشان کمتر از اخبار موثق با سطح زبانی دشوار بود.علاوه بر این دستاورد و بررسی آماری ویژگی های زبانی براساس میزان اطلاعات و خوانایی اخبار جعلی،جنبه کاربردی این اطلاعات آماری جهت تشخیص خبر جعلی با استفاده از روش های یادگیری ماشینی مورد مطالعه قرار گرفت.

Keywords:

اخبار جعلی فارسی , کوید-۱۹ , نظریه اطلاعات , آنتروپی , شگفتی , خوانایی

Authors

مسعود قیومی

پژوهشکده زبان شناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی