شناسایی اسپم در تویت های فارسی: رویکرد مبتنی بر داده کاوی

نیلوفر عرب; علیرضا رضوانیان

شناسایی اسپم در تویت های فارسی: رویکرد مبتنی بر داده کاوی

Publish place: 4th National Conference on New Technologies in Electrical and Computer Engineering

Publish Year: 1400

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 10 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1290800

شناسه ملی سند علمی:

ICTI04_053

تاریخ نمایه سازی: 20 مهر 1400

Abstract:

شبکه اجتماعی تویتر، دارای تعداد زیادی کاربر فعال است که نه تنها به عنوان پلتفرمی به منظور تولید و گسترش فراگیر آخرین اخبار و اطلاعات شناخته می شود. با توجه به دسترسی گسترده به این شبکه اجتماعی آنلاین، در سال های اخیر وجود اخبار و پیام های ناخواسته یا تبلیغات تحت عنوان اسپم یا هرزنامه نیز افزایش یافته است. به منظور مقابله با اسپم در شبکه های اجتماعی و به خصوص توییتر تحقیقات متعددی با تمرکز بر توییت انگلیسی انجام شده است. در این مقاله، با تاکید بر توییت های فارسی، با استفاده از رویکرد داده کاوی بخشی از توییت های به زبان فارسی جمع آوری شده، پس از برچسب گذاری اولیه به صورت دستی توسط کاربر انسانی، استخراج ویژگی، انتخاب ویژگی، تحلیل ویژگی، مدلسازی و ارزیابی توسط چند الگوریتم یادگیری ماشین بر روی این دادگان انجام شده است. از دستاوردهای اصلی این پژوهش می توان به ارائه یک مجموعه داده استاندارد برای شناسایی اسپ در توییت های فارسی و تحلیل ویژگی های اثرگذار نام برد.

Keywords:

تحلیل شبکه اجتماعی , توییتر , شناسایی اسپم , داده کاوی , یادگیری ماشین

Authors

نیلوفر عرب

کارشناسی، گروه مهندسی کامپیوتر، دانشگاه علم و فرهنگ

علیرضا رضوانیان

استادیار، کارشناسی، گروه مهندسی کامپیوتر، دانشگاه علم و فرهنگ