CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ساخت مجموعه داده اخبار جعلی فارسی و مروری بر کارهای انجام شده درزبان انگلیسی

عنوان مقاله: ساخت مجموعه داده اخبار جعلی فارسی و مروری بر کارهای انجام شده درزبان انگلیسی
شناسه ملی مقاله: ICTI03_053
منتشر شده در سومین کنفرانس ملی فناوریهای نوین در مهندسی برق و کامپیوتر در سال 1398
مشخصات نویسندگان مقاله:

محمود فرخیان - مربی، دانشگاه شهید چمران اهواز
سیده مریم موسوی - کارشناسی، دانشگاه شهید جمران اهواز،

خلاصه مقاله:
پیشینه خبر جعلی و شایعات به مدتها قبل باز می گردد . امروزه با گسترش اینترنت و شبکه های مجازی و راه های انتقال اطلاعات سرعت انتقال این اخبار بسیار گسترش یافته است به گونه ای که تشخیص این اخبار به معضلی برای افراد تبدیل شده است. با پیشرفت هوش مصنوعی و پردازش زبان تشخیص اخبار جعلی توانسته به موضوعی مورد توجه برای محققان تبدیل شود . با توجه به نبود مجموعه داده فارسی برای مقوله تشخیص اخبار جعلی در تلاش برای پیشبرد چنین پژوهشی در اولین قدم دست به ساخت مجموعه داده اخبار جعلی فارسی با استفاده از تکنیک وب اسکرپینگ و استخراج اطلاعات از صفحات وب زده ایم. در کنار این موضوع بررسی جامعی روی مجموعه داده های موجود در زبان انگلیسی که همگی طی سالهای اخیر تولید شده اند، انجام داده ایم.

کلمات کلیدی:
تشخیص اخبار جعلی، مجموعه داده، استخراج اطلاعات از وب، پردازش زبان طبیعی، زبان فارسی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1031228/