یک روش یادگیری تجمعی جدید در اسپم فیلترینگ متنی

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 556

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICTI03_064

تاریخ نمایه سازی: 26 تیر 1399

Abstract:

اسپم های متنی، پیام هایی ناخواسته هستند که امروزه به صورت ایمیل یا پیام کوتاه دریافت می شوند. با توجه به افزایش حجم اسپم های تولیدی و با توجه به میزان ایمیل های متفاوتی نظیر شغلی، شخصی و سایر موارد که به طور روزانه دریافت می کنیم، بسیار مهم است که بتوانیم ایمیل های اسپم را شناسایی نماییم. از این رو هر پلتفرم ارسال و دریافت پیامی باید مجهز به یک سیستم تشخیص اسپم قوی باشد تا بتواند اسپم ها را در بدو ورود تشخیص داده و فیلتر کند. امروزه روش های متعددی برای تشخیص اسپم ارائه شده و اغلب در تشخیص اسپم ها موفق عمل می کنند. اما چالشی که در این حوزه هست، وجود (False Positive( FPدر تشخیصها است. یعنی پیام های مشروع که به اشتباه به عنوان اسپم شناخته شده و فیلتر میشوند. در این مقاله یک روش جدید یادگیری تجمعی به منظور اسپم فیلترینگ ارائه می شود. در این روش برخلاف دیگر روش های یادگیری تجمعی که زیر مجموعه ها را بدون توجه به مکان نمونه ها انتخاب می کنند، هر زیر مجموعه از مکان مشخصی انتخاب می شود و برای تعیین برچسب نهایی متن، بین یادگیرنده هایی که توسط زیرمجموعه ها آموزش داده شده اند، رای گیری اکثریت برگزار میشود. نتایج نشان میدهند روش پیشنهادی به طور قابل ملاحظه ای دقت اسپم فیلترینگ را افزایش داده و FP را کاهش می دهد.

Authors

سمن مثقالی

کارشناسی ارشد مهندسی کامپیوتر - هوش مصنوعی،ایران، اصفهان، میدان استقلال، دانشگاه صنعتی اصفهان، دانشکده مهندسی برق و کامپیوتر، ایران،

جواد عسگری

دکتری برق-کنترل، هیئت علمی دانشگاه صنعتی اصفهان،اصفهان، میدان استقلال، دانشگاه صنعتی اصفهان، دانشکده مهندسی برق و کامپیوتر،