شناسایی هرزنامه ها در پیامک های متنی با استفاده از مدل سازی موضوعی LDA و ماشین یادگیری شدید (ELM)

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 621

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICCONF03_036

تاریخ نمایه سازی: 2 تیر 1397

Abstract:

شناسایی هرزنامه ها یک کار مهم است که طی آن پیامک های هرز شناسایی و پالایش می شوند. تعداد زیادی پیامک هر روز ارسال می شود و برای یک کاربر به خاطر سپردن و ارتباط دادن پیامک های جدید با پیامک هایی که قبلا دریافت شده اند، بسیار دشوار است. در این مقاله، مساله شناسایی هرزنامه های پیامکی مورد بررسی قرار گرفته است و برای این منظور یک روش مبتنی بر انتخاب ویژگی با طبقه بندی ماشین یادگیری شدید (ELM) ارایه شده است. پس از انجام پیش پردازش های متنی کار در دو مرحله انجام شده است. در مرحله اول، ویژگی های بارز و بااهمیت با استفاده از یک روش مدل سازی موضوعی مبتنی بر LDA انتخاب می شوند. سپس، در مرحله دوم، روش طبقه بندی ELM برای دسته بندی پیامک ها به دو دسته، یعنی پیامک هرز و پیامک غیر هرز استفاده می شود. برای تجزیه و تحلیل، پارامترهای عملکرد مانند دقت، بازخوانی و سنجش F نیز ارزیابی می شوند. نتایج تجربی نشان می دهند که روش پیشنهادی در هر دو حالت مجموعه کامل ویژگی و حالت انتخاب ویژگی (LDA) بهتر از روش پایه عمل می کند.

Authors

سینا دامی

استادیار گروه کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران

محمد استرابی

دانشجوی کارشناسی ارشد IT، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران