شناسایی هرزنامه ها در پیامک های متنی با استفاده از مدل سازی موضوعی LDA و ماشین یادگیری شدید (ELM)
Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 621
This Paper With 9 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICCONF03_036
تاریخ نمایه سازی: 2 تیر 1397
Abstract:
شناسایی هرزنامه ها یک کار مهم است که طی آن پیامک های هرز شناسایی و پالایش می شوند. تعداد زیادی پیامک هر روز ارسال می شود و برای یک کاربر به خاطر سپردن و ارتباط دادن پیامک های جدید با پیامک هایی که قبلا دریافت شده اند، بسیار دشوار است. در این مقاله، مساله شناسایی هرزنامه های پیامکی مورد بررسی قرار گرفته است و برای این منظور یک روش مبتنی بر انتخاب ویژگی با طبقه بندی ماشین یادگیری شدید (ELM) ارایه شده است. پس از انجام پیش پردازش های متنی کار در دو مرحله انجام شده است. در مرحله اول، ویژگی های بارز و بااهمیت با استفاده از یک روش مدل سازی موضوعی مبتنی بر LDA انتخاب می شوند. سپس، در مرحله دوم، روش طبقه بندی ELM برای دسته بندی پیامک ها به دو دسته، یعنی پیامک هرز و پیامک غیر هرز استفاده می شود. برای تجزیه و تحلیل، پارامترهای عملکرد مانند دقت، بازخوانی و سنجش F نیز ارزیابی می شوند. نتایج تجربی نشان می دهند که روش پیشنهادی در هر دو حالت مجموعه کامل ویژگی و حالت انتخاب ویژگی (LDA) بهتر از روش پایه عمل می کند.
Keywords:
Authors
سینا دامی
استادیار گروه کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران
محمد استرابی
دانشجوی کارشناسی ارشد IT، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران ایران