CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

جداسازی هرز نامههای متنی یک رویکرد مبتنی بر الگوریتم ژنتیک و روش دسته بندی SVM

عنوان مقاله: جداسازی هرز نامههای متنی یک رویکرد مبتنی بر الگوریتم ژنتیک و روش دسته بندی SVM
شناسه ملی مقاله: ISCC04_017
منتشر شده در چهارمین کنفرانس انجمن رمز ایران در سال 1386
مشخصات نویسندگان مقاله:

سعید جلیلی - دانشگاه تربیت مدرس، گروه کامپیوتر آزمایشگاه یادگیری ماشین
شیما گرانی - دانشگاه تربیت مدرس، گروه کامپیوتر آزمایشگاه یادگیری ماشین

خلاصه مقاله:
در این مقاله، یک روش ترکیبی الگوریتم ژنتیک برای انتخاب خصیصه و روش دستهبندی svm برای جداسازی نامه های هرز پیشنهاد شده است. روش پیشنهادی روی مجموعه نامه های استاندارد LingSpam ارزیابی شدهاست . نتایج حاصل از ارزیابی نشان می دهد که روش پیشنهادی علاوه بر حفظ و یا بالا بردن معیارهای دقت، فراخوانی وF 1 تعداد خصیصهها را حدوداً به ١%، تعداد اولیه کاهش می دهد. همچنین، مقایسه نتایج حاصل از میانگین دقت، فراخوانی و F1 دسته بندی هرزنامه ب ا روش روش پیشنهادی با روشهایی که ازSVM به همراه یک روش فیلتری انتخاب خصیصه استفاده میکنند و سایر روشهای آماری جداسازی هرزنامهها نشان میدهد که روش پیشنهادی از نظر دقت و فراخوانی قابل مقایسه و حتی در مواردی بهتر بوده است.

کلمات کلیدی:
هرزنامه، یادگیری ماشین، الگوریتم ژنتیک ، SVM ، انتخاب خصیصه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/26220/