جداسازی هرز نامههای متنی یک رویکرد مبتنی بر الگوریتم ژنتیک و روش دسته بندی SVM

Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,677

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ISCC04_017

تاریخ نمایه سازی: 10 اسفند 1385

Abstract:

در این مقاله، یک روش ترکیبی الگوریتم ژنتیک برای انتخاب خصیصه و روش دستهبندی svm برای جداسازی نامه های هرز پیشنهاد شده است. روش پیشنهادی روی مجموعه نامه های استاندارد LingSpam ارزیابی شدهاست . نتایج حاصل از ارزیابی نشان می دهد که روش پیشنهادی علاوه بر حفظ و یا بالا بردن معیارهای دقت، فراخوانی وF 1 تعداد خصیصهها را حدوداً به ١%، تعداد اولیه کاهش می دهد. همچنین، مقایسه نتایج حاصل از میانگین دقت، فراخوانی و F1 دسته بندی هرزنامه ب ا روش روش پیشنهادی با روشهایی که ازSVM به همراه یک روش فیلتری انتخاب خصیصه استفاده میکنند و سایر روشهای آماری جداسازی هرزنامهها نشان میدهد که روش پیشنهادی از نظر دقت و فراخوانی قابل مقایسه و حتی در مواردی بهتر بوده است.

Authors

سعید جلیلی

دانشگاه تربیت مدرس، گروه کامپیوتر آزمایشگاه یادگیری ماشین

شیما گرانی

دانشگاه تربیت مدرس، گروه کامپیوتر آزمایشگاه یادگیری ماشین