جداسازی هرز نامههای متنی یک رویکرد مبتنی بر الگوریتم ژنتیک و روش دسته بندی SVM
Publish place: 4th Iranian Security Community Conference
Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,677
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ISCC04_017
تاریخ نمایه سازی: 10 اسفند 1385
Abstract:
در این مقاله، یک روش ترکیبی الگوریتم ژنتیک برای انتخاب خصیصه و روش دستهبندی svm برای جداسازی نامه های هرز پیشنهاد شده است. روش پیشنهادی روی مجموعه نامه های استاندارد LingSpam ارزیابی شدهاست . نتایج حاصل از ارزیابی نشان می دهد که روش پیشنهادی علاوه بر حفظ و یا بالا بردن معیارهای دقت، فراخوانی وF 1 تعداد خصیصهها را حدوداً به ١%، تعداد اولیه کاهش می دهد. همچنین، مقایسه نتایج حاصل از میانگین دقت، فراخوانی و F1 دسته بندی هرزنامه ب ا روش روش پیشنهادی با روشهایی که ازSVM به همراه یک روش فیلتری انتخاب خصیصه استفاده میکنند و سایر روشهای آماری جداسازی هرزنامهها نشان میدهد که روش پیشنهادی از نظر دقت و فراخوانی قابل مقایسه و حتی در مواردی بهتر بوده است.
Keywords:
Authors
سعید جلیلی
دانشگاه تربیت مدرس، گروه کامپیوتر آزمایشگاه یادگیری ماشین
شیما گرانی
دانشگاه تربیت مدرس، گروه کامپیوتر آزمایشگاه یادگیری ماشین