بهبود تشخیص هرزنامه ها با استفاده از ترکیب مدل های خوشه بندی و دسته بندی

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 624

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CITCOMP05_064

تاریخ نمایه سازی: 22 مرداد 1399

Abstract:

اینترنت به طور چشمگیری ارتباط با دیگران را تغییر داده است. ایمیل یکی از سرویس های که امروزه اینترنت برایکاربرانش فراهم میآورد. این سرویس به علت هزینه کم مورد توجه بسیاری از کاربران قرار گرفته است در کنار مزایای زیادپست الکترونیکی، یکی از ضعف های این سرویس این است که دائما بر تعداد ایمیل هایی که دریافت می گردد افزوده می شود.گسترش سریع این سرویس باعث شده عده ای درصد سوء استفاده از آن برآیند که نتیجه آن گسترش هرزنامه شده است. درواقع فیلتر هرزنامه، یک برنامه کامپیوتری است که توانایی دسته بندی نامه های الکترونیکی را دارا می باشد. بیشتر این فیلترهااز ترکیبی از چندین روش مانند فهرست های سیاه یا سفید، فیلتر بر پایه قانون و غیره برای شناسایی دقیق تر هرزنامه بهرهمی برند. در این مقاله از معیار شباهت کسینوسی، الگوریتم خوشه بندی k-means و همچنین مدل دسته بندی ترکیبی ID3 برای تشخیص هرزنامه ها استفاده می شود. شبیه سازی روش پیشنهادی روی مجموعه داده SPAM E-mail نشان می دهد که میزان دقت تشخیص هرزنامه ها 91.77 % است.

Authors

زهرا ماهینی

دانشجو کارشناسی ارشد، مهندسی کامپیوتر، موسسه آموزش عالی غیرانتفاعی-غیر دولتی لیان، بوشهر

موسی مجرد

دانشکده مهندسی برق و کامپیوتر، واحد فیروزآباد، دانشگاه آزاد اسلامی، فیروزآباد، ایران