اخیرا اسپم را یکی از مهم ترین مشکلات کاربران اینترنت می دانند. تکنیک های بسیاری برای فیلتر کردن اسپم برای غلبه برمشکلات ناشی از آن معرفی شده است. تشخیص اسپم پیامک می تواندتا حدود زیادی تحت تاثیر وجود کلمات، عبارات و اصطلاحات شناخته شده باشد در این مقاله، مجموعه ای از طبقه بندی کننده های یادگیری ماشین را معرفی می کنیم. ما به تشخیص
پیام های اسپم و غیر اسپم ، فیلتر کردن اسپم پیام کوتاه و تاثیرات مخرب اسپم برای کاربران می پردازیم. سپس با استفادهاز الگوریتم های یادگیری ماشین تحت نظارت، نظیر الگوریتم Naive Bayes، الگوریتم
ماشین بردار پشتیبانی و الگوریتم آنتروپی حداکثر و بررسی دقت عملکرد هرکدام از این الگوریتم ها، در می یابیم که کدامشان برای طبقه بندی
پیام های اسپم و غیر اسپم مناسب تر هستند. یکی دیگر از اهداف این مقاله، مقایسه تکنیک های طبقه بندی مختلف درمجموعه داده های جمع اوری شده و ارزیابی آنها براساس دقت، صحت و بازخوانی می باشد، که به شرح ان ها خواهیم پرداخت. طبقه ارزیابی انجام شده کشف می شودکه
ماشین بردار پشتیبانی SVM دقیق ترین نتایج را، بعد از ان الگوریتم Naïve Bayes ، و به دنبال آن الگوریتم آنتروپی حداکثر به ما ارائه می دهد.