ارائه روشی برای تشخیص بهتر ایمیل های اسپم از غیر اسپم با استفاده از داده کاوی abstract
کم ارزش ترین و مهمترین ارتباطات درجهان امروز ایمیل است کلمه اسپم استفاده شده تاناخواسته بودن میلهای بی ارزش فرستاده شده به اینباکس یککاربر اینترنترا توضیح دهد تکنولوژی مختلفی درسروکارباایمیل اسپم ناخواسته پیشنهاد شده اند ت حقیق روی الگوریتم انتخابی منفی اساسا روی کشف ناهنجاری و کشف خرابی متمرکز استدراین مقاله بابهره گیری ازدانش داده کاوی توانستیم خوشه بندی بهتر با خطای کمتری را نتیجه بگیریم
شبکه عصبی مربوط به دیتاست ایمیل را ساخته واموزش دادیم و میزان
خطای میانگین مربعات آن را محاسبه کردیم سپس دیتاست ایمیل را درسه مرحله به بخشهای اموزش و تست تقسیم کرده و درهرمرحله میزان
خطای میانگین مربعات را محاسبه کردیم برروی مجموع داده هایی که دراین مرحله اسپم شناخته شدند نیز الگوریتم خوشه بندی فازی را اعمال کردیم و
شبکه عصبی مربوط به آن را ساختیم و میزان
خطای میانگین مربعات این قسمت را نیز محاسبه کردیم و درنهایت با مقایسه خطای به دست آمده ازدیتاست اولیه و مجموع سه مرحله ای که cross validation انجام دادیمدر20تکرار این نتیجه بدست می اید که استفاده ازcross validation روی دیتاست اولیه
خطای میانگین مربعات را کاهش داده و بااستفاده ازاین تکنیک میتوانیم تشخیص بهتری را برای مجزا کردن ایمیل های اسپم ازغیراسپم داشته باشیم