سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

سیستم هوشمند فیلتر کردن هرزنامه ها با استفاده از الگوریتم ماشین بردار پشتیبان، شاخص گذری N-Gram و وزن دهی TF-IDF

Publish Year: 1393
Type: Conference paper
Language: Persian
View: 2,225

This Paper With 8 Page And PDF Format Ready To Download

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

Export:

Link to this Paper:

Document National Code:

CCITC01_032

Index date: 18 November 2014

سیستم هوشمند فیلتر کردن هرزنامه ها با استفاده از الگوریتم ماشین بردار پشتیبان، شاخص گذری N-Gram و وزن دهی TF-IDF abstract

با توجه به بکارگیری مستمر تکنیک های جدید توسط تولید ک نندگان هرزنامه ها، نیاز بیش از پیش به استفاده از تکنیک های جدید و هوشمند مقابله با این هرزنامه ها احساس می شود. در حال حاضر استفاده از الگوریتم های یادگیری ماشین یکی از مؤثرترین و محبوب ترین روش ها در فیلتر کردن خودکار هرزنامه ها می باشد. در این مقاله مدل جدیدی برای فیلتر کردن خودکار هرزنامه ها ارائه شده است. برای پیاده سازی از نرم افزار RapidMiner استفاده شده است. این مدل شامل دو فاز پیش پردازش مجموعه داده و فاز دسته بندی ایمیل ها می باشد. فاز پیش پردازش شامل مراحل آماده سازی م جموعه داده، شاخص گذاری و وزن دهی شاخص ها می باشد. مرحله آماده سازی شامل بخش های یک شکل سازی متن، تقسیم متن به واحدهای با معنی مثل ک لمه، حذف کلمات متوقف کننده و علائم نگارشی می باشد. ما در مدل پیشنهادی برای شاخص گذاری در فاز پیش پردازش از روش N-gram و برای وزن دهی به شاخص ها از فیلتر TF-IDF استفاده کرده ایم. در فاز دوم، برای آموزش مدل جهت دسته بندی، از الگوریتم ماشین بردار پشتیبان استفاده شده است. به منظور ارزیابی و مقایسه نتایج، معیارهای صحت، دقت، بازخوانی و پاارمتر (F(1 محاسبه شده اند. نتایج آزمایش ها که بر روی مجموعه داده های LingSpam و SpamAssassin انجام گرفت نشان می دهد که مدل پیشنهادی ما کارایی بهتری نسبت به الگوریتم های دیگر روی این مجموعه داده ها دارد.

سیستم هوشمند فیلتر کردن هرزنامه ها با استفاده از الگوریتم ماشین بردار پشتیبان، شاخص گذری N-Gram و وزن دهی TF-IDF Keywords:

سیستم هوشمند فیلتر کردن هرزنامه ها با استفاده از الگوریتم ماشین بردار پشتیبان، شاخص گذری N-Gram و وزن دهی TF-IDF authors

فاطمه حیدری

کارشناسی ارشد نرم افزار، جهاد دانشگاهی خوزستان، اهواز، ایران

علیرضا عصاره

دانشیار، گروه کامپیوتر دانشگاه شهید چمران، اهواز، ایران

بیتا شادگار

استادیار، گروه کامپیوتر دانشگاه شهید چمران، اهواز، ایران

مقاله فارسی "سیستم هوشمند فیلتر کردن هرزنامه ها با استفاده از الگوریتم ماشین بردار پشتیبان، شاخص گذری N-Gram و وزن دهی TF-IDF" توسط فاطمه حیدری، کارشناسی ارشد نرم افزار، جهاد دانشگاهی خوزستان، اهواز، ایران؛ علیرضا عصاره، دانشیار، گروه کامپیوتر دانشگاه شهید چمران، اهواز، ایران؛ بیتا شادگار، استادیار، گروه کامپیوتر دانشگاه شهید چمران، اهواز، ایران نوشته شده و در سال 1393 پس از تایید کمیته علمی اولین کنفرانس ملی کامپیوتر، فن آوری اطلاعات و ارتباطات پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله هرزنامه، فیلتر ک ردن، دسته بندی ایمیل، TF-IDF(Term Frequency Inverse Document Frequency), N-gram، یادگیری ماشین، ماشین بردار پشتیبان هستند. این مقاله در تاریخ 27 آبان 1393 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 2225 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که با توجه به بکارگیری مستمر تکنیک های جدید توسط تولید ک نندگان هرزنامه ها، نیاز بیش از پیش به استفاده از تکنیک های جدید و هوشمند مقابله با این هرزنامه ها احساس می شود. در حال حاضر استفاده از الگوریتم های یادگیری ماشین یکی از مؤثرترین و محبوب ترین روش ها در فیلتر کردن خودکار هرزنامه ها می باشد. در ... . این مقاله در دسته بندی موضوعی یادگیری ماشین طبقه بندی شده است. برای دانلود فایل کامل مقاله سیستم هوشمند فیلتر کردن هرزنامه ها با استفاده از الگوریتم ماشین بردار پشتیبان، شاخص گذری N-Gram و وزن دهی TF-IDF با 8 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.