شناسایی هرزنوشتهی وب با استفاده از الگوریتمهای هوشمند
عنوان مقاله: شناسایی هرزنوشتهی وب با استفاده از الگوریتمهای هوشمند
شناسه ملی مقاله: NEEREC07_017
منتشر شده در هفتمین کنفرانس ملی مهندسی برق با محوریت انرژی های نو در سال 1392
شناسه ملی مقاله: NEEREC07_017
منتشر شده در هفتمین کنفرانس ملی مهندسی برق با محوریت انرژی های نو در سال 1392
مشخصات نویسندگان مقاله:
مهدیه داننده اسکوئی - دانشگاه آزاد اسلامی واحد شبستر
سیدناصر رضوی - دانشگاه تبریز
خلاصه مقاله:
مهدیه داننده اسکوئی - دانشگاه آزاد اسلامی واحد شبستر
سیدناصر رضوی - دانشگاه تبریز
همواره موتورهای جستجو در تلاشند تا سایتهای مرتبط با جستار کاربر را در رتبههای بالاتر قرار دهند. همین تلاش موتورهای جستجو می تواند توسط سودجویان مورد سوء استفاد ه قرار گرفت ه و معضلی تحت عنوان هرزنوشتهی وب را ایجا د مینماید که افزایش رتبه کاذب صفحات اینترنتی از طریق فریب الگوریتم های موتورهای جستجو میباشد. کاربردهای صفحات هرزنوشته را می توان اقتصادی، سیاسی و تبلیغاتی دانست. تاکنون روشهای بسیاری برای مقابله با پدیده هرزنوشتهی وب ایجاد شده اند. این مقاله به بررسی انواع روشهای هرزنگاری و بررسی چند الگوریتم هوشمند برای شناسایی هرزنوشتهی وب میپردازد که برای این کار از ویژگیهای محتوایی مجموعه دادهی استانداردWEBSPAM-UK 2007 استفاده شده است که هر نمونه در این مجموعه داده، بیان کننده صفحات هرزنوشته و معتبر است که معیارهای دقت و سرعت و نرخ فراخوانی و نرخ درستی و امتیازF1 الگوریتمهای هوشمند در تشخیص هرزنوشته یا معتبر بودن صفحات را بررسی کردهایم
کلمات کلیدی: هرزنوشتهی وب ، مزرعه لینک، ماشین بردار پشتیبان،شبکهی بیزین،C4.5
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/244168/