CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

شناسایی هرزنوشتهی وب با استفاده از الگوریتمهای هوشمند

عنوان مقاله: شناسایی هرزنوشتهی وب با استفاده از الگوریتمهای هوشمند
شناسه ملی مقاله: NEEREC07_017
منتشر شده در هفتمین کنفرانس ملی مهندسی برق با محوریت انرژی های نو در سال 1392
مشخصات نویسندگان مقاله:

مهدیه داننده اسکوئی - دانشگاه آزاد اسلامی واحد شبستر
سیدناصر رضوی - دانشگاه تبریز

خلاصه مقاله:
همواره موتورهای جستجو در تلاشند تا سایتهای مرتبط با جستار کاربر را در رتبههای بالاتر قرار دهند. همین تلاش موتورهای جستجو می تواند توسط سودجویان مورد سوء استفاد ه قرار گرفت ه و معضلی تحت عنوان هرزنوشتهی وب را ایجا د مینماید که افزایش رتبه کاذب صفحات اینترنتی از طریق فریب الگوریتم های موتورهای جستجو میباشد. کاربردهای صفحات هرزنوشته را می توان اقتصادی، سیاسی و تبلیغاتی دانست. تاکنون روشهای بسیاری برای مقابله با پدیده هرزنوشتهی وب ایجاد شده اند. این مقاله به بررسی انواع روشهای هرزنگاری و بررسی چند الگوریتم هوشمند برای شناسایی هرزنوشتهی وب میپردازد که برای این کار از ویژگیهای محتوایی مجموعه دادهی استانداردWEBSPAM-UK 2007 استفاده شده است که هر نمونه در این مجموعه داده، بیان کننده صفحات هرزنوشته و معتبر است که معیارهای دقت و سرعت و نرخ فراخوانی و نرخ درستی و امتیازF1 الگوریتمهای هوشمند در تشخیص هرزنوشته یا معتبر بودن صفحات را بررسی کردهایم

کلمات کلیدی:
هرزنوشتهی وب ، مزرعه لینک، ماشین بردار پشتیبان،شبکهی بیزین،C4.5

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/244168/