ارائه مدل ترکیبی نوین رتبه بندی در موتورهای حستجو براساس خصوصبت های مبتنی بر متن و پیوند برای تشخیص وب اسیم ها

Publish Year: 1402
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 93

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CICTC02_004

تاریخ نمایه سازی: 6 آبان 1402

Abstract:

در عصر کنونی حجم اطلاعات مختلف در بستر شبکه اینترنت رشد بسیار زیادی را دارا گردید به گونه ای که بامطرح شدن خرید آنلاین به علت راحتی خرید آنلاین. تبلیغات اینترنتی و همچنین زیاد شدن تعداد وب سایت ها،موتورهای جستجو به منظور رفع نیاز اطلاعاتی کاربران در کم ترین زمان ایجاد می گردند. کاربران برای یافتناطلاعات مورد نظرشان به موتورهای جستجو رجوع کرده و تنها نخستین نتایجی که موتورهای جستجو نمایشمی دهد را مورد بررسی قرار می دهند. از این رو موتورهای جستجو و قرار گرفتن صفحات در نتایج نخست برایصاحبان وب سایت ها حائز اهمیت شد. در این بین افرادی سعی در فریب دادن موتورهای جستجو برای قرار دادنصفحات سایت خود به صورت غیرمنصفانه در نتایج نخست داشته اند. این تلاش ها منجر به ایجاد پدیده وب اسیمگردید. هدف از انجام این پژوهش ارائه مدل ترکیبی نوین رتبه بندی در موتورهای جستجو براساس خصوصیت هایمبتنی بر متن و پیوند برای تشخیص وب اسیم ها این پژوهش به شیوه جمع اوری اطلاعات به شیوه توصیفی انجام گرفت. نتایج نشان می دهد وب اسپم روشی است که با استفاده از آن صفحات نامرتبط در رتبه بندی موتورهای جستجو، رتبه ای بالاتر از صفحات مرتبط خواهند داشت تا کنون پژوهش های زیادی برای تشخیص وب اسپم ها صورت گرفته است. با این حال تا کنون هیچ روشی موثری برای تشخیص تمام صفحات آسپم ارائه نگردیده است. دراین پژوهش با ارائه یک الگوربتم ترکیبی مبتنی بر روش های متن و پیوند ارائه گردیده و تلاش شد انواع صفحاتاسپم موجود در بستر وب. با کارایی بالا شناسایی گردد. رویکرد محتوا محور از تراکم کلمه و همچنین نرخ ضمیمه های نقش دستوری و رویکرد مبتنی بر لینک از PageRank مختص به هر صفحه بهره می گیرد. این روش بر روی داده های WEBSPAM-UK۲۰۰۶ پیاده سازی شده و نتایج ارزیابی های صورت گرفته نشان دهنده مقدار ۷۷.۲% برای معیار F۱ بود.

Keywords:

رتبه بندی , موتورهای جستجو , خصوصیت , مبتنی بر متن و پیوند و وب آسپم ها

Authors

فاطمه دستجردی

مربی، مدرس گروه کامپیوتر دانشگاه امام جواد(ع) یزد

سیدمهدی کوهکن

دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه امام جواد (ع) یزد