CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه مدل ترکیبی نوین رتبه بندی در موتورهای حستجو براساس خصوصبت های مبتنی بر متن و پیوند برای تشخیص وب اسیم ها

عنوان مقاله: ارائه مدل ترکیبی نوین رتبه بندی در موتورهای حستجو براساس خصوصبت های مبتنی بر متن و پیوند برای تشخیص وب اسیم ها
شناسه ملی مقاله: CICTC02_004
منتشر شده در دومین کنفرانس دانشجویان مهندسی کامپیوتر و فناوری اطلاعات و ارتباطات در سال 1402
مشخصات نویسندگان مقاله:

فاطمه دستجردی - مربی، مدرس گروه کامپیوتر دانشگاه امام جواد(ع) یزد
سیدمهدی کوهکن - دانشجوی کارشناسی مهندسی کامپیوتر دانشگاه امام جواد (ع) یزد

خلاصه مقاله:
در عصر کنونی حجم اطلاعات مختلف در بستر شبکه اینترنت رشد بسیار زیادی را دارا گردید به گونه ای که بامطرح شدن خرید آنلاین به علت راحتی خرید آنلاین. تبلیغات اینترنتی و همچنین زیاد شدن تعداد وب سایت ها،موتورهای جستجو به منظور رفع نیاز اطلاعاتی کاربران در کم ترین زمان ایجاد می گردند. کاربران برای یافتناطلاعات مورد نظرشان به موتورهای جستجو رجوع کرده و تنها نخستین نتایجی که موتورهای جستجو نمایشمی دهد را مورد بررسی قرار می دهند. از این رو موتورهای جستجو و قرار گرفتن صفحات در نتایج نخست برایصاحبان وب سایت ها حائز اهمیت شد. در این بین افرادی سعی در فریب دادن موتورهای جستجو برای قرار دادنصفحات سایت خود به صورت غیرمنصفانه در نتایج نخست داشته اند. این تلاش ها منجر به ایجاد پدیده وب اسیمگردید. هدف از انجام این پژوهش ارائه مدل ترکیبی نوین رتبه بندی در موتورهای جستجو براساس خصوصیت هایمبتنی بر متن و پیوند برای تشخیص وب اسیم ها این پژوهش به شیوه جمع اوری اطلاعات به شیوه توصیفی انجام گرفت. نتایج نشان می دهد وب اسپم روشی است که با استفاده از آن صفحات نامرتبط در رتبه بندی موتورهای جستجو، رتبه ای بالاتر از صفحات مرتبط خواهند داشت تا کنون پژوهش های زیادی برای تشخیص وب اسپم ها صورت گرفته است. با این حال تا کنون هیچ روشی موثری برای تشخیص تمام صفحات آسپم ارائه نگردیده است. دراین پژوهش با ارائه یک الگوربتم ترکیبی مبتنی بر روش های متن و پیوند ارائه گردیده و تلاش شد انواع صفحاتاسپم موجود در بستر وب. با کارایی بالا شناسایی گردد. رویکرد محتوا محور از تراکم کلمه و همچنین نرخ ضمیمه های نقش دستوری و رویکرد مبتنی بر لینک از PageRank مختص به هر صفحه بهره می گیرد. این روش بر روی داده های WEBSPAM-UK۲۰۰۶ پیاده سازی شده و نتایج ارزیابی های صورت گرفته نشان دهنده مقدار ۷۷.۲% برای معیار F۱ بود.

کلمات کلیدی:
رتبه بندی، موتورهای جستجو، خصوصیت، مبتنی بر متن و پیوند و وب آسپم ها

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1796762/