دسته بندی مفهومی صفحات وب با استفاده از اطلاعات متن و پیوندهای بین صفحات وب
عنوان مقاله: دسته بندی مفهومی صفحات وب با استفاده از اطلاعات متن و پیوندهای بین صفحات وب
شناسه ملی مقاله: ACCSI11_109
منتشر شده در یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1384
شناسه ملی مقاله: ACCSI11_109
منتشر شده در یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1384
مشخصات نویسندگان مقاله:
احمد عبداله زاده - دانشگاه صنعتی امیرکبیر
قربان خردمندیان - دانشگاه صنعتی امیرکبیر
خلاصه مقاله:
احمد عبداله زاده - دانشگاه صنعتی امیرکبیر
قربان خردمندیان - دانشگاه صنعتی امیرکبیر
در این مقاله یکروش جدید خوشه بندی مفهومی صفحات وب مبتنی بر متن اتصالات بین صفحات وب و اصطلاحنامه معرفی می شود کلمات موجود در بین دو تگ < TITLE> برای هر صفحه وب به عنوان اطلاعات متنی و همچنین تعداد لینکهای بین صفحات به عنوان دو ویژگی برای سنجش شباهت بین صفحات در نظر گرفته شده است علاوه بر این پردازش مفهومی به منظور سنجش شباهت مفهومی بین کلمات با استفاده از یک اصطلاحنامه در حوزه مورد نظر انجام می شود با استفاده ازاین ویژگیها یک معیار شباهت تعریف شده است فرایند خوشه بندی نیز بصورت سلسله مراتبی انجام میشود. برای ارزیابی روش پیشنهادی آنرا برروی داده های مختلفی مورد آزمایش قرار دادیم که نتایج خوبی حاصل شد و همچنین الگوریتم پیشنهادی از سرعت خوبی برخوردار است.
کلمات کلیدی: خوشه بندی، صفحه وب، اصطلاحنامه و اتصال بین صفحات
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/127198/