CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

دسته بندی مفهومی صفحات وب با استفاده از اطلاعات متن و پیوندهای بین صفحات وب

عنوان مقاله: دسته بندی مفهومی صفحات وب با استفاده از اطلاعات متن و پیوندهای بین صفحات وب
شناسه ملی مقاله: ACCSI11_109
منتشر شده در یازدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1384
مشخصات نویسندگان مقاله:

احمد عبداله زاده - دانشگاه صنعتی امیرکبیر
قربان خردمندیان - دانشگاه صنعتی امیرکبیر

خلاصه مقاله:
در این مقاله یکروش جدید خوشه بندی مفهومی صفحات وب مبتنی بر متن اتصالات بین صفحات وب و اصطلاحنامه معرفی می شود کلمات موجود در بین دو تگ < TITLE> برای هر صفحه وب به عنوان اطلاعات متنی و همچنین تعداد لینکهای بین صفحات به عنوان دو ویژگی برای سنجش شباهت بین صفحات در نظر گرفته شده است علاوه بر این پردازش مفهومی به منظور سنجش شباهت مفهومی بین کلمات با استفاده از یک اصطلاحنامه در حوزه مورد نظر انجام می شود با استفاده ازاین ویژگیها یک معیار شباهت تعریف شده است فرایند خوشه بندی نیز بصورت سلسله مراتبی انجام میشود. برای ارزیابی روش پیشنهادی آنرا برروی داده های مختلفی مورد آزمایش قرار دادیم که نتایج خوبی حاصل شد و همچنین الگوریتم پیشنهادی از سرعت خوبی برخوردار است.<br><br> </div><b>کلمات کلیدی:</b><br> <div class=""> خوشه بندی، صفحه وب، اصطلاحنامه و اتصال بین صفحات<br><br> </div><b>صفحه اختصاصی مقاله و دریافت فایل کامل:</b> <a href="https://civilica.com/doc/127198/">https://civilica.com/doc/127198/</a><br> </div> <div class="clr"></div> </div> </main> <footer> <div class="c"> برای چاپ کامل صفحه، در گزینه های چاپ Background Graphics را فعال نمایید.<br><br> دفتر مرکزی انتشارات بوم سازه (سیویلیکا): تهران، بزرگراه جلال آل احمد، بین خیابان کارگر و بزرگراه چمران، کوچه پروانه، پلاک ۴، ساختمان چمران، طبقه ۴، واحد ۳۱<br> تلفن: <a href="tel:+982188008044">۸۸۰۰۸۰۴۴</a> ، <a href="tel:+982188335450">۸۸۳۳۵۴۵۰</a> ، <a href="tel:+982188335451">۸۸۳۳۵۴۵۱</a> ، <a href="tel:+982188335452">۸۸۳۳۵۴۵۲</a> - کد پستی: ۱۴۳۹۹۱۴۱۵۳<br> </div> </footer> </div> </body></html>