دسته بندی خودکار صفحات وب با استفاده از روش های دسته بندی کننده ی ترکیبی

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 692

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CEIT01_460

تاریخ نمایه سازی: 9 تیر 1393

Abstract:

در سال های اخیر همگانی شدن اینترنت و شبکه های کامپیوتری باعث تولید روزانه ی حجم بسیار وسیعی از اطلاعات و صفحات تحت وب گردیده است. در این راستا یکی از کاربردهای مهم و اجتناب ناپذیر جهت پردازش این اطلاعات، فرآیند دسته بندی دقیق و بهینه ی این صفحات می باشد. دسته بندی صفحات وب عبارت است از انتساب یک صفحه وب به یک یا بیشتر از یک گروه عنوان از پیش تعیین شده. در این مقاله ابتدا عملیات انتخاب ویژگی و سپس استخراج ویژگی صورت گرفته است. در نتیجه ضمن حذف نویز ابعاد مجموعه داده تا حد ممکن کاهش یافته است. در این کار بااستفاده از داده های موجود در متن، ساختار و آدرس صفحات وب مجموعه داده ای کامل ایجاد شده است و از روش های ترکیب دسته بندی کننده ها به منظور ایجاد یک سیستم خودکار دسته بندی کننده صفحات وب استفاده شده است. در این کار از مجموعه داده Open Directory Progect(ODP) استفاده شده است . نتایج آزمایشات انجام شده نشان دهنده کارایی بیشتر سیستم پیشنهادی نسبت به سیستم های مشابه است .

Keywords:

دسته بندی صفحات وب , بگینگ , بوستینگ , استکینگ , آدابوست

Authors

علی نبیان خوزانی

دانشجوی کارشناسی ارشد گروه مهندسی کامپیوتر، دانشگاه شهید چمران اهواز، اهواز، ایران

علی رضا عصاره

دانشیار، گروه مهندسی کامپیوتر، دانشگاه شهیدچمران اهواز، اهواز، ایران

بیتا شادگار

استادیار، گروه مهندسی کامپیوتر، دانشگاه شهید چمران اهواز، اهواز، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Alpaydin, E. (2004). Introduction to Machine Learning. MIT Press, Cambridge. ...
  • Biricik, G., Diri, B. (2009) Impact of a New Attribute ...
  • Chakrabarti, S. et al (1998). Enhanced Hypertext Categorization using Hyperlinks. ...
  • Chen, C., Lee, H., Tan, C. (2006). An intelligent web-page ...
  • Fiol-Roig, G. et al (2011). Data Mining ...
  • Hernandez, I. et al (2012). An Experiment to Test URL ...
  • Klassen, M., Paturi, N. (2010). Web Document Classification by Keywords ...
  • Liu, W. et al (2005). Importance-B ased Web Page Classification ...
  • Rajalakshmi, R., Aravindan, C. (2011). Naive Bayes Approach for Website ...
  • Selamat, A., Omatu, S. (2004). Web page feature selection and ...
  • Feature Selection " wrapper ...
  • نمایش کامل مراجع