دسته بندی خودکار صفحات وب با استفاده از روش های دسته بندی کننده ی ترکیبی
Publish place: 1st National Innovation Conference on Computer Engineering and Information Technology
Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 692
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CEIT01_460
تاریخ نمایه سازی: 9 تیر 1393
Abstract:
در سال های اخیر همگانی شدن اینترنت و شبکه های کامپیوتری باعث تولید روزانه ی حجم بسیار وسیعی از اطلاعات و صفحات تحت وب گردیده است. در این راستا یکی از کاربردهای مهم و اجتناب ناپذیر جهت پردازش این اطلاعات، فرآیند دسته بندی دقیق و بهینه ی این صفحات می باشد. دسته بندی صفحات وب عبارت است از انتساب یک صفحه وب به یک یا بیشتر از یک گروه عنوان از پیش تعیین شده. در این مقاله ابتدا عملیات انتخاب ویژگی و سپس استخراج ویژگی صورت گرفته است. در نتیجه ضمن حذف نویز ابعاد مجموعه داده تا حد ممکن کاهش یافته است. در این کار بااستفاده از داده های موجود در متن، ساختار و آدرس صفحات وب مجموعه داده ای کامل ایجاد شده است و از روش های ترکیب دسته بندی کننده ها به منظور ایجاد یک سیستم خودکار دسته بندی کننده صفحات وب استفاده شده است. در این کار از مجموعه داده Open Directory Progect(ODP) استفاده شده است . نتایج آزمایشات انجام شده نشان دهنده کارایی بیشتر سیستم پیشنهادی نسبت به سیستم های مشابه است .
Authors
علی نبیان خوزانی
دانشجوی کارشناسی ارشد گروه مهندسی کامپیوتر، دانشگاه شهید چمران اهواز، اهواز، ایران
علی رضا عصاره
دانشیار، گروه مهندسی کامپیوتر، دانشگاه شهیدچمران اهواز، اهواز، ایران
بیتا شادگار
استادیار، گروه مهندسی کامپیوتر، دانشگاه شهید چمران اهواز، اهواز، ایران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :