خوشه بندی موضوعی اسناد XML در موتورهای جستجو

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 921

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CESD01_190

تاریخ نمایه سازی: 25 اسفند 1392

Abstract:

امروزه موتورهای جستجو نقش مهمی برای دسترسی به اطلاعات در فضای وب دارند. حجم زیاد نتایج باعث سردرگمی کاربران می شود. بنابراین خوشه بندی نتایج جستجو و انتخاب یک برچسب مناسب مبتنی بر محتوای هر خوشه، ضروری است. در این مقاله سعی شده است نتایجی که در جستجوی اسناد XML بدست می آیند با استفاده از داده کاوی به شکلی کارا خوشه بندی و سپس برچسب گذاری شوند. ازآنجا که عمل برچسب گذاری گام بلافصل پس از خوشه بندی می باشد اکثر روش های برچسب گذاری، منتج از الگوریتم های خوشه بندی می باشند. دراین مقاله نیز با ایجاد تغییراتی در یک الگوریتم خوشه بندی بهینه، قابلیت برچسب گذاری خوشه ها را به آن اضافه کرده ایم. الگوریتم پیشنهادی تحت عنوان CLXCLS قادر است اسناد XML را دریافت و حین انجام خوشه بندی، اطلاعات لازم برای برچسب گذاری را جمع آوری کند و در نهایت پس از برقراری ارتباط با یک پایگاه داده لغوی و تحلیل داده ها، به کمک بیشترین تکرار عناصر و مشابهت ساختاری، مناسب ترین برچسب برای هر خوشه را پیشنهاد دهد. نتایج حاصل از ارزیابی الگوریتم روی مجموعه معتبری از داده ها با استفاده از معیار کلمات پرتکرار و پیشگویانه نشان دهنده برتری الگوریتم پیشنهادی در دقت و نزدیکی برچسب های انتخاب شده نسبت به روش های موجود می باشد.

Authors

حامد زجاجی

عضو هیئت علمی دانشگاه آزاد اسلامی واحد سبزوار

مهدی رواخواه

عضو هیئت علمی دانشگاه آزاد اسلامی واحد فریمان

محمد علیشاهی

عضو هیئت علمی دانشگاه آزاد اسلامی واحد فریمان

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Popescul A.. Ungar L. H., "Automatic Labeling of Document Clusters." ...
  • Nayak, R. 2008. Fast and effective clustering of XML data ...
  • Wang, K. and Xu, C. 1999. Clustering transactions using large ...
  • Ying, Y., Guan, X. and You, J. 2002. CLOPE: a ...
  • M. Alishahi, M. Naghibzadeh "Tag Name Structure-based Clustering of XML ...
  • http : //www. c S , washington. edu/re se arch/xml ...
  • http : //www. c S , wisc _ edu/hi agara/data. ...
  • نمایش کامل مراجع