خوشه بندی اسناد ایکس ام ال با رویکردی مبتنی بر سطح و هستی شناسی کلمات درشبکه های معنایی

Publish Year: 1393
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 855

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IPRIA02_040

تاریخ نمایه سازی: 28 شهریور 1394

Abstract:

منابع متنی موجود در وب که دارای ساختار مبتنی بر ایکس ام ال می باشند به سرعت در حال افزایش هستند و یکی از روش هایمتداول برای سازماندهی آنها استفاده از شیوه های خوشه بندی می باشد. ارزیابی شباهت به عنوان یک مسئاله مهم در خوشه بندی مطرح استو الگوریتم های زیادی در این زمینه بر اساس ساختار و محتوا ارائه شدهاند. در خوشه بندی با چالش هایی مانند ابعاد بالا و دقت مواجه هستیم،در ارزیابی شباهت محتوا انتخاب کلمات کلیدی می تواند در رفع این چالش ها بسیار موثر باشد و استفاده از اطلاعات معنایی میتواند منجر بهانتخاب مناسب این کلمات شود، که این اطلاعات به صورت مجموعه های هستی شناسی مانند وردنت موجود می باشند. از این رو در این مقالهتمرکز بر استفاده از شبکه های معنایی به منظور کاهش ابعاد و افزایش دقت بوده و رویکرد پیشنهادی با تعیین سطوح کلمات در شبکه معنایی ومفاهیم نظریه اطلاعات و تشکیل زنجیره های معنایی کلمات و انتخاب کلمات کلیدی مناسب ارائه می شود، نتایج به دست آمده در مقایسه باکارهای گذشته نشان دهنده افزایش میانگین دقت و شاخص خوشه بندی به میزان 0.28 و 0.24 می باشد.

Authors

سارا اسدی حقی

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد قزوین، قزوین، ایران

فریبرز محمودی

استادیار، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد قزوین، قزوین، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • C. Bouras and V Tsogkas, "A clustering technique for news ...
  • _ _ _ _ _ Similarity in Vol.9, No.3, pp.343-349, ...
  • techniques in computing science and software engineering, pp.181-186, 2010. ...
  • Text Summarization Automated"ه [4]M. Pourvali and . Saniee Abadeh, Base ...
  • of hierarchical data using pq grams" ACM VLDB _ Proceedings ...
  • _ _ _ _ Distance and Inclusion", I [10] W. ...
  • W. Viyanon and S. K.Madria, "A System for Detecting XML ...
  • B. Liu and R. Grossman and Y. Zhai "Mining Web ...
  • P. Resnik, "Using Information Content to Evaluate Semantic Similarity in ...
  • L. kaufman and p. rOusseeuw, finding groups in data, wiley ...
  • Sense Wordء [16] A. Tagarelli and M. Longo and S. ...
  • S. Fodeh and B Punch and P. Ning Tan, _ ...
  • I. Czarnowski and P. J.edrzejowicz, "Agent-Based Non-distributed and Distributed Clustering" ...
  • نمایش کامل مراجع