خوشهبندی اسناد با استفاده از پیوستگی مبتنی بر دانش

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 363

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IKMC07_487

تاریخ نمایه سازی: 9 مرداد 1395

Abstract:

خوشهبندی، تکنیک دادهکاوی قدرتمند در کشف موضوع از اسناد متنی است. در این زمینه الگوریتمهای خانوادهk-means به دلیل سادگی و سرعت بالا در خوشهبندی دادههای حجیم کاربرد فراوانی دارند. در این الگوریتمهامعیار شباهتcosineتنها شباهت میان زوج اسناد را اندازهگیری میکند که درمواقعی که خوشهها به خوبی تفکیک نشده باشند عملکرد مناسبی ندارد. درمقابل، مفاهیم همسایگی و پیوستگی با در نظرگرفتن اطلاعات سراسری در محاسبه میزان نزدیکی دو سند و اعمال آن در انتخاب مراکز خوشههای اولیه و در محاسبه میزان مشابهت میان اسناد، عملکرد بسیار بهتری دارند. چنانچه میزان شباهت دو سند از حد آستانهای بیشتر باشد آن دو سند همسایهاند و تعداد همسایههای مشترک میانشان، میزان پیوستگی آنها را نشان میدهد. در این مدل روابط معنایی میان کلمات نادیده گرفته شده و تنها اسنادی با واژگان مشابه به یکدیگر مرتبط میشوند. در این مقاله از آنتولوژی وردنت جهت ایجاد مدل جدید مبتنی بر دانش در نمایش اسناد بهره بردیم که در آن از روابط معنایی میان کلمات، جهت وزنگذاری مجدد فرکانس آنها در مدل فضای برداری اسناد استفاده نمودیم و سپس مفاهیم همسایگی و پیوستگی را بر روی مدل حاصل اعمال کردیم. نتایج حاصل از اعمال روش پیشنهادی بر روی مجموعه دادههای واقعی، حاکی از عملکرد مناسبتر آن نسبت به روشهای پیشین میباشد.

Authors

ملیحه دانش

مربی گروه مهندسی کامپیوتر، دانشگاه علم و فناوری مازندران، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Retrieval, second ed". Buttersworth, London. Informationه Van Rijsbergen, C. J. ...
  • Guha, S., Rastogi, R., Shim, K. (2000). "ROCK: a robust ...
  • Jain, A. K., Dubes, R. C. (1988). "Algorithms for Clustering ...
  • Kolodner J. (1993). :Case-based reasoning". Morgan Kaufmann, Menlo Park. ...
  • Li, Y. Luo, C., Chung, S. M. (2008). "Text clustering ...
  • Luo C., Li Y., Chung S.M. (2009). "Text document clustering ...
  • Miller, G. (1995).، WordNet: A lexical database for English". Commun ...
  • Zhao G. (1996). "Analogical translator: exp erience-guided transfer in machine ...
  • نمایش کامل مراجع