ارائه یک الگوریتم موثر و تطبیق پذیر برای خوشه بندی متون مبتنی برPSO

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 573

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CSITM02_270

تاریخ نمایه سازی: 25 بهمن 1394

Abstract:

خوشه بندی متون یکی از تکنولوژی های اصلی متنکاوی و بازیابی اطلاعات است. ایده اصلی خوشه بندی اطلاعات، جداکردن نمونه ها از یکدیگر و قراردادن آنها در گروه های شبیه به هم میباشد. عملکرد الگوریتم های خوشه بندی سنتی ممکن است به دلیل ابعاد بالا و یا حجم کم داده های متنی رضایت بخش نباشد. همچنین یکی از بزرگترین مشکلات الگوریتم های سنتی پرکاربرد مانندKmeans حساسیت بالا به نقاط اولیه است. این مقاله یک روش جدید برای خوشه بندی متون بر اساس آمارهای پیکره متنی و الگوریتم بهینه سازی ذرات ارائه میدهد. در این روش نقاط اولیه نه تنها از طریق یادگیریهای آماری ماتریس تشابه اسنادی که به یک مجموعه تقسیم شده است, بلکه از طریق اسنادی که هنوز تقسیم بندی نشدهاند نیز انتخاب می شوند. با این روش میتوان میزان حساسیت الگوریتم خوشه بندی نسبت به مجموعه نقاط اولیه را کاهش داد. برخی از مقادیر آستانهی مورد استفاده در الگوریتم از آمار خودکار و بصورت پویا بدست آمده است. این مقاله همچنین از الگوریتم بهینه سازی ذرات جهت یافتن بهترین مقادیر آستانه استفاده کرده است. نتایج تجربی بدست آمده بر روی چندین مجموعه داده نشان میدهد که الگوریتم پیشنهادی قادر به ارتقاء کیفیت خوشه بندی متون در مقایسه با الگوریتم های خوشه بندی سنتی میباشد. همچنین این الگوریتم در مجموعه داده های مختلف پایدارتر میباشد.

Authors

رضا باقری

گروه کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی اراک، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Xinwu Ll. Research on Text Clustering Algorithm Based _ Agglomerative ...
  • Han JW, Kamber M. Data Mining Concepts And Techniques [M], ...
  • Steinbach M, KaryPis G Kumar V. A comparison of document ...
  • Higgs R E, Bemis K G, Watson I A, Wikel ...
  • Snarey M, Terrett N K, Willet P, Wilton D J. ...
  • Pantel P, Lin D. Document clustering with committees. In Proceedings ...
  • Conference on Research and Development in Information Retrieval (SIGIR). New ...
  • G. Karypis, E. Han, and V. Kumar, "Chameleon Hierarchical clustering ...
  • S. Guha, R. Rastogi, and K. Shim, "ROCK: A robust ...
  • Guha, Sudipto; Rastogi, Rajeev; Shim, Kyuseok (2001). "CURE: An Efficient ...
  • _ Ramakrishnan, R.; Livny, M. (1996). "BIRCH: an efficient data ...
  • نمایش کامل مراجع