با گسترش روزافزون کاربری اینترنت و استفاده از مستندات دیجیتالی، نیاز به ابزارها و تکنیکهایی برای سازماندهی، مرتبسازی و بازیابی اطلاعات بیشتر احساس میشود.
خوشهیابی مستندات یکی از روشهای متعارف برای این منظور است. در این مقاله از یک روش خوشهیابی ترکیبی بر مبنای دو روش خوشهیابی مورچهای و
خوشهیابی فازی استفاده شده است. ابتدا از خوشهیابی مورچهای برای تولید خوشههای خام و اولیه استفاده شده و بعد این خوشهها با استفاده از الگوریتم خوشهیابی fuzzy C-Means(FCM) اصلاح میشوند. سپس این خوشهها با استفاده از معیار بیشترین درجه عضویت غیرفازی شده و به عنوان واحدهای سازندهی الگوریتم خوشهیابی در مراحل بعدی استفاده میشود. این فرایند تا تشکیل خوشههای بزرگتر ادامه مییابد.
مستندات خوشه شده را می توان به صورت پویا در درختی از موضوعات نمایش دا د. این موضوعات به صورت خودکار و با توجه به محتوای مستندات هر خوشه تولید م یشوند. نتایج خوش هیابی با استفاده از مجموعه ی مستندات،REUTERS ارائه شده و بهبود در کیفیت خوشهیابی در مقایسه با به کارگیری مجزای هر کدام از روشهای
خوشهیابی فازی و خوشهیابی مورچهای دیده شده است.