الگوریتم خوشه بندی اسناد بر پایه الگوریتم K-MEANS بهبود یافته

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,368

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ISCEE16_233

تاریخ نمایه سازی: 21 تیر 1393

Abstract:

خوشه بندی یکی از مسائل مهم داده کاوی است که هدف آن گروه گروه کردن تعدادی از اشیاء به طوری است که اشیاء درون یک گروه به هم شباهت بیشتری داشته و اشیاء دو گروه مختلف نسبت به هم متفاوت باشند. در این مقاله به مسئله خوشه بندی اسناد پرداخته شده است. الگوریتم خوشه بندی به کاررفته بر اساس الگوریتم K-Means است. اعمال تغییراتی در این الگوریتم از جمله تعیین تعداد تکرار مرحله پالایش برحسب یک مقدار آستانه، اعمال تکنیک N-Gram و تکنیک های دیگر باعث افزایش درصد موفقیت الگوریتم، بیش از 12 درصد در مجموعه فارسی آزمایش شده و حدود 25 درصد در مجموعه انگلیسی آزمایش شده، شده است.

Keywords:

الگوریتم K-Means , الگوریتم K-Means بهبود یافته , پردازش متن , خوشه بندی اسناد

Authors

محمدرضا بهشتی پور

دانشگاه صنعتی مالک اشتر

بهروز مینایی بیدگلی

دانشگاه علم و صنعت ایران

محمدحسین الهی منش

دانشگاه آزاد اسلامی واحد قزوین، قزوین

عباس غلامزاده مراغه

دانشگاه صنعتی مالک اشتر