الگوریتم خوشه بندی اسناد بر پایه الگوریتم K-MEANS بهبود یافته

محمدرضا بهشتی پور; بهروز مینایی بیدگلی; محمدحسین الهی منش; عباس غلامزاده مراغه

الگوریتم خوشه بندی اسناد بر پایه الگوریتم K-MEANS بهبود یافته

Publish place: 16th Iran"s Electrical Engineering Student Conference

Publish Year: 1392

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 7 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/265294

شناسه ملی سند علمی:

ISCEE16_233

تاریخ نمایه سازی: 21 تیر 1393

Abstract:

خوشه بندی یکی از مسائل مهم داده کاوی است که هدف آن گروه گروه کردن تعدادی از اشیاء به طوری است که اشیاء درون یک گروه به هم شباهت بیشتری داشته و اشیاء دو گروه مختلف نسبت به هم متفاوت باشند. در این مقاله به مسئله خوشه بندی اسناد پرداخته شده است. الگوریتم خوشه بندی به کاررفته بر اساس الگوریتم K-Means است. اعمال تغییراتی در این الگوریتم از جمله تعیین تعداد تکرار مرحله پالایش برحسب یک مقدار آستانه، اعمال تکنیک N-Gram و تکنیک های دیگر باعث افزایش درصد موفقیت الگوریتم، بیش از 12 درصد در مجموعه فارسی آزمایش شده و حدود 25 درصد در مجموعه انگلیسی آزمایش شده، شده است.

Keywords:

الگوریتم K-Means , الگوریتم K-Means بهبود یافته , پردازش متن , خوشه بندی اسناد

Authors

محمدرضا بهشتی پور

دانشگاه صنعتی مالک اشتر

بهروز مینایی بیدگلی

دانشگاه علم و صنعت ایران

محمدحسین الهی منش

دانشگاه آزاد اسلامی واحد قزوین، قزوین

عباس غلامزاده مراغه

دانشگاه صنعتی مالک اشتر