CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهینه سازی الگوریتم خوشه بندی متن با ارائه یک روش ترکیبی کاهش ابعاد با ادغام روش های انتخاب ویژگی و استخراج ویژگی

عنوان مقاله: بهینه سازی الگوریتم خوشه بندی متن با ارائه یک روش ترکیبی کاهش ابعاد با ادغام روش های انتخاب ویژگی و استخراج ویژگی
شناسه ملی مقاله: CONFIT01_1131
منتشر شده در اولین کنفرانس بین المللی فناوری اطلاعات، مدیریت و کامپیوتر در سال 1403
مشخصات نویسندگان مقاله:

آرش قاضی سعیدی - کارشناس ارشد تحول دیجیتال، دانشگاه مهرالبرز، تهران

خلاصه مقاله:
خوشه بندی یک روش بسیار قدرتمند برای کشف گروه ها و وابستگی های طبیعی در یک مجموعه داده می باشد. روش های کاهش ابعاد مختلفی معرفی شده اند و از آنجایی که هر روش کاهش ابعاد از استراتژی های مختلفی برای انتخاب یک زیر مجموعه از ویژگی ها استفاده می کند، نتیجه آنها زیرمجموعه های مختلفی از ویژگی ها برای مجموعه داده های مشابه می باشد. یک رویکرد ترکیبی شامل جنبه های مختلف برای انتخاب زیر مجموعه ای از ویژگی ها، می تواند بسیار موثر واقع شود. در این پژوهش ابتدا رویکرد اجتماع روی ویژگی های انتخاب شده برتر و سپس رویکرد اشتراک بر روی ویژگی های باقی مانده در فهرست زیرمجموعه ها اعمال می شوند که بدون افزایش زیاد ابعاد فضای ویژگی ها تضمین می شود. مطالعات تجربی به وضوح نشان می دهد که روش پیشنهادی دقت خوشه بندی را در مقایسه با روش های دیگر بهبود می بخشد.

کلمات کلیدی:
خوشه بندی متن؛ روش های کاهش ابعاد ترکیبی؛ انتخاب ویژگی ؛ استخراج ویژگی؛ تجزیه و تحلیل اجزای اصلی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/2084423/