بهبود زمان اجرای الگوریتم خوشه بندی k-means با استفاده از خلاصه سازی داده های ورودی و مدل نگاشت - کاهش

محدثه, درویش زاده; هدی, مشایخی

بهبود زمان اجرای الگوریتم خوشه بندی k-means با استفاده از خلاصه سازی داده های ورودی و مدل نگاشت - کاهش

عنوان مقاله: بهبود زمان اجرای الگوریتم خوشه بندی k-means با استفاده از خلاصه سازی داده های ورودی و مدل نگاشت - کاهش
شناسه ملی مقاله: ITCC01_386
منتشر شده در کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر ومخابرات در سال 1394

مشخصات نویسندگان مقاله:

محدثه درویش زاده - گروه کامپیوتر، پردیس علوم و تحقیقات شاهرود، دانشگاه آزاد اسلامی واحد شاهرود، ایران
هدی مشایخی - دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه شاهرود، شاهرود، ایران

خلاصه مقاله:

الگوریتم k-means یکی از کاربردی ترین الگوریتم های خوشه بندی می باشد، که به دلیل سادهو قابل فهم بودن مورد توجه قرار گرفته است. در حالت کلی زمانی که حجم داده های ورودی بهالگوریتم خوشه بندی k-means زیاد شود، کارایی آن به دلیل محاسبات زیاد کاهش می یابد. دراین مقاله، یک الگوریتم خوشه بندی تقریبی مبتنی بر k-means را ارائه می کنیم که در آن باخلاصه سازی داده ها حجم محاسبات تا حد زیادی کاهش می یابد. فرآیند خلاصه سازی داده ها برمبنای دو پارامتر فاصله و زاویه داده ها از یک مبدا مختصات انجام شده و داده های نزدیک به هم بهعنوان یک مجموعه در نظر گرفته می شوند. سپس نماینده وزنی داده ها جایگزین مجموعه دادهمی گردد. از سوی دیگر برای کاهش زمان اجرا از مدل موازی نگاشت کاهش برای خلاصه سازی -داده های ورودی و همچنین اجرای الگوریتم، استفاده می کنیم. پیاده سازی الگوریتم پیشنهادی ومقایسه آن با خوشه بندی مرسوم k-means نشان دهنده بهبود پیچیدگی زمانی خوشه بندی به مقدارقابل توجه می باشد.

کلمات کلیدی:

خوشه بندی، خوشه بندی k-means ، مدل نگاشت - کاهش، پردازش موازی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/451173/