خوشه بندی داده های جریانی با توجه به تاریچه تکامل خوشه ها

جمیله حسینی; عادل قاضی خانی

خوشه بندی داده های جریانی با توجه به تاریچه تکامل خوشه ها

Publish place: Third National Conference on Electrical and Computer Engineering

Publish Year: 1398

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 12 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1005926

شناسه ملی سند علمی:

ISCELEC03_087

تاریخ نمایه سازی: 14 فروردین 1399

Abstract:

جریان داده به دنباله ای نامحدود از داده های گفته می شود که به طور پیوسته در حال تولید است و از سیستم های بلادرنگ جمع آوری و مورد تجزیه و تحلیل قرار می گیرند. خوشه بندی از مهم ترین مسائل یادگیری بدون نظارتو از مرسوم ترین تکنیک های داده کاوی می باشد که هدف آن پیدا کردن خوشه های مشابه در بین نمونه های ورودی داده می باشد الگوریتم K_Means نیز یکی از معروف ترین الگوریتم خوشه بندی است که با وجود مزایای زیادی که دارد یک محدودیت عمده دارد آن هم مشخص کردن تعداد خوشه ها یعنی k می باشد . در الگوریتم های K_Means یک الگوریتم تکاملی سریع برای خوشه بندی جریان داده ها می باشد که به طور خودکار اجازه برآورد k از داده ها را به صورت آنلاین می دهد. در این پژوهش ما یک الگوریتم تکاملی سریع را با استفاده ازتاریخچه تکامل خوشه ها برای خوشه بندی جریان داده ها بهبود دادیم. در این روش ما از یک بار برای بهبود صحت استفاده کردیم. نقطه قوت الگوریتم پیشنهادی در خوشه بندی در ترکیب با الگوریتم ژنتیک و حفظ مقادیر به صورت بهترین بهترین ها در متغیری مانند بافر است و برای ارزیابی الگوریتم پیشنهادی از سه دیتاست واقعی استفاده کردیم و میزان بهبود صحت که همان معیار ss هست را بر روی آن سنجیدیم که به بهبود قابل ملاحظه ای دست یافتیم. در نیتجه، این تجزیه و تحلیل می تواند برای درک رفتار هر خوشه از آغاز داده های جریانی مفید باشد.

Keywords:

خوشه بندی جریان داده ها , الگوریتم های تکاملی , رانش مفهوم , جریان داده , خوشه بندی k_means

Authors

جمیله حسینی

دانشجوی مقطع کارشناسی ارشد دانشگاه امام رضا (ع)

عادل قاضی خانی

استادیار گروه کامپیوتر دانشگاه امام رضا (ع)