CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر خوشه بندی در علم داده کاوی

عنوان مقاله: مروری بر خوشه بندی در علم داده کاوی
شناسه ملی مقاله: ECDS08_030
منتشر شده در هشتمین همایش ملی علوم و مهندسی دفاعی با رویکرد تهدیدات نوپدید در سال 1400
مشخصات نویسندگان مقاله:

محسن نوروزی - دکتری کامپیوتر، دانشکده کامپیوتر، شبکه و ارتباطات، دانشگاه امام حسین (ع)، تهران، ایران
علی ارشقی - دکتری برق مخابرات، دانشکده کامپیوتر، شبکه و ارتباطات، دانشگاه امام حسین (ع)، تهران، ایران

خلاصه مقاله:
خوشه بندی یک تکنیک بدون نظارت در علم داده کاوی برای دسته بندی اطلاعات است که نقش برجسته ای درفعالیت های داده کاوی نظیر استخراج متن، تجزیه و تحلیل وب، بازیابی اطلاعات، زیست شناسی محاسباتی،بازاریابی و غیره دارد. از دیدگاه یادگیری ماشین، خوشه ها با الگوهای پنهان مطابقت داشته و سیستم حاصل ازآن یک مفهوم را نشان خواهد داد که نقش برجسته ای در تصمیم گیری های سازمانی دارد. در این مقاله ما بامفهوم خوشه بندی آشنا شده و سپس به بیان الگوریتم های خوشه بندی میپردازیم و شیوه پردازش یکی ازمهمترین الگوریتم های آن در سیستم های هدوپ را بیان می کنیم.

کلمات کلیدی:
داده کاوی، خوشه بندی، k-means ، نگاشت کاهش، فاصله، میانه

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1577123/