CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

الگوریتم خوشه بندی دادههای بزرگ در داده کاوی

عنوان مقاله: الگوریتم خوشه بندی دادههای بزرگ در داده کاوی
شناسه ملی مقاله: ASEA01_030
منتشر شده در اولین همایش ملی علوم کاربردی و مهندسی در سال 1395
مشخصات نویسندگان مقاله:

فتاح بیات - گروه ریاضی واحدملایر دانشگاه آزاد اسلامی ملایر ایران مربی ریاضی کاربردی دانشگاه آزاد اسلامی ملایر ایران

خلاصه مقاله:
کاربردهای زیادی وجود دارند که در آنها خوشهبندی مجموعه الگوهای بزرگ ضروری است. اکثر تقریبها و الگوریتمهای تعریف شده توانایی دستکاری این مجموعه دادههای بزرگ را ندارند.در این مقاله به بررسی مزایا و معایب هر یک از الگوریتمهای خوشهبندی برای دادههای حجیم نظیرBIRCH، CLARANS ، CURE ،COBWEB پرداخته شده است.سپس یک روش پیشنهادی جدید خوشه بندی برای دادههای بسیار بزرگ ارایه شده است و هدف این بوده است که مناسب برای حالتهایی باشد که امکان بارگذاری همزمان همه دادهها در حافظه وجود ندارد و دادهها بصورت بلاکهای متوالی بارگذاری میشوند. این الگوریتم از سه فاز اصلی تشکیل شده است، در فاز نخست فضای کل دادهها به ناحیه-های یکسان تقسیمبندی می شود، در فاز دوم ناحیه در برگیرنده هر داده مشخص شده و دادههای تعلق یافته به هر ناحیه با کمیت های حداقلی به صورت فشرده ذخیره میشوند و هر ناحیه متناظر با یک خوشه اولیه میباشد. همچنین در فاز سوم، بعضی از خوشه های اولیه بصورت سلسله مراتبی با هم ترکیب شده و خوشههای نهایی را تشکیل میدهند. برای ارزیابی کارآیی روش پیشنهادی، مجموعه داده های مصنوعی تولید شده و الگوریتم به این داده ها اعمال شده است و نتیجه خوشهبندی خوبی حاصل شده است.

کلمات کلیدی:
دادهکاوی، خوشهبندی، مجموعه دادههای بزرگ

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/616610/