ارائه راهکاری برای خوشه بندی داده های بسیارحجیم به منظور اهداف داده کاوی

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 587

This Paper With 20 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IKMC07_388

تاریخ نمایه سازی: 9 مرداد 1395

Abstract:

کاربردهای زیادی وجود دارند که درآنها خوشه بندی مجموعه الگوهای بزرگ ضروری است اکثرتقریب ها و الگوریتم های تعریف شده توانایی دستکاری این مجموعه داده های بزرگ را ندارند دراین مقاله به بررسی مزایا و معایب هریک ازالگوریتم های خوشه بندی برای داده های حجیم نظیر CURE ، CLARANS، BIRCHوCOBWEB پرداخته شده است سپس یک روش پیشنهادی جدید خوشه بندی برای داده های بسیار بزرگ ارایه شده است و هدف این بوده است که مناسب برای حالتهایی باشد که امکان بارگذاری همزمان همه داده ها درحافظه وجود نداردوداده ها بصورت بلا های متوالی بارگذاری میشوند این الگوریتم ازسه فاز اصلی تشکیل شده است درفاز نخست فضای کل داده ها به ناحیه های یکسان تقسیم بندی میشوند درفاز دوم ناحیه دربرگیرنده هرداده مشخص شده و داده های تعلق یافته به هرناحیه باکمیت های حداقلی به صورت فشرده ذخیره میشوند و هرناحیه متناظر بایک خوشه اولیه می باشد همچنین درفاز سوم بعضی ازخوشه های اولیه بصورت سلسله مراتبی باهم ترکیب شده و خوشه های نهایی را تشکیل میدهند برای ارزیابی کارایی روش پیشنهادی مجموعه داده های مصنوعی تولید شده و الگوریتم به این داده ها اعمال شده است و نتیجه خوشه بندی خوبی حاصل شده است

Keywords:

داده کاوی , خوشه بندی , مجموعه داده های بزرگ

Authors

فتاح بیات

مربی ریاضی کاربردی دانشگاه آزاد اسلامی ملایر ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • 29 بهمن ماه 1393 مرکز همایش های بین المللی سشهید ...
  • A.Moore. (1999). "Very fast EM-based mixture modl clustering using multiresolution ...
  • Agrawal, R.. Gehrke, J., Gunopulos, D., & Raghavan, P. (1998). ...
  • Banerjee, A., & Ghosh, J. (2002). "On scaling balanced clustering". ...
  • BRADLEY, P S., FAYYAD, U., & REINA, C. (1998). "Scaling ...
  • Bo Thiesson, Christopher Meek, and David Heckerman. (2001). "Accelerating EM ...
  • Beckmann, N., H.-P. Kriegel, R. Schneider, and B. Seeger. (1990). ...
  • Robust Acces Method for Points and Rectangles, " In Proc. ...
  • Christopher R. Palmer and Christos Faloutsos. (200 1)."Density biased sampling: ...
  • Dasgupta, S. (2000). "Experiments with random projection". In Proceedings of ...
  • DHILLON, I., &MODHA, D. (1999). " A data-clustering algorithm on ...
  • Fayyad, U. M., Reina, C., & Bradley, P. S. (1998). ...
  • Faloutsos, C., & Lin, K. (1995). Fastmap:"A fast algorithm for ...
  • FISHER, DOUGLAS H (1 987). "Knowledge acquisition via incremental conceptual ...
  • George Karypis, Eui-Hong (Sam) Han, and Vipin Kumar.(1 999). "Chameleon: ...
  • Ganti, V., Gehrke, J., & Ramakrishnan, R. (1999). _ CACTUSc ...
  • Feb. 17- 18, 2015 Beheshti _ Conference Center Tehran, _ ...
  • Guttman, A.(1984). "R-trees: A Dynamic Index Structure for Spatial Searching, ...
  • Nong Ye.(2003)."THE HANDBOOK OF DAT A MINNG", LAWRENCE ERLBAUM ASSOCIATES ...
  • HAR-PELED, SARIEL, &MAZUM DAR, SOHAM. (2004). "Coresets for k-means and ...
  • Jain, A. K., Murty, M. N., & Flynn, P. J. ...
  • R. T. Ng and J. Han. (1994). "E_cient and e_ective ...
  • RAKESH AGRAWAL, JOHANNES GEHRKE, DIMITRIOS GUNOPULO S , PRAB HAKAR ...
  • Sudipto Guha, Rajeev Rastogi, and Kyuseok Shim.(1998). "CURE - _ ...
  • Feb. 17- 18, 2015 Beheshti _ Conference Center Tehran, _ ...
  • نمایش کامل مراجع