پیاده سازی الگوریتم خوشه بندی سلسله مراتبی تراکمی بصورت موازی با روش نگاشت و کاهش

Publish Year: 1399
نوع سند: مقاله ژورنالی
زبان: Persian
View: 324

This Paper With 19 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_JIPET-11-41_002

تاریخ نمایه سازی: 20 تیر 1400

Abstract:

: مدل نگاشت-کاهش یک مدل برای اجرای برنامه های کاربردی داده های بزرگ می باشد. همچنین این مدل، یک مدل برنامه نویسی موازی برای نوشتن برنامه هایی می باشد که می توانند بر روی ابر اجرا شوند. سازمان ها بطور فزاینده ای در حال تولید داده هستند که حاصل فرایندهای کسب وکار ، فعالیت های کاربران، ردیابی وب سایت ها، حسگرها، مالی، حسابداری و غیره تولید می شوند. الگوریتم های خوشه بندی داده، به عنوان ابزاری برای تجزیه و تحلیل حجم زیاد داده به کار می روند. هدف اصلی این الگوریتم ها، این است که داده ها را در خوشه هایی دسته بندی کنند، و اشیای داده در هر خوشه با یکدیگر شباهت دارند. در این مقاله، الگوریتم خوشه بندی سلسله مراتبی متراکم که یکی از تکنیک های داده کاوی می باشد با استفاده از طراحی نگاشت و کاهش پیاده سازی شده و سپس نتایج این الگوریتم با حالت بدون نگاشت و کاهش مورد مقایسه قرار می گیرد. آزمایش های انجام شده نشان می دهد با افزایش اندازه داده های ورودی، زمان اجرا کاهش می یابد. زمان اجرای الگوریتم به روش موازی نسبت به روش ترتیبی برای مجموعه داده ای به اندازه ۲۰۰ شی داده، ۱۶.۸۰% و برای مجموعه داده ای به اندازه ۱۰۰۰ شی داده، ۲۹.۲۶% بهبود یافت. همچنین درصد استفاده از پردازنده کل سیستم در روش موازی از ۲۲% به ۹۴% ارتقاء یافت.

Keywords:

نگاشت-کاهش , هادوپ , الگوریتم های خوشه بندی داده , پردازش موازی

Authors

فهیمه توکلی

دانشکده مهندسی کامپیوتر-واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران

فرامرز صافی اصفهانی

مرکز تحقیقات مه داده- واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • E. Begoli and J. Horey, "Principles for Effective Knowledge Discovery ...
  • A. Jain and R. Dubes,” Algorithms for Clustering Data”, NJ: ...
  • Jain, A.K., Murty, M.N. and Flynn, P.J., “Data clustering: a ...
  • Dean, J. and Ghemawat, S., “MapReduce: simplified data processing on ...
  • Rohlf, F.J., "Hierarchical clustering using the minimum spanning tree Computer", ...
  • F. Murtagh, "Multidimensional Clustering Algorithms," Physica-Verlag, ۱۹۸۵ ...
  • J. Ward, "Hierarchical grouping to optimize an objective function," Journal ...
  • G. Lance and W. Williams, "A General Theory of Classificatory ...
  • W. Pengcheng, H. Fangcheng, L. Li, S. Chuanfu and J. ...
  • D. C. Radhika. P. Lalita., "Distributed clustering for big data ...
  • S. Alshammari, M. Binti Zolkepli, B. A. Rusli, "Genetic algorithm ...
  • Y. Miao, J. Zhang, H. Feng, L. Qiu and Y. ...
  • P. P. Anchalia, A. Koundinya and S. Nk, "MapReduce design ...
  • W. Zhao, H. Ma, Q. He, “Parallel K-means clustering based ...
  • J. Ragaventhiran, D. M. Kavitha, "Map-optimize-reduce: CAN tree assisted FP-growth ...
  • T. Habib Sardar, Z. Ansari, "An analysis of MapReduce efficiency ...
  • M. A. B. Haj-Kacem, C.-E. Ben N’cir. N. Essoussi., "One-pass ...
  • S. Chowdam., N. Kasiviswanath. P. C. Reddy., "Clustering large datasets ...
  • D. Teffer, R. Srinivasan, J. Ghosh, "AdaHash: Hashing-based scalable, adaptive ...
  • M. Ngazimbi, "Data clustering using MapReduce", PhD Thesis, Boise State ...
  • T. Sun, C. Shu, F. Li, H. Yu, L. Ma, ...
  • S. Papadimitriou, J. Sun, "DisCo: Distributed co-clustering with MapReduce:A case ...
  • E. M. Rasmussen and P. Willett, "Efficiency of hierarchical agglomerative ...
  • C. F. Olson, "Parallel Algorithms for Hierarchical Clustering", Parallel Computing, ...
  • Z. Li, K. Li, D. Xiao, L. Yang, "An adaptive ...
  • S. Rajasekara, "Efficient parallel hierarchical clustering algorithms", IEEE Trans. on ...
  • M. Dash, S. Petrutiu, P. Scheuermann, "Efficient parallel hierarchical clustering", ...
  • S. Guha, R. Rastogi, K. Shim, "ROCK: A robust clustering ...
  • G. Karypis, E. Han, V. Kumar, "CHAMELEON: A hierarchical clustering ...
  • E. L. Johnson, H. Kargupta, "Collective, hierarchical clustering from distributed, ...
  • N. Samatova, G. Ostrouchov, A. Geist and A. Melec, "RACHET: ...
  • H. Gao, J. Jiang, L. She, Y. Fu, "A new ...
  • T. Zhang, R. Ramakrishnan, M. Livny, "BIRCH: An efficient data ...
  • "Apache Hadoop," [Online]. Available: http://hadoop.apache.org. [Accessed ۲۰۱۹] ...
  • نمایش کامل مراجع