Equal bi-Vectorized (EbV) method to high performance on GPU

Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: English
View: 1,502

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ISME20_204

تاریخ نمایه سازی: 18 تیر 1391

Abstract:

Due to importance of reducing of time solution in numerical codes, we propose an algorithm for parallel LU decomposition solver for dense and sparse matrices on GPU. This algorithm is based on first bi-vectorizing a triangular matrices of decomposed coefficient matrix and then equalizing vectors. So we improve performance of LU decomposition on equal contributed scheme on threads. This algorithm also is convenient for other parallelism method and multi devices. Several test cases show advantage of this method over other familiar method

Authors

Seyyed Amirreza Hashemi

Department of Mechanical Engineering, Isfahan University of Technology

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • NVIDIA CUDA C Programming Guide, NVIDIA, May 2010 ...
  • N. Bell and M Garland, "Implementing sparse matrix-vector multiplication On ...
  • M. Garland and N. Bell, Efficient sparse matrix- vector multiplication ...
  • M. ten Bruggencate and S. Chalasani, :Parallel i mp lementations ...
  • Performanceء [5] S. Liu, Y.Zhang, X. Sun and R. Qiu, ...
  • X. Wang and S. G. Ziavras, "Parallel direct solution of ...
  • P. Amestoy, I. Duff, and J.-Y. L Excellent, "Multifrontal parallel ...
  • Cuda toolkit 4.0 cublas library. User Guide. NVIDIA. ...
  • test is visual studio 2008 and using _ CUDA toolkit3.2 ...
  • 0143 0.0572 ).2056 0.9205 10.123 ...
  • Table 2: Result by GPU and CPC CPU, s 0.0156 ...
  • نمایش کامل مراجع