ارزیابی عملکرد کرنل opencl در CPU های چند هسته ای

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 596

This Paper With 18 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCC03_101

تاریخ نمایه سازی: 6 اردیبهشت 1396

Abstract:

با توجه به هدف طراحی قابلیت حمل پذیری OpenCL، از این پلت فرم علاوه بر استفاده در محیط های GPU، در پردازندههای چندهستهای نیز قابل بهرهبرداری میباشد. یکی از مسایل مربوطه به این پلت فرم در محیط های CPU قابلیت حمل پذیری عملکرد OpenCL است. در این مقاله تاثیر دانهبندی در بهبود عملکرد کرنل OpenCL مورد بررسی قرار می گیرد. با انجام آزمایش هایی برای چند برنامه از بنچمارک Rodinia در پردازندهی چندهستهای با مجموعه داده های مختلف بهترین دانه بندی برای هر یک از برنامه ها به صورت تجربی انتخاب میشود. با توجه به این آزمایشها و کمک گرفتن از دادههای عملکرد پردازنده Hardware performance counters) از جمله میزان cache-miss، عوامل موثر در بهترین دانه بندی شناسایی می شوند تا بتوان مقدار بهینه ی این متغیر را با توجه به الگوی دسترسی و جریان یک کرنل OpenCL، بهترین دانهبندی را برای آن حدس زد. در این مقاله، علت تاثیرگذاری تغییرات عملکرد با تغییر اندازه work-group برررسی شده و برنامه ها در آن اندازه work-group بهینه با توجه به خروجی ابزار perf قابل توجیه است.

Authors

عطیه جواهری

کارشناسی ارشد کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی نوشیروانی بابل

مجتبی منصوری

استادیار دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی نوشیروانی بابل

علی غلامی رودی

استادیار دانشکده مهندسی برق و کامپیوتر، دانشگاه صنعتی نوشیروانی بابل

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • J, Hwan Lee. N, Nimit. K, Hyesoon. et al. (2015). ...
  • J, Shen. J, Fang. H, Sips. et al. (2013). An ...
  • Parallel Computing. Elsevier. vol. 39. 834-850 ...
  • R, Membarth, F, Hannig. J, Teich, et al. (2011). Frameworks ...
  • A, Ali. U, Dastgeer. C, Kessler. (2012). OpenCL for programming ...
  • MULTIPRO, in conjunction with HiPEAC 2012. paris. ...
  • A, Ali. (2013). Comparative study of parallel programming models for ...
  • Linkoping University. Sweden. (2013). 187. ...
  • Rodinia3, 1. Available from:http : /lava. cs _ virginia. edu/Ro ...
  • J, Shen. J, Fang. H, Sips. et al. (2012). "Performance ...
  • J, Shen. J, Fang. H, Sips. et al. (2013). Performance ...
  • Lee, Jaejin. Jo, Gangwon Lee. Jun Seo, Sangmin. (2013). Automatic ...
  • D, B lack-schaffer. introduction o opencl programming. 2012. 1-14. ...
  • perf. Available from: https :/perf.wiki .kernel. org/index .php/Tutorial _ Accessed ...
  • نمایش کامل مراجع