Prefetching L1 Data Cache Misses

Publish Year: 1384
نوع سند: مقاله کنفرانسی
زبان: English
View: 1,034

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI11_274

تاریخ نمایه سازی: 5 آذر 1390

Abstract:

Hardware prefetching schemes that divide misses into a number of streams, are preferred to other schemes. However, as they do not know when the next miss of a stream happens, they cannot effectively decide when to prefetch a block. Some of them use a substantial amount of storage to prefetch the predicted miss blocks of all streams and the others prefetch all target addresses, including those blocks that are already in the L1 data cache. This paper predicts the stream of the next miss and then prefetches only the next miss address of that stream. It offers a general prefetching framework, Two-Phase Prediction (TPP), that lets each stream have its own address predictor. Comparing TPP with stream buffers using SPEC CPU 2000 benchmarks shows that 1) TPP outperforms stream buffers in almost 90% of programs; in some programs, it is over 50% better than stream buffers. 2) Except one program, the rate of TPP useful prefetches is always better than that of stream buffers. In average, the rate of TPP useful prefetches is 5 times better than that of stream buffers.

Authors

Ali Mahjur

Computer Engineering DepartmentSharif University of TechnologyTehran, Iran

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Austin, T., Larson, E., Ernst, D., "SimpleScalar: an infrastructure for ...
  • effective on-chip preloading An؛" [2] Baer, J. L., Chen, T. ...
  • Baer, J. L., Chen, T. F., "Effective hardware-b ased data ...
  • Transactions on Computers, Vol. 44, No. 5, May 1995, pp. ...
  • M. J. Charney and T. R. Puzak, "Prefetching and memory ...
  • Eickemeyer, R. J., Vassiliadis, S., ":A load instruction unt for ...
  • نمایش کامل مراجع