章节总结

  • 在现实世界的应用中,大多数性能瓶颈都与CPU后端有关。这并不令人惊讶,因为所有与内存相关的问题,以及低效的计算,都属于这一类。
  • 内存子系统的性能增长并没有跟上CPU性能的增长速度。然而,在许多应用中,内存访问是性能问题的常见来源。加速这类程序需要重新审视它们的内存访问方式。
  • 在[@sec:MemBound]部分,我们讨论了一些流行的技巧,用于创建对缓存友好的数据结构、内存预取,以及利用大内存页来提高DTLB(直接翻译表项缓冲)性能。

results matching ""

    No results matching ""