显卡 频道

NVIDIA重掌中高端市场 GTX465详细评测

  GF100流处理器群可调配的共享存储器与L1缓存

  作为一种高速、可编程的片上存储器,共享存储器是第一代CUDA架构中的一项重要架构创新。通过促进线程间的通信,共享存储器让各种各样的应用程序均能够在GPU上高效地运行。从此共享存储器便被所有主要的GPU计算标准与同类架构所采用。

GF100流处理器群可调配的共享存储器与L1缓存
可调配的共享存储器与L1缓存

  在GF100架构中,每个SM均包含了一个专用的1级高速缓存。1级高速缓存能够起到与共享存储器互补的作用,共享存储器能够为明确界定存储器存取的算法提升存储器存取速度,而1级高速缓存则能够为这些不规则的算法提升存储器存取速度。在这些不规则算法中,事先并不知道数据地址。

  每个SM均拥有64KB容量的片上存储器,这部分存储器可配置为16KB的1级高速缓存外加48KB共享存储器,或配置为16KB共享存储器外加48KB的1级高速缓存,这就是可调配性。

  对于图形程序,GF100能够利用16KB的1级高速缓存配置。1级高速缓存的作用是充当用于寄存器溢出的缓冲区,让寄存器的使用能够实现不俗的性能提升。而如果针对计算程序,1级高速缓存以及共享存储器让同一个线程块中的线程能够互相协作,从而促进了片上数据广泛的重复利用并减少了片外的通信量。共享且可调配的存储器是使许多高性能CUDA应用程序成为可能的重要促成因素。

0
第1页:前言及GTX465市场定位分析第2页:GTX465实物及参数介绍第3页:GTX465拆解第4页:GTX465散热及供电部分第5页:GF100架构分析:图形处理集群第6页:GF100图形处理集群改进:PolyMorph引擎第7页:GF100图形处理集群改进:Raster引擎第8页:GF100架构分析:第三代流处理器群第9页:GF100流处理器群的双Warp调度器第10页:GF100流处理器群的纹理单元第11页:GF100流处理器群的共享存储器/L1缓存第12页:GF100架构分析:高速二级缓存第13页:GF100架构分析:优化8xAA ROP/32xAA支持第14页:GF100架构分析:面向图形方面的各种计算第15页:GF100图形计算:光线追踪与流体力学第16页:GF100的多屏幕3D环绕立体幻镜技术第17页:关于曲面细分和贴图置换的概述第18页:测试平台说明及测试介绍:第19页:理论性能测试----3Dmark Vantage第20页:理论性能测试----Unigine Heaven 2.1第21页:DirectX10游戏:《孤岛危机:弹头》第22页:DirectX10游戏:《孤岛惊魂2》第23页:DirectX10游戏:《鹰击长空》第24页:DirectX10游戏:《世界冲突》第25页:DirectX10游戏:《生化危机5》第26页:DirectX9游戏:《街头霸王4》第27页:DirectX9游戏:《星际争霸2 beta》第28页:DirectX9游戏:《极品飞车13:变速》第29页:物理加速游戏:《蝙蝠侠:阿甘疯人院》第30页:物理加速游戏:《黑暗虚空》第31页:物理加速&DX11游戏:《地铁2033》第32页:物理加速&DX11游戏:《石巨人 DEMO》第33页:DirectX11游戏:《科林麦克雷:尘埃2》第34页:DirectX11游戏:《普里皮亚季的召唤》第35页:DirectX11游戏:《叛逆连队2》第36页:DirectX11游戏:《异形大战铁血战士》第37页:NVIDIA DEMO:Hair 第38页:NVIDIA DEMO:Water&Terrain第39页:NVIDIA DEMO:RagingRapids(小船)第40页:NVIDIA DEMO:SupersonicSled第41页:NVIDIA DEMO:RayTracing_DesignGarage第42页:CUDA软件应用:Badaboom第43页:CUDA软件应用:Folding@Home 第44页:GTX465温度及功耗测试:第45页:超频测试:小超达GTX470水平第46页:总结:第47页:索泰GTX465第48页:影驰GTX465第49页:七彩虹GTX465第50页:映众GTX465第51页:双敏GTX465第52页:旌宇GTX465第53页:耕昇非公版GTX465
相关文章