显卡 频道

主宰DX11新纪元!GTX480/470显卡详评测

GF100流处理器群可调配的共享存储器与L1缓存

  作为一种高速、可编程的片上存储器,共享存储器是第一代CUDA架构中的一项重要架构创新。通过促进线程间的通信,共享存储器让各种各样的应用程序均能够在GPU上高效地运行。从此共享存储器便被所有主要的GPU计算标准与同类架构所采用。

  在GF100架构中,每个SM均包含了一个专用的1级高速缓存。1级高速缓存能够起到与共享存储器互补的作用,共享存储器能够为明确界定存储器存取的算法提升存储器存取速度,而1级高速缓存则能够为这些不规则的算法提升存储器存取速度。在这些不规则算法中,事先并不知道数据地址。

  每个SM均拥有64KB容量的片上存储器,这部分存储器可配置为16KB的1级高速缓存外加48KB共享存储器,或配置为16KB共享存储器外加48KB的1级高速缓存,这就是可调配性。

  对于图形程序,GF100能够利用16KB的1级高速缓存配置。1级高速缓存的作用是充当用于寄存器溢出的缓冲区,让寄存器的使用能够实现不俗的性能提升。而如果针对计算程序,1级高速缓存以及共享存储器让同一个线程块中的线程能够互相协作,从而促进了片上数据广泛的重复利用并减少了片外的通信量。共享且可调配的存储器是使许多高性能CUDA应用程序成为可能的重要促成因素。

0
第1页:前言:第2页:GF100架构最高端GTX480实物及参数介绍:第3页:GF100架构最高端GTX480实物拆解:第4页:GF100架构次高端GTX470实物及参数介绍:第5页:GF100架构次高端GTX470实物拆解:第6页:GF100架构分析:图形处理集群第7页:GF100图形处理集群改进:PolyMorph引擎第8页:GF100图形处理集群改进:Raster引擎第9页:GF100架构分析:第三代流处理器群(SM)第10页:GF100流处理器群的双Warp调度器第11页:GF100流处理器群的纹理单元第12页:GF100流处理器群可调配的共享存储器与L1缓存第13页:GF100架构分析:高速二级缓存第14页:GF100架构分析:优化8xAA的ROP与32xAA支持第15页:GF100架构分析:面向图形方面的各种计算第16页:GF100图形计算:光线追踪与流体力学第17页:GF100的多屏幕3D环绕立体幻镜技术第18页:关于曲面细分和贴图置换的概述第19页:测试平台说明及测试介绍:第20页:理论性能测试----3Dmark Vantage第21页:DirectX10游戏:《孤岛危机:弹头》第22页:DirectX10游戏:《孤岛惊魂2》第23页:DirectX10游戏:《生化危机5》第24页:DirectX9游戏:《街头霸王4》第25页:DirectX9游戏:《星际争霸2 beta》第26页:DirectX9游戏:《极品飞车13:变速》第27页:物理加速游戏:《蝙蝠侠:阿甘疯人院》第28页:物理加速游戏:《黑暗虚空》第29页:物理加速&DX11游戏:《地铁2033》第30页:DirectX11游戏:《 科林麦克雷:尘埃2 》第31页:DirectX11游戏:《潜行者:普里皮亚季的召唤》第32页:DirectX11 DEMO:《石巨人》第33页:DirectX11游戏:《叛逆连队2》第34页:DirectX11 DEMO:《天堂 2.0》第35页:NVIDIA游戏DEMO:Realistic Character Hair 第36页:NVIDIA游戏DEMO:Realistic Water&Terrain第37页:NVIDIA游戏DEMO:RagingRapids(小船)第38页:NVIDIA游戏DEMO:SupersonicSled第39页:NVIDIA游戏DEMO:RayTracing_DesignGarage第40页:微软官方DX11性能测试DEMO测试:第41页:最强的CUDA转码压片:MediaCoder测试第42页:CUDA软件应用:Badaboom第43页:CUDA软件应用:PowerDirector(威力导演)第44页:CUDA软件应用:MotionDSP vReveal第45页:CUDA软件应用:Folding@Home 第46页:GTX480/470温度及功耗测试:第47页:总结:DX11首战终落幕 新时代将越来越精彩第48页:文章仍未终:一句话评价GF100,大奖免费拿!
相关文章