显卡 频道

主宰DX11新纪元!GTX480/470显卡详评测

GF100架构分析:第三代流处理器群(SM)

  从G80到GT200再到GF100,NVIDIA GPU的流处理器群(SM)已经升级至第三代,每一代各部分单元的配比都不一样。第三代SM在架构上引入了多项革新,使其不仅成为迄今为止最强大的SM,而且还是可编程性最强、效率最高的SM。

  GF100架构每个SM都有32个CUDA处理器,达到了之前SM中处理器数量的四倍。GF100的CUDA核心专为在着色器的任何负荷下均实现最高性能以及最高效率而设计。通过采用全标量架构,无论输入向量尺寸如何,都能够实现全部性能。Z缓冲区(1D)或纹理存取(2D)方面的操作均可充分利用GPU资源,再不受旧有的固定4D算法的约束。

  每一个CUDA处理器都拥有一个完全流水线化的整数算术逻辑单元(ALU)以及浮点单元(FPU)。GF100采用了全新的IEEE754-2008浮点标准,能够为单精度以及双精度算术提供融合的乘法加法(FMA)指令。FMA在一个最终的四舍五入步骤中即可完成乘法与加法运算,改进了乘法加法(MAD)指令,在加法中不会损失精度。FMA在处理紧密重叠的三角形时能够最大限度地减少渲染错误。

  在GF100中,全新设计的整数ALU支持所有指令全32位精度,符合标准编程语言的要求。整数ALU还经过了优化,可有效支持64位以及更高精度的运算。它支持各种指令,其中包括Boolean、移位、移动、比较、转换、位字段提取、位反向插入(Bit-reverse Insert)以及种群统计。

GF100流处理器群的载入单元与存储单元:

  每一个SM都拥有16个载入/存储单元,从而在每个时钟周期内均可为16个线程运算源地址与目标地址。支持的单元能够将每个地址的数据载入和存储到高速缓存或DRAM中。

GF100流处理器群的四个特殊功能单元:

  特殊功能单元(SFU)可执行抽象的指令,例如正弦(sin)、余弦(cosine)、倒数和平方根。图形插值指令也在SFU上执行。每个SFU在一个时钟周期内针对每个线程均可执行一条指令,一个Warp(32个线程)的执行时间可超过八个时钟周期。SFU流水线从分派单元中分离出来,让分派单元能够在SFU处于占用状态时分发给其他执行单元。复杂的程序着色器在特殊功能专用硬件上的运行优势尤为明显。

0
第1页:前言:第2页:GF100架构最高端GTX480实物及参数介绍:第3页:GF100架构最高端GTX480实物拆解:第4页:GF100架构次高端GTX470实物及参数介绍:第5页:GF100架构次高端GTX470实物拆解:第6页:GF100架构分析:图形处理集群第7页:GF100图形处理集群改进:PolyMorph引擎第8页:GF100图形处理集群改进:Raster引擎第9页:GF100架构分析:第三代流处理器群(SM)第10页:GF100流处理器群的双Warp调度器第11页:GF100流处理器群的纹理单元第12页:GF100流处理器群可调配的共享存储器与L1缓存第13页:GF100架构分析:高速二级缓存第14页:GF100架构分析:优化8xAA的ROP与32xAA支持第15页:GF100架构分析:面向图形方面的各种计算第16页:GF100图形计算:光线追踪与流体力学第17页:GF100的多屏幕3D环绕立体幻镜技术第18页:关于曲面细分和贴图置换的概述第19页:测试平台说明及测试介绍:第20页:理论性能测试----3Dmark Vantage第21页:DirectX10游戏:《孤岛危机:弹头》第22页:DirectX10游戏:《孤岛惊魂2》第23页:DirectX10游戏:《生化危机5》第24页:DirectX9游戏:《街头霸王4》第25页:DirectX9游戏:《星际争霸2 beta》第26页:DirectX9游戏:《极品飞车13:变速》第27页:物理加速游戏:《蝙蝠侠:阿甘疯人院》第28页:物理加速游戏:《黑暗虚空》第29页:物理加速&DX11游戏:《地铁2033》第30页:DirectX11游戏:《 科林麦克雷:尘埃2 》第31页:DirectX11游戏:《潜行者:普里皮亚季的召唤》第32页:DirectX11 DEMO:《石巨人》第33页:DirectX11游戏:《叛逆连队2》第34页:DirectX11 DEMO:《天堂 2.0》第35页:NVIDIA游戏DEMO:Realistic Character Hair 第36页:NVIDIA游戏DEMO:Realistic Water&Terrain第37页:NVIDIA游戏DEMO:RagingRapids(小船)第38页:NVIDIA游戏DEMO:SupersonicSled第39页:NVIDIA游戏DEMO:RayTracing_DesignGarage第40页:微软官方DX11性能测试DEMO测试:第41页:最强的CUDA转码压片:MediaCoder测试第42页:CUDA软件应用:Badaboom第43页:CUDA软件应用:PowerDirector(威力导演)第44页:CUDA软件应用:MotionDSP vReveal第45页:CUDA软件应用:Folding@Home 第46页:GTX480/470温度及功耗测试:第47页:总结:DX11首战终落幕 新时代将越来越精彩第48页:文章仍未终:一句话评价GF100,大奖免费拿!
相关文章