显卡 频道

NVIDIA重掌中高端市场 GTX465详细评测

  GF100架构分析:第三代流处理器群(SM)

GF100架构分析:第三代流处理器群(SM)
第三代流处理器群(SM)

  从G80到GT200再到GF100,NVIDIA GPU的流处理器群(SM)已经升级至第三代,每一代各部分单元的配比都不一样。第三代SM在架构上引入了多项革新,使其不仅成为迄今为止最强大的SM,而且还是可编程性最强、效率最高的SM。

GF100架构分析:第三代流处理器群(SM)
GF100架构特色

  GF100架构每个SM都有32个CUDA处理器,达到了之前SM中处理器数量的四倍。GF100的CUDA核心专为在着色器的任何负荷下均实现最高性能以及最高效率而设计。通过采用全标量架构,无论输入向量尺寸如何,都能够实现全部性能。Z缓冲区(1D)或纹理存取(2D)方面的操作均可充分利用GPU资源,再不受旧有的固定4D算法的约束。

  每一个CUDA处理器都拥有一个完全流水线化的整数算术逻辑单元(ALU)以及浮点单元(FPU)。GF100采用了全新的IEEE754-2008浮点标准,能够为单精度以及双精度算术提供融合的乘法加法(FMA)指令。FMA在一个最终的四舍五入步骤中即可完成乘法与加法运算,改进了乘法加法(MAD)指令,在加法中不会损失精度。FMA在处理紧密重叠的三角形时能够最大限度地减少渲染错误。

  在GF100中,全新设计的整数ALU支持所有指令全32位精度,符合标准编程语言的要求。整数ALU还经过了优化,可有效支持64位以及更高精度的运算。它支持各种指令,其中包括Boolean、移位、移动、比较、转换、位字段提取、位反向插入(Bit-reverse Insert)以及种群统计。

  GF100流处理器群的载入单元与存储单元:

  每一个SM都拥有16个载入/存储单元,从而在每个时钟周期内均可为16个线程运算源地址与目标地址。支持的单元能够将每个地址的数据载入和存储到高速缓存或DRAM中。

  GF100流处理器群的四个特殊功能单元:

  特殊功能单元(SFU)可执行抽象的指令,例如正弦(sin)、余弦(cosine)、倒数和平方根。图形插值指令也在SFU上执行。每个SFU在一个时钟周期内针对每个线程均可执行一条指令,一个Warp(32个线程)的执行时间可超过八个时钟周期。SFU流水线从分派单元中分离出来,让分派单元能够在SFU处于占用状态时分发给其他执行单元。复杂的程序着色器在特殊功能专用硬件上的运行优势尤为明显。

0
第1页:前言及GTX465市场定位分析第2页:GTX465实物及参数介绍第3页:GTX465拆解第4页:GTX465散热及供电部分第5页:GF100架构分析:图形处理集群第6页:GF100图形处理集群改进:PolyMorph引擎第7页:GF100图形处理集群改进:Raster引擎第8页:GF100架构分析:第三代流处理器群第9页:GF100流处理器群的双Warp调度器第10页:GF100流处理器群的纹理单元第11页:GF100流处理器群的共享存储器/L1缓存第12页:GF100架构分析:高速二级缓存第13页:GF100架构分析:优化8xAA ROP/32xAA支持第14页:GF100架构分析:面向图形方面的各种计算第15页:GF100图形计算:光线追踪与流体力学第16页:GF100的多屏幕3D环绕立体幻镜技术第17页:关于曲面细分和贴图置换的概述第18页:测试平台说明及测试介绍:第19页:理论性能测试----3Dmark Vantage第20页:理论性能测试----Unigine Heaven 2.1第21页:DirectX10游戏:《孤岛危机:弹头》第22页:DirectX10游戏:《孤岛惊魂2》第23页:DirectX10游戏:《鹰击长空》第24页:DirectX10游戏:《世界冲突》第25页:DirectX10游戏:《生化危机5》第26页:DirectX9游戏:《街头霸王4》第27页:DirectX9游戏:《星际争霸2 beta》第28页:DirectX9游戏:《极品飞车13:变速》第29页:物理加速游戏:《蝙蝠侠:阿甘疯人院》第30页:物理加速游戏:《黑暗虚空》第31页:物理加速&DX11游戏:《地铁2033》第32页:物理加速&DX11游戏:《石巨人 DEMO》第33页:DirectX11游戏:《科林麦克雷:尘埃2》第34页:DirectX11游戏:《普里皮亚季的召唤》第35页:DirectX11游戏:《叛逆连队2》第36页:DirectX11游戏:《异形大战铁血战士》第37页:NVIDIA DEMO:Hair 第38页:NVIDIA DEMO:Water&Terrain第39页:NVIDIA DEMO:RagingRapids(小船)第40页:NVIDIA DEMO:SupersonicSled第41页:NVIDIA DEMO:RayTracing_DesignGarage第42页:CUDA软件应用:Badaboom第43页:CUDA软件应用:Folding@Home 第44页:GTX465温度及功耗测试:第45页:超频测试:小超达GTX470水平第46页:总结:第47页:索泰GTX465第48页:影驰GTX465第49页:七彩虹GTX465第50页:映众GTX465第51页:双敏GTX465第52页:旌宇GTX465第53页:耕昇非公版GTX465
相关文章