显卡 频道

愤怒的显卡:说说显卡红鸟与绿猪那些事

第8页:武器五:数量惊人的流处理器集群

  5、数量惊人的流处理器集群:执行效率更高的新一代架构设计,游戏性能表现出色。好比黑色小鸟重型攻击威力凶猛。

  黑色小鸟:体型较大,重量重,会爆炸,撞击力强,爆炸力强,气浪中等。适合攻击混凝土。

武器五:数量惊人的流处理器集群

  我们知道,AMD显卡的核心架构自HD 2900时代的R600核心以来就基本保持着相同的构造,即VLIW 5核心架构。这种核心架构的运算单元由线程处理器(Thread Processor)+VLIW处理器组成。其中,VLIW处理器由4个单精度FP MAD和1个单精度FP SFU组成。各个运算单元能够执行各自的指令。

武器五:数量惊人的流处理器集群
▲2900XT的核心仅拥有320个流处理器

  AMD方面虽然晚于竞争对手半年之久才发布DX10架构产品,但是第一代的VLIW 5核心架构并没能充分体现出其优势。不过ATI的这一设计思路对今后的ATI产品提供了基础,随后的HD3800、4800乃至最新的HD5800系列依然延续了下来。

  HD2900XT的核心虽然并没能让AMD立刻翻身,但是随后的几代产品才是AMD真正的发展路线。HD3800系列让AMD轻易地将核心面积大幅缩小,从而让AMD转向了甜蜜点市场策略。这一市场策略虽然并没能拿下性能王者的地位,但是显然让AMD显卡在市场当中具备了及其强悍的市场竞争力。

武器五:数量惊人的流处理器集群
▲Radeon HD 5870再次将流处理器数量翻番

  而AMD真正开始发力的则是从Radeon HD 4000开始。在Radeon HD 4870上,AMD骤然间将流处理器数量提升到了800个,相对于上一代产品提升了一倍还多,但是优异的核心架构设计仍然让AMD在显卡产品上保持了非常良好的性价比。到了Radeon HD 5800时代,AMD再次将流处理器的数量翻了一番,达到了1600个,此时AMD强大的流处理器集群性能则得到了更加完美地展现。也正是从Radeon HD 5000时代,AMD彻底将NVIDIA甩在了身后。

武器五:数量惊人的流处理器集群
▲HD6970拥有1536个SP

  而到了Radeon HD 6970不再沿用VLIW 5核心架构,转而采用了AMD全新设计的VLIW 4核心架构。从HD6970的核心逻辑架构图中我们可以看出,它拥有两大组对称的SIMD阵列。其中,每组SIMD阵列中都有768个流处理单元,共计拥有1536个流处理单元、48个纹理单元以及内部L1 Cache纹理缓存。两者通过相同的高速数据总线与L2 Cache相连,同时也连通到Global Data Share上进行数据共享。那么,AMD为什么不继续沿用VLIW 5核心架构了呢?

  VLIW 4架构可以提供4路平行处理,所有的流处理单元拥有平等的能力。这样设计实际上能够提升每渲染管线的性能,同时能够将ALU/BW比值进一步降低,更加接近于典型应用的需求。由于非对称性的VLIW 5相比对称性的VLIW 4更难编译,VLIW 4架构凭借着对称的特点可以使编译器的工作更加简单,能够转化为更优的性能。

  此外,AMD还大幅优化了单ALU(Arithmetic Logic Unit,算术逻辑单元)的性能,使其成为了一个更高效的设计整体。VLIW 5架构中原本第5槽负责的指令,如超越指令在VLIW 4架构中已分布到所有单元。上述种种改变,最终带来的就是核心每平方毫米的性能比相对之前的产品有10%的性能提升。

0
相关文章