HD6900系列规格概述:
显卡核心规格对比 | ||||||
vga.it168.com | HD6970 | HD6950 | HD5870 | HD5850 | GTX580 | GTX570 |
---|---|---|---|---|---|---|
核心代号 | Cayman | Cayman | Cypress | Cypress | GF110 | GF110 |
制造工艺 | 40nm | 40nm | 40nm | 40nm | 40nm | 40nm |
晶体管数量 | 26.4 亿 | 26.4 亿 | 21.5 亿 | 21.5 亿 | 30 亿 | 30 亿 |
核心面积 | 389 mm2 | 389 mm2 | 334 mm2 | 334 mm2 | 520 mm2 | 520 mm2 |
DirectX 版本 | DirectX 11 | DirectX 11 | DirectX 11 | DirectX 11 | DirectX 11 | DirectX 11 |
流处理器数量 | 1536 SP | 1408 SP | 1600SP | 1440SP | 512 CUDA | 480 CUDA |
纹理单元 | 96 | 88 | 80 | 72 | 64 | 60 |
ROP单元 | 32 | 32 | 32 | 32 | 48 | 40 |
核心频率 | 880Mhz | 800Mhz | 850Mhz | 725Mhz | 772Mhz | 732Mhz |
流处理器频率 | 880Mhz | 800Mhz | 850Mhz | 725Mhz | 1544Mhz | 1464Mhz |
显存频率 | 5500Mhz | 5000Mhz | 4800Mhz | 4000Mhz | 4008Mhz | 3800Mhz |
显存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
显存容量 | 2048MB | 2048MB | 1024MB | 1024MB | 1536MB | 1280MB |
显存位宽 | 256Bit | 256Bit | 256Bit | 256Bit | 384Bit | 320Bit |
显存带宽 | 176.0 GB/s | 160.0 GB/s | 153.6 GB/s | 128.0 GB/s | 192.4 GB/s | 152.0 GB/s |
供电接口 | 8+6Pin | 6+6Pin | 6+6Pin | 6+6Pin | 8+6Pin | 6+6Pin |
输出接口 | Mini DP HDMI 2*DVI | Mini DP HDMI 2*DVI | DisplayPort HDMI 2*DVI | DisplayPort HDMI 2*DVI | Mini HDMI 2*DVI | Mini HDMI 2*DVI |
分辨率 | 4*2560 | 4*2560 | 3*2560 | 3*2560 | 2560 | 2560 |
市场售价 | 2999-3099元 | 2299-2399元 | 1999元 | 1799元 | 3899元 | 2999元 |
因为HD6900系列是用以接替原有的HD5800系列的,所以上图规格对比表中我们并没有加入HD6800系列。观察上表可以看到,开发代号为Cayman的HD6900系列依然采用成熟的40nm工艺,其对于HD5800系列有明显提升部分分别为:核心/显存频率以及显存容量部分,而流处理器单元方面反而出现不升反降的情况,与此同时核心晶体管数量及核心面积却比HD5800变得更大。流处理器单元减少,晶体管却用得更多了——这种情况在采用同一架构的情况下是不会出现的。所以显然易见的是AMD这次在核心架构方面较以往的不一样。
更多的SIMD阵列,不一样的线程处理器配置:
▲Cayman核心规格图
Cayman核心仍然采用双核共享二级缓存和显存控制器的方案来划分整个核心,两个核心总共拥有24个SIMD阵列(HD6970拥有全24个,HD6950减少至22个),比HD5800系列的Cypress核心要多4个SIMD阵列。每个SIMD阵列拥有16个Thread Processor(线程处理器)、配备两个纹理单元,这些配比比例与HD5800系列的Cypress核心是一样的。
其实Cayman核心与Cypress核心最大的不同点,是每个线程处理器里面的流处理器单元数量不一。Cayman核心每个线程处理器拥有4个流处理器单元,所以总的流处理器单元=24(SIMD)x16(线程处理器)x4=1536个。而Cypress核心每个线程处理器拥有5个流处理器单元,所以总的流处理器单元=20(SIMD)x16(线程处理器)x5=1600个。为何AMD这次新的Cayman核心的线程处理器中的流处理器单元数量不升反降呢?我们在稍后将详细说明。
超线程调度器与TS单元拆分,数量翻倍:
▲HD5000系列的总指令处理器
▲HD6800系列的总指令处理器
另外一些不同点是:从HD6000系列开始,超线程调度器的数量从原来HD5000系列一个变成两个,缓存也随之提升至两个。这种设计是由HD6800系列开始有所变化的,当时我们认为其意义并非很大,因为HD6800系列整个总指令处理器里面的功能模块数量与HD5800系列基本一样,而且HD6800系列的流处理器单元只是HD5800的70%,按道理说超线程调度器压力应该更加低,没必要花费更多晶体管去拆分成两个超线程调度器。原来AMD在HD6800系列上这一调整是为HD6900系列作铺垫的:
▲HD6900系列的总指令处理器
可以看到HD6900系列的总指令处理器里面功能模块部分被分成两部分,被两个SIMD阵列核心独享。其中最明显的增强是Tessllator——也就是我们最常说的Tessellation单元,升级至第八代,并且一共拥有两组Tessellation单元,与之相配的顶点装配器(Vertex Assembler)和几何装配器(Geometry Assembler)也随之增加了一倍。也就是说整个Tessellation部分增加了一倍,从一变二。按照AMD的说法,第八代Tessellation单元能支持更高倍数的Tessellation处理,其性能是HD5870的三倍。
Tessellation部分的成倍增加务必会给超线程调度器带来更大的压力,怪不得AMD在HD6800系列上就预先把超线程调度器增加。此调整总的来看可以理解为,HD6900把两个核心的可用资源逐一进行细拆分和增强,以便增强并行处理效能。