或许是经过R600败退和RV670成功的教训,ATI开始在产品开发思路上走着和NVIDIA不一样的路,ATI认为NVIDIA那种通过盲目增加核心面积,塞进更多的晶体管去提高芯片性能的方案已经寸步难行。
GT200芯片面积达到576平方毫米,拥有14亿晶体管
今年6月到来,图形显示业界上敲响了DirectX10第二代产品之战,从《横跨未来三年 NV双面侠GT200首发测试》一文中,我们可以体验到NVIDIA那种为求提升性能而不择手段的疯狂,而AMD/ATI公司发言人随即就发表了意见,他们不希望GPU或者VPU继续走着这样的老路子:先造出一颗大型GPU,然后不断屏蔽一部分规格以对应不同市场。基于产能和可扩展性的考虑,未来ATI将把每一代核心的开发重点放在中型级芯片上,然后采用单卡双芯的方式推出优异显卡。
RadeonHD3870x2——ATI改变策略的首作
RadeonHD3870x2是ATI改变整体发展策略后的第一款旗舰双核心产品,尽管RadeonHD3870x2并没有为ATI带来太多实质性的获益,但确实在名誉上为ATI争得了短暂的胜利,从NVIDIA马上推出Geforce9800GX2的举动来看,要保持显卡界上最强性能宝座的称号还是有必要性的。
RadeonHD4870x2——黑色代表王者
如果说RadeonHD3870x2不够成功是因为RV670还不够强力而导致的话,那么这次的RadeonHD4870x2如果不成功就说不过去了,一方面新的RV770单核心性能已经足够的强,另一方面对手的旗舰芯片GT200从多方面考虑已经不允许推出双核心版本了。在这样的情况下,ATI将有机会再一次长期地坐上久违的最强显卡的宝座。
人类欲望的无限化迫使GPU也向并行方向发展——
早在数年前,CPU领域的设计者已经意识到制造工艺开始制约了CPU性能的发展,所以很快他们就设计出并行发展的双核心CPU,甚至到今天我们还开始见到四核心CPU的出现。到了近年来,随着GPU的内部复杂程度超越了CPU,警示着GPU也需要开始向并行方向发展。
显示芯片近代发展蓝图(可点击查看更详细的大图)
工艺不是一切,晶片制造难度遭遇瓶颈——
尽管上图看上去相当零乱,但大家只需要留意到一个趋向,就是近几代的高端旗舰芯片核心面积提升幅度的倾斜角已经越来越大,而中低端芯片还处于一个良性的发展期。可见对于追求极致高性能的旗舰芯片来说,工艺更新的速度已经远远追不上晶体管数量增加的需求。
在早旗人类并设有预见到当集成度与微观世界发生联系定律会遇到如此多的问题,大量的物理化学定律在微观领域中失效或被改写,半导体的发展不再只局限于制造工艺,转而材料学开始成为晶片设计制造水平和可靠性的关键问题,同时成为芯片性能提升的重要因素。所以通过盲目增加核心面积,塞进更多的晶体管去提高芯片性能的方案已经寸步难行。
为了在激烈的竞争中存活下来,NVIDIA和ATI都无限期地不断提升自己产品的性能。基于晶片制造难度带来的瓶颈,大家都不约而同地采用了并行多GPU的方案,可以说这种提升性能的方案是综合制造成本、研发成本两大方面最具性价比的,并且也是唯一在短期内大幅度提升性能的唯一可行方案。
多核GPU/VPU的普及率仍然很难追上多核CPU——
其实显示芯片领域和CPU领域研发多核心并行的目的又有点不一样,GPU/VPU多核心并行的主要目的只是单纯地提升其3D渲染能力,这只有追求极致游戏享受的用户才有需求,所以到目前为止GPU/VPU多核心并行的产品并未得到普及。而CPU多核心并行的迅速普及化,主要原因来自于人们对电脑的使用习惯,多任务多线程的操作即使对于一个普通用户来说也是无时无刻会发生的事情。不过随着物理计算加入GPU运算行列,我们有理由相信日后GPU/VPU多核心并行的普及脚步会逐渐加快。
这次我们一共收到三款来自不同品牌的RadeonHD4870x2显卡,他们分别来自蓝宝石、迪兰恒进和Forec3D。
ATI近两代的双核旗舰显卡从长度和体型方面都不相上下,连散热器的设计都几乎相同。
如果没记错的话,RadeonHD4870x2是ATI历史上首次采用黑色PCB的显卡,这一定程度上反映了ATI夺取最强性能宝座的决心。两个RV770核心并排在显卡正面,并拥有各自的寄存器。
正反一共采用了16颗GDDR5显存,正反两面各8颗32mx32bit显存颗粒组成了2G/256Bit的显存规格。由于多核显卡的特殊性,其需要非常密集的布线设计,所以这种在PCB层数方面肯定比单核显卡要多得多,通过增加镶铜层数来提高电气性能,虽然这是最花费成本的做法,但也同样是唯一的做法,RadeonHD4870x2保守估计在12层PCB以上。
采用的RV770核心并没有因为双核的缘故而降低了频率,同样运行在750MHz,加起来组成一个拥有1600个流处理器单元、2.4 TFLOP运算效率的恐怖系统。
每一组核心+显存的供电方案都是3+1相配置,仍然采用不惜工本的全数字供电模组,三颗CSP封装的VOLTERRA公司的VT1195SF MULTIPHASE电源芯片(内置MOSFT和驱动电路,能提供40A的电流,三颗一共可为核心提供120A电流)搭配VITEC的贴片式三相并联电感为核心供电,而显存则使用VT238AWF提供单相供电支持。
在GPU互联方面NVIDIA和ATI采用了不一样的方案,NVIDIA善于开发自己的Switch芯片,从AGP时代的BR01一直到PCI-E2.0时代的BR04,为求在兼容性方面做到尽善尽美。而ATI则喜欢采用了第三方Switch芯片,获得更高的效能之余又能花费更少的研发资源。
与RadeonHD3870x2一样,RadeonHD4870x2同样使用了来自PLX公司的PCI-E Switch芯片,不过RadeonHD3870x2所使用的的PEX8547 PCI-E Switch芯片仅基于PCI-E 1.1总线,而RadeonHD4870x2采用的升级版PEX8647则支持更高带宽的PCI-E 2.0协议。由于早在Geforce9800GX2上使用的BR04已经支持PCI-E 2.0总线,所以更大指令流量的RV770核心更需要PCI-E 2.0的Switch芯片支持。
通过内置拥有PCIE通道的PCI-E switch芯片,才能使多核GPU系统正常运行,拥有48个PCI-E通道的switch芯片把一组16x通到连接到对外的PCI-E 16X图形接口,余下的各自以16X通道把两颗GPU连接起来。到了RadeonHD4870x2这一代,由于PEX8647所提供的内部PCI-E通道已经升级至2.0版本,每个PCI-E通道传输率翻倍提升至500MB/s,所以两个GPU及图形卡界面三者之间的传输带宽也提升至5GB/s!另外两核心之间也加进了Sideport通道,虽然ATI并没有明文表示该通道的用处,但根据主板方面的Sideport技术我们可以联想到,这应该是一项GPU之间相互共享显存的技术,这无疑比旧有的各自独立分配显存的机制更灵活。
正反一共16颗32mx32bit的现代GDDR5颗粒,组成了2G/256Bit的超豪华显存规格。值得注意的是,GDDR5显存的频率换算和GDDR3/4有所不同,我们发现在所有识别软件中RadeonHD4870显存频率显示为900MHz,经过询问产业人士后得知GDDR5显存的等效频率=运行频率的4倍,而不是以往GDDR3/4的2倍,所以RadeonHD4870和RadeonHD4870x2的显存频率正确都为3600MHz。
测试项目方面,我们舍弃了老旧的3Dmark06,只采用3Dmark Vantage作为理论性能的项目。而游戏方面我们选取了其中4个DirectX10游戏、6个DirectX9游戏。除了赛车游戏优品飞车11、GRID和使命召唤4使用Farps手动测试外,其他项目全部采用游戏自带或者第三方Benchamark软件测试,务求尽量获得最准确的数据;另外由于测试对象为高端显卡,所以部分要求强度相对较低的游戏,我们直接采用打开全屏抗锯齿的方式进行测试,以更贴近用户实际应用。
黑色的复仇者——RadeonHD4870x2成功封皇
纵观整个测试,RadeonHD4870x2除了在对多核GPU支持较差的优品飞车中不敌GeforceGTX280,其他项目均以相当明显的优势胜出。我们尽管是采用了30寸显示器的2560x1600超高分辨,同时也在部分项目中直接采用打开全屏抗锯齿的方式进行测试,但RadeonHD4870x2仍然能以单卡的身份流畅地满足所有的游戏要求,无愧于最强性能的称号。
历史总是惊人的相似,在上一次的旗舰竞争中RadeonHD3870x2仅霸占了最强性能宝座2个月不到的时间,就被Geforce9800GX2赶下神坛。而这次旗舰竞争中同样的事件上演了,只不过角色交换了一下,在GeforceGTX280发布不到两个月的时间后RadeonHD4870x2就抢夺了最强单卡的称号!
真正的平民双GPU——RadeonHD4850x2待发
象RadeonHD4870x2和HD3870x2这种为争夺形象而不顾成本的双GPU显卡,对于绝大部分人来说都不够现实。考虑到RV770性能足够的强大,ATI也会在稍后推出有实际购买意义的RadeonHD4850x2,其最大特点是仅采用了相当主流的GDDR3显存规格,同时价格也比RadeonHD4870x2低了足足150美元,相信这款RadeonHD4850x2才是冲击GeforceGTX280的最有力武器!这一刻,我们等待着NVIDIA下一步的反攻步部署...