RadeonHD3800系列输了性能却没有输了市场
或许是经过R600败退和RV670成功的经历,ATI开始在产品开发思路上走着和NVIDIA不一样的路:由于在早期人类并设有预见到当集成度与微观世界发生联系定律会遇到如此多的问题,大量的物理化学定律在微观领域中失效或被改写,半导体的发展不再只局限于制造工艺,转而材料学开始成为晶片设计制造水平和可靠性的关键问题,同时成为芯片性能提升的重要因素。所以ATI认为NVIDIA那种通过盲目增加核心面积,塞进更多的晶体管去提高芯片性能的方案已经寸步难行。
GT200芯片面积达到576平方毫米,拥有14亿晶体管
今年6月到来,图形显示业界上敲响了DirectX10第二代产品之战,从《横跨未来三年 NV双面侠GT200首发测试》一文中,我们可以体验到NVIDIA那种为求提升性能而不择手段的疯狂,而AMD/ATI公司发言人随即就发表了意见,他们不希望GPU或者VPU继续走着这样的老路子:先造出一颗大型GPU,然后不断屏蔽一部分规格以对应不同市场。基于产能和可扩展性的考虑,未来ATI将把每一代核心的开发重点放在中型级芯片上,然后采用单卡双芯的方式推出优异显卡。
基于RV770的第一款产品——RadeonHD4850
认清自身发展方向的ATI,果然没有在旗舰单核显卡性能上和NVIDIA较劲,而是继续专著于高平方毫米性能比的中型图形核心研发,在GeforceGTX280发布后的一个星期,我们迎来了RV670的接班人——延续ATI特色主义道路的RV770。
从一开始,RV770的核心具体规格就一直是个不解之迷,其中最初消息显示为480个流处理器单元,而随着时间的推移,我们最终确定RV770核心的流处理单元达到800个之多!在核心面积和晶体管数量仅提升40%的情况下,流处理器单元居然有着2.5倍的提升,这使得即使核心频率只有625MHz的RadeonHD4850,其浮点运算效率也达到了惊人的1TeraFLOP!
虽然以ATI的说法来看,RV770拥有800个之多的流处理器单元,而即使是NVIDIA最新的旗舰GeforceGTX280也仅有240个流处理器,但我们不能理解为RV770的流处理器是GT200的数倍,因为在核心架构上两者走着完全不一样的路。
在过往,像素渲染单元和顶点渲染单元都分别负责着不同的数据渲染,比如说像素渲染单元负责着包括RGB(三原色)和这三原色的信息说明等一共四个数据的运算,而顶点渲染单元则是负责三角型顶点的XYZW坐标数据的运算,我们把这些任何一个单独的数据称为标量。因为在以前往往这两种数据都是4个标量为一组的,所以像素渲染单元和顶点渲染单元都被设计成单周期同时执行一组4标量的运算,这就是旧有的SIMD架构,SIMD架构在处理4标量为一组的矢量运算时效率非常高。
但随着游戏的复杂化,一组矢量未必数量一定为4的标量,那么比如在执行只有单一标量的矢量数据时,原来的SIMD架构效率就大打折扣了。虽然近代的ATI使用了“3+1” 的设计,允许一次处理4个矢量运算,或者同时处理一个3矢量运算和一个单标量运算。而NVIDIA的Geforce6和Geforce7系列则除“3+1”外还可以提供一个额外的“2+2”类型运算来提高效率,但由于的单标量运算日益频繁,加上长久以来像素渲染与顶点渲染比重的问题,所以旧有的SIMD架构终被取缔了。
到了DirectX10时代的统一渲染架构,NVIDIA采用的是全标量流处理器设计MIMD,遇到单标量处理时流处理器可以提供100%的运算效率,虽然听上去很灵活,但如果遇到传统矢量运算的话,MIMD架构的效率仍然不如SIMD。而ATI则保持过往R580的策略,在每个流处理器里面放置更多的流处理单元,这里的更多是指由原来R580的1:3比例增加至1:5。
所以RV770的800个流处理器单元,其实由10个SIMD矩阵、每个矩阵16个SIMD单元拆分所得(每个SIMD内拥有5个ALU),不过这些流处理单元不象传统的SIMD架构只支持矢量运算,其也支持标量与矢量并行运算,支持5个单独标量、2+2+1标量和1组矢量+1个标量等多种模式的同时运算。和NVIDIA不同,ATI的的流处理器频率和核心频率是保持一致的,而NVIDIA的流处理器频率则是核心频率的两倍以上,综合这些区别我们很难去换算ATI与NVIDIA在架构上的强弱,更多情况下取决于游戏设计更适合那一种架构。
R600/RV670都只有四组纹理单元
另外,由于ATI架构中每个SIMD矩阵配搭一个纹理单元,所以RV770的纹理单元从由RV670的4个大幅度提升至10个,其中纹理过滤单元(每个完整纹理单元包含4个纹理过滤单元)TF从原来的16个大幅度提升至40个,纹理寻址单元TA从原来的32个提升至80个,比例为1:2。虽然在数量上不及80TA与80TF数量比例的GT200,但相比起自家RV670来说,相信RV770在各向异性过滤性能方面定必大大提高。
第一批基于RV770的产品一共为两款,分别为RadeonHD4850和RadeonHD4870,从名字上来看完全延续了RadeonHD3850和3870的命名方式。
RadeonHD4870作为RV770的高端定位产品,其核心频率高达750MHz,对于一款晶体管超过9亿个的核心来说也几乎到达顶端了。不过RadeonHD4850最引人注目的还是在其显存方面,在过往的RadeonHD3870上ATI已经使用过高规格的GDDR4显存,而这次的RadeonHD4870更加变本加厉,采用业界非常先进的GDDR5显存。
据资料显示,目前主流显卡采用了GDDR3显存颗粒,其每个引脚的数据传输率仅为1.6Gbps,单显存颗粒(32bit)也只能提供6.4GB/s带宽,而高速的GDDR5显存颗粒每个引脚的数据传输率可以达到5Gbps(即传输频率为5GHz,时钟频率为2.5GHz左右)或6Gbps,单显存颗粒(32bit)可以提供20GB/s带宽(即5GHz×32bit/8),如果搭配同数量、同显存位宽的显存颗粒,GDDR5显存颗粒提供的总带宽是GDDR3的3倍以上,显存位宽为256bit,其数据传输率可以达到160GB/s。
相比起RadeonHD4870,RadeonHD4850的整体规格则要平易近人得多,虽然采用了第二代的55nm工艺制造,但核心频率却没有上代RadeonHD3850的667MHz高,显存方面采用了较为普通的GDDR3方案,运行频率在2000MHz。从规格和参数上来说,RadeonHD4850其实最吸引人的是其功耗方面,仅110W的标准仅和半年多前的Geforce8800GT持平。
RadeonHD4850的全球官方建议零售价为$199,如果直接换算成人民币的话仅需1400元左右,但根据我们了解,ATI对国内的RadeonHD4850上市限价为1599元。
ATI的PowerPlay电源管理技术原本是应用在笔记本当中的一项节能技术,它可以减低图形核心以及显示屏幕的耗电量,消除不必要的电源浪费,并使笔记本电脑的电池达到最长的使用寿命。 用户可以自定义PowerPlay在特定的电源设定时启动,让笔记本的图形核心频率调整实现在非常好的性能以及最长电池寿命之间取得更好的平衡。
在公版Radeon HD3850/3870产品中,具备了2D、3D和UVD三档的频率与电压变换设计(以公版的RadeonHD3850为例,在2D环境下的核心工作频率为300MHz,而当用户切换至3D的模式下核心频率马上会由300MHz提升至668MHz的额定频率下),这都需要控制电路设计上会设定换挡的条件和侦测的方法。
从官方文档我们了解到,RV770的PowerPlay得到进一步的加强,负载调节频率更智能,电压自动换档更加丰富,其中最注目的当数显存频率现在也能自动换档了!(在此之前只有少数的Radeon3600支持显存频率的自动换档)
DirectX10.1其实不会有革命性的新特性,最主要的还是在DX10的基础上进行一些小的改进和升级,多个渲染目标的总体混合模式、多重采样反锯齿(MSAA)的更好控制、立方体贴图阵列、更多的顶点渲染(VS)输入输出特征、改进的精度要求等等,例如可以解决显卡渲染aero 3D窗口同时需要渲染3D游戏的冲突的问题等。
关于DirectX10.1,ATI和NVIDIA各执一词。ATI给我们列出了如下表格和一个简单的应用环境的图片。从列表对比看,DirectX10.1有DirectX10有众多的不同。但演示效果显然不可能是两者差别的对比,所以我们还并不能完全清楚DirectX10.1真正的威力。
有一点可以肯定,ATI会在DirectX 10到10.1版本的转变中扮演重要的角色,逐渐占据主动。ATI曾经在白皮书中写道,他们的产品将支持新一代交互式三维图形处理规范,DirectX10.1改善了编程接口,解决了DX10上的限制,在下一阶段还将提供更好的照明和阴影质量与实时射线追踪技术(CG用),改良的反锯齿补偿,清除闪烁和更好的规范性及兼容性。
本次测试中我们有幸拿到刚在台北Computex展出的蓝宝RadeonHD4850 1G,到目前为止所有出现过的RadeonHD4850都是公版512M版本。
蓝色的PCB到截稿前还是唯一一款非红色的RadeonHD4850,该卡还处于工程样本阶段,测试默认频率为标准的625/2000MHz,而最终上市频率规格还未确认。
其实该PCB和一般公版的RadeonHD4850保持一致,只是颜色换了蓝宝自家独有的蓝色。
采用奇梦达的-1.0ns GDDR3显存,正面一共8颗32bitx32规格颗粒组成1G/256Bit显存规格,运行频率在1986MHz。
供电配置为2+1相,与RadeonHD3850保持一致,其整体用料布局也基本和RadeonHD3850一样。
官方标准标准的RadeonHD4850只是配备512M显存,这次我们收到的公版RadeonHD4850来自另一家著名AIB迪兰恒进。
虽然ATI官方没有声称RV670与RV770拥有pin to pin特性,但从板型我们可以猜算出RV670核心和RV770核心的针脚定义是相同的。如果是这样的话,相信我们在短时间内就能看到铺天盖地的非公版RadeonHD4850。
单槽的公版风扇相当美观
RadeonHD4850公版
RadeonHD3850公版,显存位置有所不同
采用奇梦达-1.0ns GDDR3显存,8颗16mx32bit组成512M/256Bit显存规格,该卡默认频率为标准官方的625/1986MHz。
测试项目方面,我们舍弃了老旧的3Dmark06,只采用3Dmark Vantage作为理论性能的项目。而游戏方面我们选取了其中4个DirectX10游戏、6个DirectX9游戏。除了赛车游戏优品飞车11、GRID和使命召唤4使用Farps手动测试外,其他项目全部采用游戏自带或者第三方Benchamark软件测试,务求得到最准确的数据。
|
|
|
|
|
如果说GeforceGTX280为我们带来的是感叹,那么RadeonHD4850为我们带来的就是震惊,仅多用了70平方毫米的晶体面积,RadeonHD4850就做到了比RadeonHD3850几乎翻倍的性能,这可能是半导体发展史上的一个奇迹!
本来在RadeonHD4850推出之前,笔者认为RadeonHD4850只要能达到RadeonHD3850 150%的性能,那么这款产品就已经算成功了,因为作为对手的NVIDIA,在中端产品线上的更新已经渐显缓慢,即使在未来一个季度内,NVIDIA与RadeonHD4850相应的产品仍然停留在G92形态。而现在RadeonHD4850已经超出了大部分人的预期,在测试中战平了G92最终形态的Geforce9800GTX,要知道RadeonHD4850的上市价仅在1599-1699元左右,比现时跌价至谷底的Geforce9800GTX仍然有500元或以上的差价,ATI再一次漂亮地演绎了田忌赛马的故事!
RadeonHD4870x2(R700)在稍后就杀到
另外我们也可以看到RV770的前景实在让人充满信心,仅只有625Mhz频率的RadeonHD4850就已经有着让人满意的表现,那么频率大幅度提升后的RadeonHD4870,预计能轻松击败所有不变架构的G92产品;而向双芯发展的RadeonHD4870X2或RadeonHD4850X2则完全有着问鼎性能宝座的实力,看来在接下来的一个季度,ATI的各位高官都能睡个安稳觉了:)