显卡 频道

千元霸主 ATI 1950GT全国首测

  【IT168评测中心】去年10月,经过长期沉默的ATI终于发布了一款真正意义上的新品——RadeonX1950Pro,RadeonX1950Pro仍然贯彻3:1黄金架构方案(3Pixel Shaders ALU:1Texture unit)融合80nm工艺、原生36个Pixel Shaders单元和新Native CrossFire模式等新元素,RadeonX1950Pro在性能上战胜了主要对手Geforce7900GS。加上价格和当时的Geforce7900GS相差不多,所以RadeonX1950Pro在初上市就热卖非常。

  不过随着时间推移,Geforce7900GS的成本优势慢慢展现。450MHz核心频率对于G71来说非常轻松,从一开始就决定了Geforce7900GS的量产之路,所以我们逐渐见到售价低至999元的Geforce7900GS。虽然Radeon1950Pro的核心RV570采用了更先进的80nm工艺,不过由于3:1黄金架构方案需要耗用大量的晶体管支持,所以RV570核心面积仍然达到230.5平方毫米,相比G71的192平方毫米仍然没有优势。所以价格战过后,RadeonX1950Pro的价格竞争力已经跟不上Geforce7900GS脚步,ATI需要一款竞争力更强的量产型号。

  RadeonX1950Pro的性能已经足够压制Geforce7900GS,那么适当一定程度上降低核心频率规格,从而提高成品率是最短时间内提高成本竞争力的最好办法。ATI在短时间内就作出了反应,借着曾经热卖过一段时间的RadeonX1900GT名义,推出RadeonX1950Pro的降频版本——RadeonX1950GT。

  相比RadeonX1950Pro,RadeonX1950GT核心频率从575MHz降低至500MHz,不要少看这75MHz,这足以让RadeonX1950GT的成品率大大提升。从台湾最大代工厂同德的一点动向我们可以看出一些状况,自RadeonX1950Pro推出以来,同德一直都保持观望态度,我们在市场上始终没有看到同德生产的RadeonX1950Pro。素来同德只生产量大热卖的显卡型号,因为在大量生产的情况下才能最大限度体现同德成本资源的优势。而RadeonX1950GT出台后,我们马上就看到同德所制造的相关产品,这证明了RadeonX1950GT能真正做到量产型的角色,吸引到同德这等巨头的关注,这对于ATI来说是喜讯。

  另外显存方面也从RadeonX1950Pro的1380MHz降低到1200MHz,不过显存规格自由度比核心要大得多,而且ATI和NVIDIA对于RadeonX1950GT和Geforce7900GS所持的态度都比较宽松,所以高显存规格的RadeonX1950GT和Geforce7900GS会十分常见。除了频率,RadeonX1950GT和RadeonX1950Pro没有任何区别,对于用户来说这是值得庆幸的,因为对手NVIDIA是通过删减渲染管线的硬性手段来区分Geforce7900GT和Geforce7900GS的。

  前面多次提到过3:1黄金架构,接下来我们有必要介绍一下...

  通过数年的分析和不计其数的应用模拟,ATI的工程师们认为在未来游戏中显卡Pixel Shader部分的ALU算术指令所占的比例将越来越大,TMU纹理贴图指令所占的比例将缩小。在ATi针对Pixel Shader内部负载的调查显示:在2006年在Pixel Shader操作中Arithmetic操作的负荷超过了80%。这种趋势已经在近期的几个游戏大作中有所体现,比如时下流行的彩虹6号、优品飞车10《卡本山谷》以及细胞分裂4等等。

  所谓3:1架构就是指Arithmetic:Texture=3:1或是ALU:TMU=3:1。(Arithmetic指算术运算,由ALU完成;Texture也可以指纹理运算,由TMU完成).在优品飞车9《最高通缉》时代,N卡在游戏中的表现要略好于同档次的A卡(RadeonX1800以前的产品),一些网友甚至抛出了EA刻意对NVIDIA产品进行了优化的言论。而到了优品飞车10《卡本山谷》,情况彻底改变,在和ATI RadeonX19XX/X16XX系列显卡的对阵中NVIDIA显卡几乎完全败下阵来,近期的当红的Geforce7600系列在1280x1024的分辨率下,如果特效全开最高甚至不能保证游戏的基本流畅。不过,最近发布的G80是一个例外,当然这和G80所采用的统一着色器架构(使得G80的Pixel Shader单元远远超过G7X)以及频率超高的Pixel Shader是分不开的。反观ATI方面,这一代的R580/RV560/RV570等在优品10中的表现相当出众,究其原因主要是因为ATI在RV530/RV560/RV570/RV580中增加了Pixel Shader内部ALU算术运算器的数量。

  实际上ATI这种强化ALU算术运算器的设计理念也符合DirectX本身的发展趋势。Pixel Shader流水线的功能就是在几何处理和转换完成后为每个象素“画”上它的色彩。基本操作可以分为三部分:一个就是按照贴图坐标去纹理贴图里读到颜色数据(Texture Fetch),这一步属于TMU的工作。第二个是把读到的数据和前面算好的光照强度混合进行一系列的运算,得到这个像素的颜色(Texture Blending),这个步骤主要在ALU里运算完成。最后就是把它和屏幕上当前像素的颜色进行一定的处理,然后画到这个像素上(Alpha Blending)。简单的而言,Pixel Shader就是根据需要对贴图进行处理,或者就是说通过一系列的运算来改变贴图的形状,色彩等参数。

  我们上面所说的ALU算术指令和TMU纹理贴图指令都属于Pixel Shader流水线的操作,在固定流水线时代它们分别是片段着色过程的第一和第二步。但在DX9的高度可程式化Shader中,这两个步骤现在已经没有先后之分了。它们之间的区别在于,纹理拾取(Texture Fetch)本身涉及到对外部存储器(显存)的读写,性能容易受到外部资源影响,在GPU并行能力和工作频率都迅猛发展的今天,显存将会成为一个严重的瓶径。例如,一个工作频率为500MHz的GPU,它内部的单个时钟周期长度在2ns以下,但即使是GDDR3 1000MHz的显存,延迟也高达几十ns,这意味着从GPU向DRAM发出存储指令开始到第一个数据包送出之间会有几十个ns的时间差,换算成GPU内部的时钟周期,就是几十上百个,如果不是因为多执行诸架构能隐藏一定的延迟,这种状况将会给GPU带来灾难性的停顿。而大部分常用的ALU算术指令如mul,add,dp3等都能在单个ALU周期内完成,是纯计算性的值,不涉及DRAM存储,自然也就节约了宝贵的传输带宽,并且延迟可以忽略不记。所以,最近的游戏,都把提高画面表现的重点放到了Pixel Shader渲染的ALU运算得到象素颜色的部分。我们只要改变相应的各种ALU的算术指令参数来配合纹理贴图,就能做出千变万化的效果。

  为了对比ATI的3:1架构,我们先来看看过去的显卡对流水线定义:传统流水线定义是“Pixel Shader(像素着色器)+TMU(纹理单元)+ROP(光栅化引擎,ATI将其称为Render Back End)。从功能上简单的说,Pixel Shader完成像素处理,TMU负责纹理渲染,而ROP则负责像素的最终输出,因此,一条完整的传统流水线意味着在一个时钟周期完成1个Pixel Shader运算,输出1个纹理和1个像素。以GeForce 6600LE为例,一块传统的4流水线构架显卡(4X1)在一个时钟周期内完成4个Pixel Shader运算,输出4个纹理和4个像素。流水线=Pixel Shader+TMU+ROP,这一概念一直得到GPU厂商的拥护。然而随着技术的发展,3D游戏开始有明显的取向性,此时这一平衡也自然被打破。

  R580/RV530/RV560/RV570正是顺应了这一需求的设计,它们在保持TMU(Texture Mapping Unit,纹理映射单元)数量不变的情况下,将Pixel Shader的另一个部分--ALU算术运算器增加了三倍,构成ALU:TMU=3:1的架构,顺应了近期主流游戏大作的需求。以RV530为例,它拥有4条真正意义上的流水线,只不过ALU、TMU以及ROP形成3:1:1的关系。具体而言,X1600有12个ALU,而TMU和ROP却只有4个,因此这款GPU核心在一个周期内可以进行12次Arithmetic运算,输出4个纹理和4个像素。也就是说,X1600在Pixel Shader运算上等同于12管线的显卡,但在纹理填充率和像素填充率上等同于4流水线显卡。正是因为这个道理,很多厂商在宣传RadeonX1650XT/RadeonX1950XT等显卡的时候称其为24管线/48管线显卡。

  日前已经有技术爱好者抓取了优品飞车10的shader出来分析,结果表明该游戏Pixel shader中的ALU:TMU指令比例高达10:1或者更多,这时专为高负荷ALU应用而设计的R580/570/RV530架构(3:1架构)就将发挥最大威力,将对手远远甩在身后。在未来,这种ALU高复合的游戏也将越来越多,3:1构架的优势也将更加明显。本站就曾经做过一个明星显卡的优品飞车性价比测试(详细请参阅《优品飞车10性价比显卡排行逐个数》

  回顾历史,DX9.0C的游戏普及用了2年多的时间,而如今VISTA刚刚露面,DX10游戏数量尚在个位数,因此基于3:1架构的显卡完全可以服役到2008年。也许有人会说,那我们买显卡不会只用1年吧?其实只要看看昔日的Geforce6800ULTRA就可以想象现在的Geforce8800GTX在2年后的表现了。目前DX10的显卡价格全部在3000元以上,绝非常人所能承受。我们是选择一款昂贵且过于超前的产品还是选择经济实惠的产品相信大家已经心中有数。

  07年三大图形引擎,EA的3D引擎,育碧以及虚幻的新引擎都将是充分发挥3:1架构的Dx9引擎,毕竟DX10离实际软件应用还太远,诸如Crysis这样的DX10游戏也只是在开发时期用到了DX10的技术,表现出来的效果距离DX9相差不大,更值得注意的是Crysis最快也才是明年3季度末才会出来,因此DX10的应用尚早,游戏引擎和显卡核心的架构在DX9游戏中充分发挥,才是明年的重点。在G80和R600的衍生品没有上市之前,选择统一着色器架构的成本远远高于3:1架构。笔者希望NVIDIA尽快拿出相应产品,不要重蹈昔日FX5700之覆辙,同时也提醒20寸以上液晶的用户,在挑选显卡的时候需要格外注意:不是每一款千元以上的显卡都可以满足你的要求。

  本次测试有幸得到国内ATI市场部直接支持,得到官方提供的RadeonX1950GT。目前Radeon1950GT还没有所谓的公版设计,主要PCB板型来自于同德和捷波两家,此款RadeonX1950GT就是其中的捷波代工。默认频率为500/1400MHz,显存频率稍高于官方规格。

  散热方面采用了经典的仿思民孔雀开屏式散热器,测试时我们发现整体发热量控制明显要比公版RadeonX1950Pro好得多。

  RadeonX1950GT核心仍然采用RV570,RV570是ATI第一款试水80nm工艺的核心,同时也是全球最先采用80nm制造的图形核心。得益于80nm工艺和原生36Pixel Shaders单元,RV570核心整整R580核心小一圈,Die面积的大小会直接影响生产成本,继而影响整卡在市场上的综合竞争力。过往的RadeonX1800GTO和Radeon1900GT就是由于都采用成本高昂的R520/R580,使他们在价格战后马上成为无实际购买意义的“收藏品”。另外Die上一个小X引起了我们的注意,难道打上X的就是RadeonX1950GT?这问题我们需要进一步考究。

  核心供电部分采用两相供电,每相MOS管达到4个之多,多路MOS管并联设计可以起到负载分流作用,使发热量分散。

  显存供电部分集中在尾步,和RadeonX1950Pro一样,RadeonX1950GT仍然要通过外接6pin供电才能正常使用。

  新工作模式的CrossFire是RV570的魅力所在,RadeonX1950GT同样支持Native CrossFire工作模式,从RadeonX1950Pro开始,ATI把混合图象的引擎陷入到VPU中,每张RadeonX1950Pro上都带有两个12Bit、工作频率为350MHz的并行数据交换接口,两个接口是可以同时负责数据输入和输出的,理论上比起SLI的单向传输更快,尤其在打开全屏抗锯齿等高负载运算的时候。当然,在实行这种新CrossFire工作模式后,不同主副卡组合的方案随之也消失了。

  板载三星优异1.0ns的GDDR3显存是本卡亮点之处,在此之前我们只在NVIDIA最高端的Geforce8800GTX上见过同等级的显存,而且容量达到512M,本次ATI官方所提供这块RadeonX1950GT的显存规格相当豪华。

  为了尽量减低其他部件所带来的瓶颈,整个平台都采用现时优异装备的代表。测试用软件包括3大版本3Dmark、3款DirectX3D游戏和2款OpneGL游戏,游戏中全特效打开至最高,分辨率采用1024x768、1280x1024和1600x1200等两个主流分辨率。

 

  ATI这款RadeonX1950GT仅仅在核心频率上比RadeonX1950Pro低75MHz,所以性能损失并不明显,这种情况和当时Geforce7900GS与Geforce7900GT之间的关系非常相似。我们把焦点放在RadeonX1950GT与Geforce7900GS之间的对抗上,可以发现ATI把RadeonX1950GT的频率控制得相当优秀,在大部分项目包括OpenGL游戏Prey中,RadeonX1950GT都稍微领先官方频率的Geforce7900GS,而优品飞车10中,RadeonX1950GT几乎以一倍的速度胜于Geforce7900GS,充分显示了1:3黄金架构在未来游戏中的实用性。总体来说RadeonX1950GT相当于RadeonX1950Pro的85%-90%性能,DirectX3D性能稍稍领先于Geforce7900GS。

IT168评测中心观点:

目前已有众多品牌发布了自己的1950GT显卡:

盈通镭龙1950GT黄金版

七彩虹镭风X1950GT-GD3 CH版

双敏火旋风PCX19528GT

昂达X1950GT狂飚版

祺祥1950GT

很少有的GDDR4显存东翎1950GT

  本来RadeonX1650XT和Geforce7600GT在千元显卡的争夺中,RadeonX1650XT有一定把握。不过NVIDIA以其在芯片上的成本优势,如狼似虎地把Geforce7900GS杀至999元,显然RadeonX1650XT在性能上并不是Geforce7900GS的对手,现时价格降至999元的Geforce7900GS只有三家AIC,其他大部分Geforce7900GS仍然在1000元以上,所以并未能算大范围跳水。而这次ATI策略变动反应也非常之快,降频后的RadeonX1950GT使良品率大大提高,生产成本下降使其受到同德和捷波两大代工巨头支持,这样的情况下999元成为RadeonX1950GT的最终上市价,如果能在未来短时间内大面积铺货,这将对Geforce7900GS造成重大打击,毕竟RadeonX1950GT性能还是稍领先于Geforce7900GS,同样的价格下当然选择性能更好的,不是吗?

0
相关文章