NVIDIA在DirectX10时代的步伐明显先行于ATI,G80、G84、G86三款芯片早在4月初已经布阵完毕,并热销于市场,相信早就做好准备的NVIDIA在正来临的旺季里会更加应付自如。本来以为ATI借着与微软合作XBOX 360的机会可以在DirectX10时代先行一步,可是AMD与ATI并购案一事让所有事情都缓慢下来,到现在产品在时效性方面已经远落后于对手。
虽然时效性已经落后于对手,不过在产品规划上ATI仍然没有落后,RadeonHD 2000依然存在分别面向高、中、低端的三款芯片。高端的R600早在5月已和大家见面,原本ATI扬言中端与低端也能一同发布,但从RV630与RV610的芯片版本(最终定案分别为A15和A14)可以猜想到ATI在这两款芯片上遇到的问题并不少,ATI产品发布的延期似乎已经不是什么大新闻,等待已是ATI支持者的一种美德了。
然而G84与G86并不理想的性能帮了ATI一把,让大家对ATI新一代中低端显卡的态度由等待转变为期待。在ATI低调的施令下,面对中低端的RadeonHD 2600与RadeonHD 2400终于在7月初相继发布,之前本栏目已对RadeonHD 2600系列进行了详细的测试(详细请见:“首战便5胜 HD2600XT激情反击评测”),本文的主要测试对象则是面前入门级别的RadeonHD 2400系列。
RadeonHD 2400系列芯片开发代号为RV610,ATI习惯把非最高端的显示芯片命名为RVXXX。RV610与RV630是全球首次采用65nm工艺制造的显示芯片,由台湾台积电代工,内设1.8亿个晶体管。上一代RadeonX1300系列的RV515晶体管数量为1.12亿,相比之下并不算提高多少,而且由于工艺进步RV610的核心面积将会小于前者。
NVIDIA的G86核心 80nm工艺制造 核心面积115mm2
ATI的RV610核心 65nm工艺制造 核心面积82mm2
上图可以很直观地看到RV610核心面积要比对手G86要小得多,这是由于G86内置晶体管达到了2.1亿个,加上工艺源于主流的80nm,所以单从芯片成本控制上来说G86远落后于RV610。(当然由于超前的65nm工艺,在芯片制造前期供货稳定性会受到一定影响。)如果在这样的情况下RV610能在性能上压倒对手的话,那么情况对于ATI来说会非常乐观,从台湾代工大厂同德对于RadeonHD2400/2600作出的迅速反应可以看出其前景将会是如何。
根据ATI的说法,RV610核心内置了40个流处理器单元,是最高端R600的1/8。从数字上看似要比对手NVIDIA同级G86的16个甚至中端G84的32个还要多,那究竟ATI的数量庞大的流处理器单元与NVIDIA的流处理器有何区别呢?
在过往,像素渲染单元和顶点渲染单元都分别负责着不同的数据渲染,比如说像素渲染单元负责着包括RGB(三原色)和这三原色的信息说明等一共四个数据的运算,而顶点渲染单元则是负责三角型顶点的XYZW坐标数据的运算,我们把这些任何一个单独的数据称为标量。因为在以前往往这两种数据都是4个标量为一组的,所以像素渲染单元和顶点渲染单元都被设计成单周期同时执行一组4标量的运算,这就是旧有的SIMD架构,SIMD架构在处理4标量为一组的矢量运算时效率非常高。
但随着游戏的复杂化,一组矢量未必数量一定为4的标量,那么比如在执行只有单一标量的矢量数据时,原来的SIMD架构效率就大打折扣了。虽然近代的ATI使用了“3+1” 的设计,允许一次处理4个矢量运算,或者同时处理一个3矢量运算和一个单标量运算。而NVIDIA的Geforce6和Geforce7系列则除“3+1”外还可以提供一个额外的“2+2”类型运算来提高效率,但由于的单标量运算日益频繁,加上长久以来像素渲染与顶点渲染比重的问题,所以SIMD架构终被取缔,DirectX9时代结束。随之而来的就是统一渲染架构的DirectX10时代。
到了DirectX10时代的统一渲染架构,NVIDIA采用的是全标量流处理器设计,流处理器既可以提供100%的标量运算效率,也能提供100%的矢量运算效率,并且运行频率是核心频率的一倍!而ATI则保持过往R580的策略,在每个流处理器里面放置更多的流处理单元,这里的更多是指由原来R580的1:3增加至1:5,所以RV610的40个流处理器单元组成的只是8个流处理器,不过这些流处理单元仍然支持标量与矢量并行运算,支持5个单独标量同时运算或者1组标量+2个标量的运算,和NVIDIA不同,ATI的R6xx的流处理器频率和核心频率是保持一致的,综合这些区别我们很难去换算ATI与NVIDIA在架构上的强弱,更多情况下取决于游戏设计更适合那一种架构。
ATI在昔日的低端产品上一直强调128Bit完整的显存位宽,造就了象Radeon9550和RadeonX550这样在市场上具有压倒性优势的成功产品。不过让人出乎意料的是,ATI这次DirectX10时代的Radeon HD 2000低端的2400系列全部仅采用64Bit显存位宽,一反以往常态。
早在进入DirectX9的时候,NVIDIA就开始在入门级产品上推行64Bit显存的规格,NVIDIA比较早地意识到低端产品在要顾及成本的前提下其实很难满足日新月异的游戏需要,应该加入一些除3D性能以外扩展用途作为卖点,可惜由于想法过于超前,两代入门级产品Geforce6200TC和Geforce7300GS口碑都较为一般,不过由于在DirectX9后半时期业界都随之开始注入高清概念,Geforce7300/7600系列为未来高清普及之路打好了铺垫。
RadeonHD 2400PRO上极为少见的2.0ns DDR2显存
进入DirectX10时代后,入门级显卡对于更高强度的3D游戏来说就更显疲惫了,ATI也开始意识到在足够便宜的成本下,入门级显卡的定位应该是视频性能为主要用途,且又能提供比集成显卡好的3D性能,这样才能刺激不断被集成显卡蚕食的低端市场,或许ATI在这个时间点切入会更为恰当。所以在未来的低端产品上,我们不应该把64Bit显存位宽看成是低性能的缺点,以过往单以3D性能的眼光看待入门级显卡的观念已经过时。
另外值得一提的是,R610去掉了R600其中关于显存带宽的特色功能Ringbus,这与昔日RadeonX1300系列一样。
其实关于UVD技术,我们应该并不陌生,我们在这里做一下简单的回顾和说明。UVD是ATI针对HDDVD和Blu-Ray Disc两个载体高清影片载体所对应的高清内容进行的一种硬件解码技术。由于未来高清规格的趋势基本已经明朗,VC-1和H.264两种编码是目前的绝对主流。与两年前我们看到的1080p视频节目不同,当时它们大多来自国外高清电视台,所以码率有所限制。而以HD DVD和BD为载体的电影,码率通常较高,所以普通CPU无法应付。
NVIDIA PurevideoHD
ATI AVIVO HD
显然,无论是NVIDIA的Purevideo还是ATI的AVIVO,在上一代产品已经声称支持HDTV硬件解码,而又在今天说自己支持“完全硬件解码”,这多少体现了厂商在当年的不诚实。不过,我们不得不承认,完全硬件解码的确有非常大的好处。
从上面两张图我们明显看到,无论是PurevideoHD还是AVIVO HD他们与原来解码技术的区别。就是在高清解码的第一步,即熵编码的解码(流处理)实现了显卡核心内专门处理单元的工作,大大解放了CPU。简单的理解,视频解码分四步,第一步最为重要。原来的Puervideo可以实现后两步,而现在的UVD和PurevideoHD都可以实现四步。不过,ATI似乎不够诚实,我们不认为前一代的AVIVO技术可以实现图中所示的三步,因为我们根本没有发现AVIVO技术对H.264和VC1在缓解CPU压力上做出什么贡献。
从上图看AVIVO HD和Purevideo HD不是一样吗?解码的过程虽然一样,但是在格式支持上出现了不同。PurevideoHD “四步解码”只支持H.264编码,不支持VC-1。而AVIVO HD两个都支持。我们可以在稍后看看具体测试。
公版的RadeonHD 2400Pro非常有趣,如果单从正面看,在硕大的散热片掩盖下并没有任何特别,翻过来看才知道原来卡本身是“缺角”的。由于RV610采用了业界领先的65nm工艺,加上Pro版本核心频率只有525MHz,所以只采用散热片也足够应付。
RadeonHD2000 系列显卡都整合了一个5.1 HD Audio控制器,只要安装了驱动,板载在主板上的codec例如Realtek的ALC88x就能通过南北桥,再通过PCIE总线将声音传到Radeon HD2000上面,显卡再将DVI信号和AUDIO信号合成在一起,最后从一个DVI接口输出,因为RadeonHD 2000的其中一个DVI接口同时有图像和声音了,我们可以形象的将这个DVI接口称为“Audio DVI” ,既然有了Audio DVI,一切都好办,AMD只要给RadeonHD 2000显卡配置一个专用的DVI转HDMI接口就能做到一线通了。
ATI公版RadeonHD 2400Pro上采用了以往极少见到的-2.0ns DDR2显存,运行频率为标准的1000MHz,正反四颗组成64Bit/256M显存规格。
ATI公版的RadeonHD 2400XT因为核心频率大幅度提升至700MHz,所以转为使用主动散热的方式。其实这种刀版PCB在ATI显卡上已经不是第一次出现,早在Radeon9000时代我们已经见过类似的设计。
RadeonHD 2400XT显存较Pro升级到HY -1.1ns DDR3显存,默认频率为1600MHz,相对与-1.1ns显存标准频率1800MHz而言比较保守。
国内显卡主流品牌昂达也第一时间把他们的RadeonHD 2400Pro显卡送到评测中心,虽然这只是一款RadeonHD 2400Pro,不过其核心频率提升至600MHz,介于官方规格的Pro与XT之间。
全卡覆盖着厚实的铝质散热片,宽阔的面积有效最大限度分散热量,热量挥发更迅速。
显存采用比较少见的南亚颗粒,256M -2.5ns DDR2规格,工作在标准的800MHz频率。
另外一款非公版的RadeonHD 2400XT来自另一主流品牌盈通,从布局上看这款RadeonHD 2400XT和前面昂达的RadeonHD2400Pro非常相似,同样来自台湾OEM巨头同德之手。这款RadeonHD 2400XT频率达到700/1500MHz,稍低于公版的700/1600MHz。
700MHz的RadeonHD 2400XT需要主动散热支持,小巧安静的小型散热器足够满足需要。
RadeonHD 2400XT必须配备DDR3显存,盈通这款RadeonHD 2400XT配备奇梦达的-XP DDR3显存,默认工作在1500MHz。-XP早在Geforce7600GT时期就大规模使用,一般代表着-1.4ns的速度。
国内显卡业龙头七彩虹也带来了另外一款非公版的RadeonHD 2400XT,与昂达、盈通不同的是七彩虹这款RadeonHD 2400XT并非来自同德,而是另外一家ATI主要代工厂启亨,可见七彩虹脱离同德体制的决心日益增大。不过这款RadeonHD 2400XT频率较盈通稍低,为600/1400MHz。
RV610发热量之低在几个品牌的散热方案上可以充分体现。
与其他几款RadeonHD 2400系列显卡相比(包括ATI原厂),七彩虹的RadeonHD 2400系列最大的区别在于直接把HDMI接口做到档板上,而无须专用转接器。
使用奇梦达256M -1.3ns DDR3显存,默认工作频率为1400MHz,还留有一定的上升空间。
因为本次测试对象都为入门级显卡,所以我们同时也配备了现在主流市场上最为火红的E2140平台,测试成绩将更贴近大众真实情况。测试用软件包括2大版本3Dmark、5款DirectX3D游戏和3款OpneGL游戏,游戏中全特效打开至最高,因为测试对象都为主流级别显卡,所以采用1024x768、1280x1024等两个常用分辨率。
理论性能的3Dmark中RadeonHD 2400XT系列表现非常抢眼,尽管只拥有64Bit显存位宽,但无论05和06得分都与Geforce8500GT/Geforce7300GT持平,而RadeonHD 2400Pro则与其直接对手Geforce8400GS一致。
|
几款DirectX3D游戏除了FEAR中RadeonHD 2400系列明显落后NVIDIA外,其他游戏均领先主要竞争对手Geforce8400GS,总体来说介于Geforce8400GS和Geforce8500GT之间。
OpenGL游戏中老一代的DirectX9显卡Geforce7300GT占有绝对性优势,大幅度领先其他DirectX10显卡。不过Prey一直是一款较为中性的游戏,在这项目中可以看到RadeonHD 2400XT还能够稍稍领先于Geforce8500GT,告诉大家64Bit战胜128Bit并不是不可能的。
如果大家非常关心UVD,就一定会看过不久前的很多相关测试。可以看到,AVIVO HD在很多情况下CPU占用率是0。的确,从上面的第二张图以及我们测试数据看,AVIVO HD的确让CPU占用率为0的时间比Purevideo多,但是我们认为这可能与策略有关。
另外一方面,我们可以仔细看以上两张图。它们测试的是同一个片段,都是来自目前码率最高的《Transport2》预告片,整个片断码率长期保持35Mbps,40Mbps以上经常发生。最高的几次峰值达到了49.8Mbps。但是第一张图,我们是用蓝光光驱直接播放,第二张图是直接播放破解的M2TS视频文件。两者差距很大,所以大家不要误将两种不同的测试交叉对比,而得出AVIVO HD领先很多的结论。
《X-Men3》的测试同样使用的是蓝光影碟的原版拷贝。即不是重新封装的TS文件,也不是独立的M2TS文件。该影片平均码率大概在20-25Mbps,峰值达到35Mbps。从测试来看,PurevideoHD和AVIVO HD水平相当。
《Swordfish》剑鱼行动,平均码率20Mbps-25Mbps。峰值不算高,大概不到30Mbps。但是在HD DVD载体的VC1编码中是负载比较高的影片了。我们看到,由于GF8系列不支持解码中的“前两步”,所以表现确实不如AVIVO HD好。
我们将所有取样点的CPU占用率取平均值,得到以上两个图表。我们看到,在两者都支持的H.264硬解码下,ATI稍占优势。而VC1解码,AVIVO HD会让CPU占用率更低(相对H.264,VC1负荷相对较小)。综合这次测试来说,ATI保持了其一向视频性能占优的口碑,至于画质方面由于每个人主观角度不一,这里就不再争议谁胜谁负了。
ATI低端市场向来的主力销量在于OEM方面,从二手市场上大量的Radeon9200、RadeonX300和RadeonX1300拆机品可以看出,DELL和HP等国际整机巨头长期都是ATI在低端市场上的大客户,这主要取决于ATI入门级产品长期保持着低功耗和低成本等优点,在RadeonHD 2400系列身上也得到了很好的继承。
不过这次RadeonHD 2400系列在性能上也有所突破,单以64Bit显存位宽就能达到对手128Bit的Geforce8500GT性能水平,明显胜于主要竞争目标Geforce8400GS,可见在本代低端核心上RV610的每平方毫米性能比要远超于G86,难怪著名OEM巨头同德对RV610如此重视,抢在其他代工厂商前订下大量芯片,到现时为止除了ATI公版和蓝宝少量的成品外,我们看到的绝大部分都是同德所生产的RadeonHD 2400系列显卡。
最后说说价格,对于一块显卡成本来说,除了核心外显存是另一占比例最高的部件,64Bit显存虽然影响了整体3D性能,但同时也能使整体成本明显下降。我们前面就说过,以过往单以3D性能的眼光看待入门级显卡的观念已经过时,入门级显卡的趋向是以多功能为主,比集成显卡3D性能强为辅助,这种趋向在RadeonHD 2400系列上得到完美的体现。昂达该款RadeonHD 2400Pro上市价仅为399元,而现时Geforce8400GS公价都在499元左右,在新的65nm工艺走向成熟后相信RV610价格将还会有进一步的下调空间,笔者预言RV610将是低端上为独立显卡抢回很大市场份额的一款成功产品。