显卡 频道

5大秘籍 ATi 55nm HD3800最全纵向测试

    【IT168 评测中心】作为AMD第二代平台化策略中的重要成员,RV670图形芯片与Radeon HD3800系列比整个平台率先一周登场。如果说,AMD第一代平台化策略的主角定位于主流市场的话,那么以K10和RV670领衔的新一代平台则意味着高性能、新技术与新的应用潮流。

     何谓潮流?DX10游戏、高清播放、超频、环保、静音,似乎这些要素已经可以非常完整而准确的概括DIY市场甚至整个桌面PC市场的特点。从率先登场的Radeon HD3850和HD3870来看,它们采用的RV670芯片,采用半世代55nm工艺制造,理论上可以进一步控制功耗。而ATI完整的UVD也将融入RV670,让中高端产品具有完整的高清硬件解码能力。在3D性能上,由于保持R600320个流处理器主要架构不变,性能也肯定远比RV630好,是目前能够应付DX10游戏的最好选择之一。

    Radeon HD3850除了在性能和功能上的优势外,ATi对市场的敏感性再次发挥了作用。从各个渠道反映出很多关于这款产品今后价格的传闻。最具杀伤力的是非公版 HD3850 256MB的价格会达到1000元左右。这让较早前发布8800GT的NVIDIA惊讶不已,因为NVIDIA计划256MB版本的8800GT价格最低会在1599元。对于中国市场而言,1000元和1500元的影响力可谓天壤之别。

    虽然ATi的R600作为优异产品落后NVIDIA G80半年多发布,但时隔半年,ATi又迅速发布新品迎战NVIDIA。与优异产品战场不同,主流中高端产品是整个产品线生命力最强的部分,ATi和NVIDIA都明确表示RV670和G92都会是今后主流最具性价比的产品。ATi RV670在哪些方面能够领先G92呢?

    与R600相比,RV670在架构上的变化非常小,在最重要的流处理器个数上没有缩水这保证了RV670与R600的性能在周边规格不变的情况下性能不会有太大出入。而由于和NVIDIA架构不同,流处理器频率与核心频率完全一致,所以总体来说与产品性能相关的还有另两个参数:核心频率与显存带宽。

RV670架构图,保持320个流处理单元不变

    从官方提供的数据来看,由于采用了55nm工艺即便是Radeon HD3850频率也达到了680MHz之高,而HD3870的频率则有780MHz,所以在核心部分RV670绝不比R600弱。在显存带宽方面,RV670只支持256bit,而R600支持512bit,这成为大家最为关心的一个参数。

 

NVIDIA

ATI

产品型号

GeForce
8800GTX
GeForce
8800
GT
Radeon HD3850/3870 Radeon
HD2900XT

核心代号

G80 G92 RV670 R600
工艺制成 90nm 65nm 55nm 80nm

核心频率

575MHz 600MHz+ 670/775+MHz 740MHz
Shader频率 1350MHz 1500MHz+ N/A N/A

显存频率

1800MHz 1600MHz+ 2200MHz/1600MHz 1650MHz
显存容量 512MB+256MB 512MB 512MB 512MB

显存类型

GDDR3 GDDR3 GDDR3/4 GDDR3

显存位宽

256bit+128bit 256bit 256bit 512bit

流处理单元

128个全标量 112个全标量 320个Superscalar 320个Superscalar

    与竞争对手同级别产品G92(8800GT)相比,它们都拥有256bit的显存带宽,而RV670相对R600没有减少流处理器数量;G92相对前一代产品,根据性能需求灵活调整了流处理器数量(8800GTX 128个、8800GTS 96个)至112个。由于两家对统一架构的方向有所不同,所以在参数方面数字不能正面对比,其中差别只能由整体性能来体现了。

    55nm!这是ATi在一年内第三次提升半导体制造工艺,前两次是在半年前的R600推出时的80nm和RV630采用65nm工艺,对于AMD/ATi和NVIDIA这样无晶元制造工厂的企业来说采用更新的工艺需要付出更多的心血甚至遇到更多的风险(AMD的工厂不制造ATi的芯片),但得到的回报也更立竿见影。

    55nm让ATi的RV670尺寸大大减少,对于无晶元工厂的ATi来说将大大减少成本。由于RV670相对R600从架构上基本没有发生变化,所以这次单纯工艺上的提升相比RV630(架构+工艺同时革新,难度更大)的诞生顺利地多,研发难度也小得多,直接受益非常可观。

RV670 HD3850核心

    具体的说,使用最新工艺让RV670核心面积为190mm2。以一块300mm晶圆为例,能造出大概300个的RV670芯片,而同样用来制造320mm2 G92芯片的话只能造出大概180个,这个数字差距相当大。在同一块晶圆上切出越多的芯片意味着制造成本更低。

RV670核心大小
 
    由于芯片方面近一倍的理论成本优势,HD3850的价格会非常惊人。从目前情况来看,迪兰恒进公开表示HD3850第一批公版512MB产品售价将在1499元。整体来看,HD3850 512MB 公版价格最高大概会在1599元。而非公版的会更低,最为吸引人的是256MB的非公版HD3850,价格肯定会在1200元以内,甚至杀至999元。

    没有任何信息表明,NVIDIA G92核心的8800GT会达到同样价位,即便是256MB产品NVIDIA也没有如此低价的计划。当然,我们也没有看到如此低价格的HD3850上市。

    关于DirectX10.1,ATI和NVIDIA各执一词。ATI给我们列出了如下表格和一个简单的应用环境的图片。从列表对比看,DirectX10.1有DirectX10有众多的不同。但演示效果显然不可能是两者差别的对比,所以我们还并不能完全清楚DirectX10.1真正的威力。

HD3800系列 DX10.1效果演示
    上图Demo根据ATi官方解释,大概是说在打开此效果后,顶部的光源可以影响每一个球的表面。球与球之间也存在光线多次反射效果的处理,光线与周围墙壁的反射也会被多次处理。由此看来,这套光影效果将更加真实。但是DirectX10就无法实现相应效果吗?

特性 DirectX10 DirectX10.1
ShaderModel 4.0 4.1
独立的每MRT混合模式
像素覆盖蒙板
样本图例选择
立方体贴图阵列
最小4倍MSAA
VS输入 16 32
混合 INT8,FP16/32 INT8/16,FP16/32
滤波 FP16 FP32

    而NVIDIA方面也明确表示过,DirectX10.1并无重大改进。但DirectX10.1为HD3800增加了一个非常“通俗”的卖点,如果ATI愿意将它作为宣传点可接受程度一定不低。但我们也知道,对于目前新的DirectX10游戏来说,瓶颈不在新标准和新改进。当务之急的问题是,即便是优异显卡也无法在高画质、高分辨率下流畅的运行游戏。

    解决的办法目前看只有一个——多卡互联。

    在AMD并购ATi后,平台化的策略推行的相当成功。在2007年上半年,从ATi芯片组摇身一变的AMD 690G芯片组取得了不可思议的销量,而Athlon64X2、690G芯片组和HD2600Pro显卡的组合是AMD Fans不二的选择。但遗憾的是AMD忘记给第一代平台化策略下的平台起一个统一的名字?到头来我们大家只记得690G芯片组……或者别的什么。

    AMD聪明的给第二代平台起了一个统一的名称——Spider。而依托多年修炼的成果K10、明年的3核心产品、4块显卡互联的CrossFire X,Spider平台亮点不但多,而且颇具创意,与竞争对手相比甚至达到了人无我有,人有我精的境界。可是遗憾的是,我们还无法使用K10 CPU Phenom来打造今天的测试平台。

显卡的超频工具

    由于平台仍处于保密阶段,我们不在这里做进一步说明。而对于一些用户来说,也许平台化后的OverDrive软件值得大家关注。这款软件类似NVIDIA nTune,可以在Windows下设置系统非常多的参数,基本可以认为BIOS中可控制的它都能做到,详细到内存时序参数。而得益于Phenom+AM2+接口下,多核心独立电源管理的结构,用OverDrive超频将会更加详细和灵活(也许可以每个核心独立调整)。

    而AMD更承诺,如果是采用Spider平台,性能将提升7%。

    相对NVIDIA的PurevideoHD,ATi的AVIVO HD具有更强的VC-1编码格式的解码能力,幸运的是RV670也将继承完整的AVIVO HD,对AVC和VC-1编码格式的1080p高清视频进行全程硬件解码。

HD3870高端显卡也可以支持完整的高清加速

    虽然在前一代高端产品中,ATi和NVIDIA均表示,高端显卡一定会搭配高端CPU,所以高端产品不需要纯硬件的高清解码。但现在看来,高清的趋势越来越热,作为一款现在的中高端产品今后的高性能主流产品,高清硬解码不可缺少。

    但对于中国市场,ATi的AVIVO HD稍有些不如意。由于国内的高清节目源大多来自于网络下载,为了便于存储网络流行格式为重新封装的TS,每个文件均尽量接近4.7G(D5规格DVD容量),一个电影由多个TS文件组成。ATi的AVIVO HD在播放这类文件时,加速设置繁琐,开启加速不稳定,无法实现VC-1加速等问题仍需解决。

迪兰恒进精致小巧的包装 HD3870
CrossFire如此构成
盈通HD3850
显卡特点一目了然
HD3850
HD3870
HD3850供电部分
HD3870供电部分
HD3870的核心散热片

    HD3870和HD3850的规格差别主要体现在核心频率高出100MHz左右,HD3870也将支持GDDR4显存。体现到卡的外观和用料,两者差别从头一批公版产品来看区别不大,只是在供电部分稍有差别。虽然HD3870的外观看上去还和HD2900XT一样夸张,但由于55nm带来更低的功耗和更少的发热量,显卡散热器也远没有HD2900XT重,从核心的纯铜散热片可以看到,这个铜质的散热片底部已经薄了许多。而在显存散热片上,HD3870采用了铝质散热片。

    本次测试主要选取了5款产品进行纵向对比,虽然NVIDIA的GeForce8600GTS目前还处于较高价位,但显然86GTS只是频率比86GT更高,86GT超频版本的价格则更低。HD3850,尤其是我们测试的512MB GDDR3高频版本需要面对的对象是GeForce8800GT。但正如我们开篇所说,虽然两者处于同一定位,但目前NVIDIA价格似乎要高出一些。

硬件平台
CPU Intel Core2Quad QX6850
主板 ASUS P5E3-Deluxe Wifi/AP@n
显卡 ATI Radeon HD3870 777/2250
ATI Radeon HD3850 670/1650
ATI Radeon HD2900XT
NVIDIA GeForce8800GT 600/1500/1800
NVIDIA GeForce8600GTS 725/2250
硬盘 Seagate 7200.10 320GB
内存 Apacer DDR3 1333 1GBX2
电源 台达600W
软件环境
操作系统 Windows Vista 32bit
驱动程序 Intel inf 8.4.0.1016
ATI Catalyst 8.43.1000
NVIDIA Forceware 169.09
测试游戏 Futuremark 3DMark06 V110
Crysis DX10
Lostplanet DX10
World in Conflict DX10
Gears of War DX10
Company of Heroes DX10
Need For Speed11 DX9
Call of Duty4 DX9
Halflife2 EP2 DX9
Quake4 OpenGL
辅助软件 Fraps2.9.1

    测试中我们使用了公9款游戏,其中5款支持DirectX10,而其他几款DX9游戏也是近期推出的较新的游戏。游戏测试中,我们选用了1024X768或者720p两个主流分辨率和1920X1200的高分辨。游戏设置细节以保证流畅运行为主要考虑因素。抗锯齿性能对于中高端显卡来说也是常用设置,尤其是在大屏幕显示器上进行游戏时,抗锯齿打开会明显改善视觉效果,具体设置会在游戏测试中说明。

    我们看到,与目前千元级别的8600GTS相比,HD3850有着几乎近一倍的优势。而显存位宽缩减到256bit的HD3870性能却要稍好于512bit带宽的HD2900XT。

《失落星球》设置:of n m 4x h h m d l h h l h  on of of 4 on of,内置Demo测试

    测试的《失落星球》选用测试Demo,不过在测试Demo中ATi驱动无法正确打开抗锯齿选项。但在正式版游戏中,ATi抗锯齿选项可以正确打开。从测试成绩来看,相对3DMark的测试,游戏的表现中HD3870与GeForce8800GT差距拉大。

《战争机器》设置:全高 FRAPS记录

    《Gears of War》(《战争机器》)是XBOX360平台移植大作,测试中在低分辨率和低负荷下似乎有些问题,最高帧数受到了限制(但不是垂直同步问题)。从测试来看,这款游戏达到30fps以上便可以流畅运行。

《冲突世界》设置:全高(noAAnoAF)

    《冲突世界》的内置DEMO测试虽然方便,容易保持一致性但是其负荷太高,明显与实际游戏脱节,不能代表真实游戏情况。所以我们还进行了实际游戏测试,用Fraps记录帧数。

    从测试成绩来看,这几款显卡几乎都可以在1920X1200分辨率下进行游戏。而定位更加高端的HD3870和GF8800GT可以在这个分辨率下打开抗锯齿选项。

《英雄连》 设置:of dx10 h h u m h on h h m m u h h on,内置Demo测试

    在DX10版本《英雄连》测试中选用内置Demo进行,抗锯齿选项打开时不够稳定,所以没有进行相关测试。从得分来看,价格更低廉的HD3850与高端显卡差距较小,而同时领先8600GTS一倍。

Crysis

    设置:Medium=全部Medium,High=全部High,内置GPU脚本测试

    Crysis是DX10应用中最为著名的一款游戏,游戏要求很高。25-30fps左右的平均帧数是正常游戏的最低保证。当细节设置为Medium时,动态模糊等效果相对较差。但显然HD3870/3850这样的中高端显卡只能在720p的分辨率上游戏了。

优品飞车11     设置:全部最高 FRAPS记录

   优品飞车仍是ATi的优势项目,在高分辨率下和抗锯齿下仍然领先于GeForce8800GT。不过,HD3850似乎在优品飞车测试打开抗锯齿时遇到贴图错误的问题,车身会变为阴影。HD3850抗锯齿测试成绩是我们选用一个静态画面时FPS得到的。

《半条命2序章2》 设置:全高 自录Timedemo

Quake4 设置:HighQuality 内部Timedemo命令 id_demo001.netdemo

    这两款游戏都是较老引擎的作品,所以在测试中都得到了很高的帧数,即便是在打开抗锯齿的情况下速度下降幅度也不大,在高分辨率下也可流畅运行游戏。在低负荷下,ATI显卡领先NVIDIA显卡。

《使命召唤4》 细节全开,材质:High,Fraps记录

    在《使命召唤4》测试中,低分辨率和抗锯齿设置下HD3870领先于GeForce8800GT,在1920X1200分辨率下HD3870稍落后于8800GT。高分辨率+抗锯齿时所有显卡都无法正常游戏了。

    NVIDIA只是将PurevideoHD放入了G92中,保持与G84/G86时的高清解码能力。也就是说,对于VC-1格式的高清解码仍不具有全部的硬件加速能力。而ATi HD3850/3870将完全支持与HD2600/2400一样的完全的VC-1和H.264硬件解码加速能力。

    采用55nm工艺的RV670芯片比R600功耗大大降低,我们看到在同样平台下HD2900XT工作时整个平台高达347W。

    我们用光学转速仪对显卡风扇转速进行测试。GeForce8800GT的风扇转速达到1600rpm,但此时显卡整个散热片的温度大概在58度左右,已经非常高,但显卡并没有将风扇提速。ATi的两款显卡风扇转速非常低,显卡散热片温度大概在50度左右,虽然在功耗上它们与8800GT基本一致,但工作温度要低很多,对于整个机箱和系统散热不会带来太大负担。

    不知道是什么原因,一直处于领先的NVIDIA在推出G80一年后发布了G92核心,它不但性能不能超过一年前优异的G80,而且NVIDIA更有计划将G80核心的多款产品采用65nm工艺生产后再次以G9X的名号推出。毫无疑问,新工艺下的G9X相对前一代产品有着明显改善,但3D性能却基本停滞不前。

    ATi在工艺上的努力因此在2007年底得到了回报。55nm工艺+R600的架构与NVIDIAG 9X从各个方面都处于同一位置,而在工艺上还要领先于NVIDIA。正如前面我们谈到的ATi的5大秘籍,除了DirectX10.1还是未知数外,其他几方面又有怎样表现?同我们测试对应,ATi如何迎战NVIDIA?

战果1:320个SP,老架构保证了性能

NVIDIA

 ATI

ATI

产品型号

GeForce
8800GTX
GeForce
8800
GT
Radeon HD3850/3870 Radeon
HD2900XT

核心代号

G80 G92 RV670 R600
工艺制成 90nm 65nm 55nm 80nm

核心频率

575MHz 600MHz+ 670/775+MHz 740MHz
Shader频率 1350MHz 1500MHz+ N/A N/A

显存频率

1800MHz 1600MHz+ 2200MHz/1600MHz 1650MHz
显存容量 512MB+256MB 512MB 512MB 512MB

显存类型

GDDR3 GDDR3 GDDR3/4 GDDR3

显存位宽

256bit+128bit 256bit 256bit 512bit

流处理单元

128个全标量 112个全标量 320个Superscalar 320个Superscalar

    从本次测试来看,HD3850作为未来千元出头的产品,性能已经领先前一代同价位产品1倍左右。虽然届时HD3850不会直接面对8600GTS,但NVIDIA也必须想办法更快的推出能够取代8600GTS位置的产品。而对于消费者来说,1000-2000元价位有价值的产品在真空了一年后终于回归。

战果2:55nm,功耗大幅降低,价格等待考验

    ATi即便在产品稍微落后的时期也没有放弃在工艺上的努力,55nm可谓是ATi近年来努力的最大成果之一。相对自己的前一代产品,HD3870不但功耗降低(满负荷下功耗相差90W)而且发热量也大幅度降低。散热器风扇达到了空前的600-800rpm低转速,在能效方面ATi显然是领先的。但什么时候我们才能见到1000元左右的HD3850?55nm的低成本如何体现?我们拭目以待。

问题:性能,如何发挥最大潜力?

    从本次测试来看,HD3870作为2000元价位的产别与GeForce8800GT相比,除了优势项目外,DX10游戏实际成绩仍不够理想,均落后于8800GT,而这个幅度也稍大于在3DMark06中的差距。不知道在今后驱动中,是否能够进一步追回这个差距。而NVIDIA目前还没有拿出与HD3850同定位同价格区间的产品。

    另一方面,目前来看HD3850/3870的散热系统都处于很低的负荷下,而NVIDIA 8800GT的散热系统几乎处于临界状态。那么,ATi是否愿意通过榨干散热系统的方法而推出性能更强的产品呢?RV670的潜力有多少呢?

    在AMD并购ATi后,ATi产品一直非常关注主流,而对于优异产品则不怎么在意。而且这也表现到与对手竞争时更加注重价格、注重功能,而不注重充分挖掘产品性能。换一个角度来看,更小的噪音、更强的高清还原能力、颇具竞争力的价格都会让HD3850成为一款关注度很高的产品,从功能和性能的角度,HD3850也肯定会比GeForce8800GT更具竞争力和性价比。ATi下一步,似乎要完成一次彻底性能翻身仗。

0
相关文章