【IT168评测中心】在SLi和Crossfire技术的支持下,NVIDIA与ATi已经从单GPU性能的比拼上升到两颗甚至四颗GPU协同工作显卡的竞争。两家公司在GPU互联的技术上有不同,导致它们的优异产品的思路上也稍有不同。依靠SLi以及Quad-SLi,NVIDIA将两颗G71核心打造成7950GX2显卡以及Quad-SLi平台;而在7950GX2后推出的X1950XTX最大的亮点在于,首次将GDDR4显存使用在显卡上,从而取得了显存带宽上的明显优势,而由它组成的Crossfire平台更是有着挑战NVIDIA Quad-SLi的实力。在这样的平台下,我们可以体验更高分辨率更高画质的3D画面。
高分辨率的3D能力在以LCD显示输出时代是非常重要的,因为分辨率的完全匹配与画质好坏有密切的关系。例如,在2560X1600分辨率的Dell 3007WFP显示器上,以1920X1200运行游戏,即便打开抗锯齿设置,由于没有实现点对点显示,物体边缘的锯齿现象仍会非常明显。这就意味着在非标准分辨率下的任何抗锯齿都是无效的。作为下一代主流LCD产品的24英寸显示器,其标准分辨率会达到1920X1200(20-22英寸标准分辨率为1680X1050),如此一来,显卡的3D性能对于追求画面质量的用户来说会更加重要。
在测试中选用高分辨率的意义在于尽量避免在较低分辨率下由于显卡性能强劲造成的CPU瓶颈,在随后的测试我们可以看到,在Farcry 1920X1440的分辨率下双GPU得分仅了略高于单GPU,显然是有瓶颈存在的,至于更低的分辨率测试此问题就更加明显。在低分辨率下得到的成绩不能代表显卡子系统的真实性能,而是更多表现了CPU的性能。另外,我们选用1920X1400和2560X1600两个分辨率,用途在于比较两分辨率下性能的差异。
X1950XTX核心使用改良版的R580——R580+ GPU,它拥有Ultra-Threaded Shader Architecure(超线程渲染结构)、Shader Model 3.0、Ring Bus Memory Controller、用于屏蔽不可见渲染的Hyper-Z、HDR+AA(NVIDIA不可同时HDR+抗锯齿)128位的浮点指令渲染、AVIVO等原先R580具有的特性,而改进可能更多的要归功于对GDDR4显存的支持。
我们简单回顾一下,R580中的重要技术。Ultra-Threaded Shader Architecure(超线程渲染结构),是与DX9.0c中SM3.0规范的重要部分——像素渲染的动态分支控制对应的解决方案。Ring Bus Memory Controller(环型显存总线)搭配GDDR4显存,是R580+拥有更高的显存读取效率。而在R580上得到提升的的Hierarchical Z缓存能确保R580的性能不会在WQXGA(2560×1600)下急剧下降。而最重要的是,R580核心创纪录的集成了12个四元像素着色器核心(Quad Pixel Shader Core),像素着色器单元(PSU)为48个,而在R520中四元像素着色器核心仅有4个,即16个像素着色器单元。而这些单元又由超级线程分配处理器(Ultra-Treading Dispatch Processor)统一调度(关于GDDR4和R580+更多内容请查阅《排头兵 X1950XTX引发GDDR4革命》)。
虽然ATi官方号称较好的控制了R580核心的功耗,但对于3.8亿晶体管,650MHz的工作频率来说散热问题仍然十分重要。在推出1950XTX显卡时ATi再次设计了散热器和风扇,以达到更加静音的目的。
Radeon X1950XTX |
R580+核心(点击放大) |
GDDR4 显存颗粒 |
Crossfire、视频控制芯片 |
从外观和芯片来看X1950XTX没有太大特别,不过每片显卡的重量相当可怕,两块显卡总重达2.5kg左右。与GeForce7950GX2显卡相比,无论是X1900XTX还是X1950XTX都显得有些庞大。而NVIDIA最新推出的GeForce7950GT更是可以采用了无风扇的设计方案,并达到570MHz的核心工作频率。
本次测试的显卡包括Radeon X1950XTX、GeForce7950GX2和GeForce7950GT。从产品定位来说,7950GX2是NVIDIA单卡的最高端产品,而大家不要忘记最高性能的SLi组合应是GeForce7900GTX SLi。另外,本次测试选用7950GT是因为这次测试的7950GT的规格和频率与7950GX2“单”卡一致,这样我们可以用它来衡量SLi的效率,便于与Crossfire对比。
ATi |
NVIDIA | |||||
产品型号 |
Radeon |
Radeon X1950XTX |
Radeon |
GeForce 7950GX2 |
GeForce 7900GTX |
GeForce 7950GT |
核心代号 |
R580+ |
R580+ |
R580 |
G71×2 | G71 | G71 |
工艺制成 | 90nm | 90nm | 90nm | 90nm | 90nm | 90nm |
核心频率 |
650MHz |
650MHz |
650MHz |
500MHz | 650MHz | 550MHz |
显存频率 |
2000MHz |
2000MHz |
1550MHz |
1200MHz | 1400MHz | 1400MHz |
显存类型 |
GDDR4 |
GDDR4 |
GDDR3 |
GDDR3 | GDDR3 | GDDR3 |
显存位宽 |
256bit×2 |
256bit | 256bit | 256bit×2 | 256bit | 256bit |
像素渲染管线 |
16×2 |
16 | 16 | 24×2 | 24 | 24 |
像素渲染处理器 | 48×2 | 48 | 48 | 24×2 | 24 | 24 |
顶点处理器 |
8×2 |
8 | 8 | 8×2 | 8 | 8 |
硬件平台 | |
CPU |
Intel X6800 2.93GHz |
主板 |
Intel X975 XBX |
内存 |
Corsair DDR2 1066 512MBX2 |
硬盘 | WD 4000KD |
显示器 | Dell 3007WFP |
功耗测试 |
UNI-T UT71E智能数字万用表 |
显卡 |
ATi Radeon X1950XTX CrossFire(650MHz/2000MHz) |
NVIDIA GeForce7950GX2(570MHz/1400MHz) | |
NVIDIA GeForce7950GT(570MHz/1400MHz) | |
软件环境 | |
操作系统 |
英文Windows XP SP2 |
驱动程序 |
Intel Chipset Software Installation Utility 8.1.1.1001 |
ATi 6.8催化剂 R580+版 | |
NVIDIA Foreceware91.47 WHQL | |
测试项目 | |
D3D理论测试 |
3DMark05 Build 1.2.0 |
3DMark06 Build 1.0.2 | |
游戏测试 |
Quake4 1.05beta(支持SMP) |
F.E.A.R | |
Age of Empires3 | |
Farcry 1.34 |
|
(注:测试中所有AA是指4X全屏抗锯齿,AF为8X各向异性过滤设置)。
在整个测试中,我们可以看到X1950XTX CF要比7950GX2高20-30%左右的分数。在3DMark05中,我们看到将分辨率提升至2560X1600时,NVIDIA的显卡下降幅度要较ATi高出不少。普通状态高分辨分数分别是原分数的80%(N)和66%(A);高分辨率打开AAAF状态与低分辨率普通状态相比,分数比例分别为46.6%(N)和64.3%(A)。
在3DMark06中,由于SM3.0/HDR子项的缘故所以N卡是无法打开AA选项的。而在Crossfire状态下,3DMark06也在测试AA和AF全开的情况下出错。3DMark06中,分辨率增高使N卡降低了33%A卡降低了17%。打开AAAF状态时同样是N卡降低的比例较大。
整体来说,1950XTX在高分辨率以及打开AAAF状态下有更好的成绩,分数下降明显低于N卡。3DMark05 1920X1440分辨率下,SLi和Crossfire都比单卡有67%左右的提升,在2560X1600分辨率下,则均有80-90%的提升,SLi和Crossfire的效果也基本一致。在3DMark06中 1920X1400分辨率下,SLi比单卡有75%左右的提升,而Crossfire仅有68%左右;2560X1600分辨率下,SLi和Crossfire提升均为77%左右。
|
F.E.A.R.的测试中,游戏本身仅支持最高2045X1536,我们可以看到SLi和Crossfire可以带来非常高的最高帧数。但在高分辨率下,40fsp以下的帧N卡占57%A卡占27%,已经无法正常运行游戏。在测试所用的设置下几乎只有SLi(7950GX2)和Crossfire才能完成正常游戏。从平均帧数看,7950GX2、7950GT与X1950XTX CF、X1950XTX的差距在18%左右,没有3DMark中的差距明显。
|
|
配合Farcry Benchmark1.6,我们可以将Benchmark的分辨率方便定义。虽然打开了Farcry的最高画质,但是我们可以看到在1920X1440分辨率下,CPU仍构成瓶颈(尤其在SLi和CF下),所以这项成绩是无效的。在该分辨率下打开AAAF后,成绩回到正常水平。而SLi和Crosffire相对单卡带来的提升也要好于3DMark的测试,这对于用户来说是个好消息。 在其他测试项目中,A卡仍能领先N卡20%以上,而高分辨率AAAF下,N卡下降的幅度也比A卡严重许多。
在Quake4的测试中,我们用命令指定了分辨率,并将画质设置在High Quality下。正如ATi所骄傲的,在NVIDIA的绝对优势项目Quake4的测试中,ATi也赢了。但相对前面领先20%左右的幅度来说,Quake4赢得惊险,显然OpenGL上,A卡仍谈不上有根本上的优势。
虽然对R580的耗电有所心理准备,但是对于1950XTX高出7950GX2如此多的耗电量我们仍有些意外。当然,令人欣慰的是X1950XTX的功耗并没有比X1900XTX高出太多。可以想象,比G71多出的1亿个晶体管,2GHz的GDDR4都显然会比N卡有更大功耗。当然,我们也可以看到从G70蜕变后的G71在节能发热方面有非常出色的表现。没有风扇的优异显卡正是由GeForce 7950GT来实现的。而在待机功率上,由于目前显卡在2D状态都会大幅降低频率,这一成绩并不比X1600或7600GT高太多。
1.ATi Radeon X1950XTX,平均领先20%以上。
显然,ATi更愿意将X1950XTX与7950GX2来对比,因为7950GX2的定位是NVIDIA最高端的显卡,而且它有两块GPU。但我们要澄清,目前NVIDIA 双GPU SLi方案中最高端的是7900GTX SLi,它的核心频率达到650MHz,比我们使用的测试显卡的570MHz更高。但ATi 1950XTX在整个测试中,平均20%以上的领先优势大多数情况下是7900GTX SLi追不回来的。尤其是在2560X1600以上分辨率30%-40%以上的差距更为明显,可以说X1950XTX在性能上的领先是非常明显的。
2.SLi与Crossfire同样优秀。
在SLi和Crossfire的效率对比中,两者不相伯仲。Crossfire虽然名声没有SLi大,但效能绝不比SLi差。只是通过外接线连接时不够方便,用户必须将螺丝拧紧,否则有可能出现花屏现象。
3. ATi高功耗,高成本问题依旧。
优异卡也可以无风扇:GeForce 7950GT |
当然,X1950XTX也许面临一些问题。最明显的当属高功耗问题,如果按照Intel流行的每瓦性能来算,A卡可是要吃大亏了。1亿个晶体管造成的在功耗上的差距并不是通过设计经验能够找回来的。同样是这1亿个晶体管,R580的生产成本也可能会高于G71,但ATi却在市场策略上采取低价的方针,这对ATi的长远发展是否有利呢?
4.X1950XTX优势没有转化为胜势。
最让人遗憾的是,与ATi当年推出Radeon 9700 Pro大胜GeForce6800时的态度不同,ATi对于X1950XTX的态度相对低调。而X1950XTX在性能上的领先,并不比当年9700Pro的情况差。大家都清楚,性能王座是要轮流坐的,不用一个月时间NVIDIA将会发布下一代产品G80 GPU,届时X1950XTX CF也是要让出王座的。X1950XTX如此大的性能优势没有转化为市场中的胜势,的确令人可惜,而当年R9550的辉煌正是R9700的成功运作带来的。是ATi-AMD的合并耽误了X1950XTX吗?
另外,NVIDIA曾表示,ATi在与NVIDIA竞争中的低价策略让他们表示有些疑惑。的确,从X1300XT、X1650Pro到X1950XTX,它们的性价比都相当出众。但也有ATi的合作伙伴表示,低价策略虽然提供给用户非常好的产品,但对于企业运作来说利润空间极低,大家心情可想而知。
总结
可以明确的是,在R580+推出后,ATi的产品在性能上明显领先NVIDIA是不争的事实(除非按单位功耗计算性能),且这个性能优势非常明显。如果把X1950XTX作为一款市场上可以买得到的产品来看,它的性价比也极其突出。ATi与AMD的合并,80nm工艺的起用,NVIDIA G80的推出众多事件在一起又会迎来怎样的新格局呢?