【IT168评测中心】2002年底,微软发布DirectX9.0(后简写为DX9和DX),它为PC的3D应用提供了可追赶“电影般画质”的优秀平台,而ATi与NVIDIA的较量也从DX8.1转移到了DX9的新平台下、,R300与NV30时代的竞争更是因为对DX9理解方向的不同而打的不可开交。四年后,随着2006年底微软新一代操作系统Windows Vista的到来,全新的D3D API DX10也将问世。NVIDIA这次领先于ATi在第一时刻推出G80 GPU。而基于这颗强大的GPU的头批产品有两款:GeForce 8800GTX和GeForce 8800GTS。
谁也不会否认,ATi Radeon X1950XTX CF的推出让NVIDIA性能上的优势几乎丧失,而Quad SLi的效能不佳更成为对手攻击的主要目标之一。此时,NVIDIA赋予G80双重任务,第一,展示NVIDIA基于DX10设计的GPU成果,在业界最先发布DX10 GPU;第二,击败Radeon X1950XTX,夺回性能头名称号。为了实现性能和画质全方位的提升,NVIDIA G80的架构有了较大的改进,我们先来看看G80核心的规格和技术要点。
从外观看,GeForce8800GTX显卡尺寸相当恐怖,达到了280mmX127mmX42mm的尺寸,工程样卡的重量也达到了750g以上。即便与散热器已经很夸张的7900GTX相比,8800GTX仍显得相当雄壮。而G71核心的2.8亿个晶体管数量也在G80核心上陡增至6.8亿个,核心的面积也因此增大许多。
NVIDIA 公板G8800GTX显卡 |
G8800GTX显卡背面 |
拆下巨大的散热装置 |
近观散热器 |
G80核心 |
曾被推测为物理引擎处理芯片 |
在显卡靠近输出端,有一颗FCBGA封装的芯片,大家曾推测如此尺寸的一颗芯片不应是VIVO或者HDCP芯片,而是G80中Quantum Effect物理引擎芯片。目前最新消息认为,这颗芯片的功用为RAMDAC芯片+视频输出。以往RAMDAC都集成在显示核心内,这次由于特别设计所以独立出来;另外,视频部分它将负责G80的10bit 2D输出。
显存颗粒 |
GF8800GTX、7950GX2、7900GTX、7900GT对比 |
从显存规格看,G8800GTX使用1ns GDDR3颗粒,工作频率900MHz,数据传输率等效1800MHz。而更重要的是G80核心具有两个内存控制器,在8800GTX显卡上,其中一个256bit控制器控制512MB显存,而另一个128bit的控制器则控制另外256MB的显存,这样G80核心也达到了384bit的显存位宽。而ATi的DX10 GPU R600很有可能具有512bit显存位宽的规格。如果说在参数规格相关的数字上,我们可以明显感觉到G80的变化,那么给G80的性能带来实在保证的来自于它的统一渲染架构(Unified Shader Architecture)。
GeForce 8800GTX具有128个着色器,着色器的工作频率为1.35GHz。而相对前一代GeForce7900GTX,它的像素着色器的工作频率为700MHz。G80中的128个着色器(Stream Processor)将被动态分配给像素、顶点、几何、物理等引擎使用,从而大大提高效率。虽然在DX9情况下,我们还无法看到几何引擎和物理引擎是如何享用这套统一渲染架构的。但我们从以下示意图可以清楚,在像素渲染和顶点渲染发生冲突时,G80的架构会带来怎样的好处。
G80统一渲染架构 |
非统一渲染架构下,像素和顶点渲染分配不均下的低效表现 |
统一渲染架构着色器的工作效率表现 |
在DX10到来前即DX9应用末期,对于3D应用中画质提升主要集中在HDR、高倍的抗锯齿两方面,除此之外,还包括物理引擎的应用。由于DX9的规范限制,要同时实现HDR和FSAA(FSMSAA)需要厂商另辟蹊径。ATi设置了特别的缓冲来做抗锯齿的渲染后再用于HDR,从而实现了HDR和AA同时实现,而HDR+AA一直是NVIDIA的软肋,旗下NV4x到G7X都没有实现这个功能。G80这次终于翻身,可支持128-bit的HDR和16X AA。
而在DX10中,Shader Model的版本也从3.0更新至4.0。其中加入的Geometr Shader(几何着色器)极大的提高系统的整体性能,从而保证过去应用中的一些细节得以更加真实的体现,例如阴影、毛发、烟雾、爆炸,这些效果在DX10中会交给GPU处理,而减轻CPU负担。(更多G80技术,请查看专题文章《牵动3D世界的革命 G80详细深入剖析》)。
在测试平台选择上,我们有X6800和QX6700两款CPU可选,尤其是四核心的诱惑绝对要高于双核的X6800。但在我们CPU测试中发现,即便对多线程(准确说是双线程)有着很好优化的Quake4也无法起用另外两个核心,根据测试项目观察,在很多项目中,第二颗核心都极有可能闲置,所以我们选择频率更高的X6800。
显卡的长度已经超过了主板的宽度 |
硬件平台 | |
CPU |
Intel X6800 2.93GHz |
主板 |
Intel X975 XBX |
内存 |
Corsair DDR2 1066 512MBX2 |
硬盘 | WD 4000KD |
显示器 | Dell 3007WFP |
电源 | Delta DPS-600MBJ |
功耗测试 |
UNI-T UT71E智能数字万用表 |
显卡 |
NVIDIA GeForce8800GTX(575MHz/1800MHz) |
ATi Radeon X1950XTX CrossFire(650MHz/2000MHz) | |
NVIDIA GeForce7950GTX(650MHz/1600MHz) | |
NVIDIA GeForce7950GX2(570MHz/1400MHz) | |
NVIDIA GeForce7950GT(570MHz/1400MHz) | |
软件环境 | |
操作系统 |
英文Windows XP SP2 |
驱动程序 |
Intel Chipset Software Installation Utility 7.2.2.1001 |
ATi 催化剂6.9 For R580+ | |
NVIDIA Foreceware96.89Beta | |
测试项目 | |
D3D理论测试 |
3DMark05 Build 1.2.0 |
3DMark06 Build 1.0.2 | |
游戏测试 |
Quake4 1.05(SMP Enable) |
F.E.A.R | |
Age of Empire3 自录Demo | |
Farcry 1.4 |
ATi |
NVIDIA | |||||
产品型号 |
Radeon |
Radeon X1950XTX |
GeForce 8800GTX |
GeForce 7950GX2 |
GeForce 7900GTX |
GeForce 7950GT |
核心代号 |
R580+ |
R580+ | G80 | G71×2 | G71 | G71 |
工艺制成 | 90nm | 90nm | 80nm | 90nm | 90nm | 90nm |
核心频率 |
650MHz |
650MHz | 575MHz | 500MHz | 650MHz | 550MHz |
显存频率 |
2000MHz |
2000MHz | 1800MHz | 1200MHz | 1400MHz | 1400MHz |
显存容量 | 512MB×2 | 512MB | 512MB+256MB | 512MB×2 | 512MB | 256MB |
显存类型 |
GDDR4 |
GDDR4 | GDDR3 | GDDR3 | GDDR3 | GDDR3 |
显存位宽 |
256bit×2 |
256bit | 256bit+128bit | 256bit×2 | 256bit | 256bit |
像素渲染管线 |
16×2 |
16 | 统一渲染架构,128个着色器 | 24×2 | 24 | 24 |
像素着色器 | 48×2 | 48 | 24×2 | 24 | 24 | |
顶点处理器 |
8×2 |
8 | 8×2 | 8 | 8 |
在测试中,GF8800GTX需要挑战的显卡大多是旧时曾经的王者,这甚至包括由ATi Radeon X1950XTX Crossfire系统。而GeForce7900GTX则是NVIDIA上一代最强大的单GPU显卡,GeForce7950GX2是NVIDIA上一代最强大的显卡。
在Quake4的测试中,GF8800GTX终于以一人之力战胜了两块X1950XTX,在OpenGL上NVIDIA的领先在此时又发挥了作用。而NVIDIA在AA AF性能上仍抵不过ATi。最重要的是,与X1950XTX单卡相比,GF8800GTX在打开AAAF后下降的比例也要更大,这让我们再次为NVIDIA担心。
Farcry 1920分辨率下的成绩大家都很接近,这说明在此负荷下CPU构成了瓶颈,这点我们在X1950XTX测试时已经谈到。不过有趣的是,在2560分辨率下,GF8800GTX的成绩也不比7950GX2高出多少,但1950XTX CF的成绩却领先于GF8800GTX。
|
我们将游戏中的设置调至最大,这包括了游戏中的抗锯齿选项,因此我们看到帝国时代的测试成绩则没有前面测试理想。不过我们可以说帝国时代3代表了新一代游戏对系统苛刻的要求的水准,在如此平台下也只有40-60fps左右的速度,的确让人有点望而却步。
F.E.A.R中,最高细节选项包括了4X的AA和16X的AF,在平均帧数一项A卡和N卡的差距情况基本与帝国时代3中一致。而在这里GF8800GTX成绩也稍落后于7950GX2。
简单综合以上测试成绩可以发现,当没有打开4XAA和8XAF的情况下,GeForce 8800GTX几乎可以达到90% X1950XTX CF的成绩,同时也是GeForce7900GTX成绩的2倍左右。在打开AAAF情况下,GeForce8800GTX是X1950XTX CF成绩的75%左右(我们可以大概算出平台除显卡外的功率为满负荷时117W)。这样,GF8800GTX满负荷功率大概157W、X1950XTX满负荷单卡功率大概129W,GeForce7900GTX满负荷功耗大概73W。GF8800GTX功率高出X1950XTX 20%,性能高出1950XTX40-50%左右。而相对NVIDIA自身而言,虽然8800GTX高出7900GTX一倍以上,但功耗付出也超过了一倍。
总结
通过本次测试,我们看到G80足够强大,看到GeForce8800GTX几乎超越上一代旗舰一倍性能的精彩表现,也看到了GF8800GTX面对CrossFire X1950XTX时勇猛的表现。新一代的旗舰产品能够超越前一代产品80-100%可以说令人非常满意。而在打开AA和AF后,无论是7950GX2还是X1950XTX CF,都体现出双卡互联后等效512bit显存带宽带来的优势。不过,在AA技术上,NVIDIA G80有另外的思路,NVIDIA提出了CSAA的概念,可以在16X CSAA下,性能接近普通的4X MSAA,而画质明显好于4XMSAA,且与普通的16X MSAA接近,这项测试我们将会在后面的文章中提到。
可我们在技术中谈到的G80大多数特性可以说在本次测试中罕有体现,无论是基于DX10的几何渲染引擎,还是G80的物理引擎,这些应用都没有得到体现,都需要在今后DX10应用中进一步得到展示。而GeForce8800GTX上,神秘的双SLi桥接器插口更是让我们对G80 SLi充满期待。
两个SLi桥接插口,难道可以N个显卡SLi? |
对于读者和G8X系列GPU今后的用户而言,NVIDIA率先发布基于DX10设计的G80产品,让我们通过它认识了DirectX10的强大;而对于3D应用,3D游戏开发商而言,G80无疑也会成为它们首选和惟一的开发平台。在全新API支持下,NVIDIA取得领先从而换来的优势是不可估量的。想当年,ATi的R300也正是由于相对NV30比DX9有更好的支持,而在很长一段时间里领先于NVIDIA。
当然,DX10还没有发布、DX10的应用仅仅刚刚开始,我们相信在今后DX10平台上,ATi与NVIDIA的较量要比今天G80战胜R580+更有意义。