【IT168 技术】现在的Benchmark性能评测软件可以说是琳琅满目,作为计算机基准性能的裁判员,PC的各种性能都可以通过Benchmark软件进行衡量。在3D显示性能的测试中,我们通常使用的是Futuremark公司的3Dmark系列,从06到Vantage都很受欢迎,但最新的3Dmark11却有不少人质疑。
平日里玩家们乐忠于PK分数,炫耀排名,但论坛上也常爆出一些对3Dmark11的牢骚。玩家有疑惑,尤其是测试入门显卡的时候,3Dmark11 E模式仅能跑几帧,但实际游戏却可以流畅运行。3Dmark11能否正确衡量显卡性能?可能还需要仔细讨论下。

▲曾经3Dmark是显卡性能标杆
3DMark最近特别是3DMark11发布以来,一直有一些人对它提出疑议,这里只是把网友的一些问题做了一个梳理:

▲一些网友的困扰
问题1:3D MARK11只是用来测试AMD显卡的,而用其进行测试NVIDIA显卡结果是没有意义的。
问题2:测试DX11应该用Unigine Heaven 2.1,或者Microsoft DX11 SDK,或者stone giant,或者DX11游戏。
问题3:Performance测试的分辨率只有1280x720,Entry模式更是1024x600分辨率,有谁在这种情况下玩游戏?
一款优秀的权威的评测软件,应该能够经受住用户和时间的考验。为什么网友会对3DMark11有质疑,这些网友的问题有没有根据?我们来具体分析一下。
Benchmark失之偏颇
下面我们来看下网友的第二个疑惑。有些人说3D MARK11只是用来测试AMD显卡的,用其测试NVIDIA显卡没有意义。这个网友的结论是不是正确先不去评论,我们来分析下为什么会有这样的质疑,其实这就像之前的3DMark Vantage采用了NVIDIA的PhysX物理测试引擎一样,被业界质疑可能存在偏颇。本次3DMark 11采用了Bullet开源物理C++库作为基本物理引擎。本来是一件令人兴奋的事情,但是从现在反馈的结果来看,关闭已有的PhysX显然有些不妥。
Bullet物理引擎,是一款跨平台的开源物理引擎。根据游戏开发者杂志的统计,目前全球游戏开发者当中,使用NVIDIA PhysX引擎的占 26.8%,Intel Havok引擎占22.7%,而第三名就是占10.3%的Bullet。不过遗憾的是目前支持Bullet物理加速的知名游戏比较少。

▲目前有的物理加速器
目前Bullet Physics主要依赖CPU去进行物理计算,随CPU频率的降低或核心数量和线程的减少,物理子项的得分将会大幅下滑;至于综合测试项目,双核以上的CPU均不会对性能造成太大波动,不过单核心处理器明显已成为了严重的瓶颈。

▲目前Bullet的加速模式
在现有情况下,要想达到公平测试就应该充分利用显卡的各种功能,比如NVIDIA显卡既然有PhysX加速,就不应该将其屏蔽,而AMD有Bullet或者Havok那么就开启它。不要浪费显卡厂商给我的附加性能,不要刻意去屏蔽某些可以给我们带来性能体验的显卡特性。

▲Bullet取代了physX
PhysX目前是封闭的物理加速器,FurtureMark屏蔽掉了PhysX也是考虑到这点。相信还是有更多网友希望有一天3Dmark中能同时支持三种加速模式,最终看到PhysX 、Havok、Bullet互拼的局面,而不是为了求平衡而关掉其中一个。
游戏性能谁能定
在看第一个网友的疑问前,我们有必要先来了解一下什么是DX11,DirectX11 API究竟有哪些新的功能可以引用。
2009年10月22日,微软公司正式发布Windows 7,DirectX 11集成在Windows 7 中同步登场,但其实DirectX 11只是DirectX 10的大幅度加强版,而不是9.0C和10.0/10.1的彻底革新。DirectX 11带来了Tessellation(拆嵌式细分曲面技术)、Multi-Threading(多线程)、DirectCompute(通用计算)、Shader Model 5.0(渲染引擎5.0)以及Texture Compression(纹理压缩)五个重要特性。
下面我们来看下,3DMARK11进行的测试项目。

▲3DMARK 11的测试场景
从上面官方的场景预设中我们就可以看到了,整个测试过程分为6大部分,分别是场景1、2“深海”的光照测试和中等Tessellation曲面细分。场景3、4的阴影和复杂Tessellation。从测试表上看针对游戏的也就这四个场景,而且仅仅只针对了Tessellation和Light Shader进行了测试。没有体现出DirectX11.0其它几个特性,而物理测试又仅仅针对CPU,这也是为什么很多人觉得3DMark11不是在测DirectX11.0的原因。通过该软件可以得到一个分数的排行,但对于实际游戏而言参考意义不大。

▲3D Mark11测试不稳
在对12块显卡进行评测后发现,3D Mark11在Entry、Performance、Extreme三种模式下,取得的分数排名并不统一,也就是说随着测试压力的变化,显卡性能排行会变得不稳定。正如上图标注的一样,显卡性能忽高忽低。
产生这种波动的原因根本在于测试项目的相对独立,根据FutureMark给出的计算公式可以看到,图形、物理、综合,三项分数(S)取倒数后,再填入相应的权重(W),计算出来,物理项目占得比重有些大。这就使得在未接近显卡性能极限的时候,任何单项优势都可能引起排行变动。

▲最终分数算法

▲权重
然而在入门级,或者主流级平台中,系统性能往往存在瓶颈,尤其是入门级游戏平台的CPU部分,在有物理碰撞和刚体模拟的场景中会有一些劣势。
所以从上面的一些分析中我们能看到,3Dmark11测试项目在安排和内容设计上还有改进的空间,目前3DMark11测试成绩还存在偏差,要想把成绩与实际游戏体验联系在一起还有很长的路要走。如何评断和预测系统的瓶颈,并且调整权重是未来评测软件需要考虑的。
非主流测试伤不起
说道分辨率,那就不得不谈下它和显存容量之间的关系,大家都直到在玩游戏的时候,我们的画面是需要在后台进行缓冲的,分辨率高则需要预渲染并缓冲到显存里的数据也就越多,占用的显存容量就越高。随着显示器分辨率的提高,当今显卡的显存容量也有着翻倍的势头,市面上1GB、2GB显存已经屡见不鲜,更有甚者推出3GB大肚显卡!

▲市面上 已经可以见到3GB显存的显卡
在使用3DMark11做测试的过程中,有很多朋友一直在质疑E模式和P模式分辨率太低,不适合当今主流的游戏设置。我们也对这几种分辨率进行了内存占用率和内存容量影响的实验。如下图:

▲三种模式内存占用率
经测试在Entry模式1024x600这种分辨率下,系统显存的占用量是非常小的,经过我们的测试E模式下显存占用不会超过350MB,大约为334MB左右。P模式显存占用量为383MB,EXTRME模式673MB。也就是说目前1GB、2GB大显存显卡完全没有发挥出它们的优势。

▲显存优势无法体现
分辨率和显卡的像素填充率是挂钩的,从测试成绩可以看出,过低的分辨率可以极大的释放显卡压力,使显存容量和带宽的影响变得模糊。
目前市面上销售的显示器大都以19寸以上为主了,1080P显示器价千元也能拿下。所以在测桌面平台游戏的时候,1680x1050和1920x1080分辨率才有参考性。
高分就给力?
为验证疑虑,我们选了两款主流显卡来做对比:HD6850和GTS450。它们是AMD和NVIDIA双方目前出货量较大的中端卡。测试平台如下:
测试平台信息 | |
硬件平台信息 | |
CPU | Intel Core i5 I5-750 @ 2.66GHz |
主板 | Gigabyte P55A-UD3R |
内存 | Apacer DDR3 1600 2GB×2 |
硬盘 | Seagate ST3320620AS 320GB SATA Rev 2.5 Interface |
软件平台信息 | |
系统软件 | Windows 7(X86_CHS) DirectX Redist Jun 2010 |
驱动程序 | NVIDIA 260.99_desktop_win7_winvista_32bit_whql AMD Catalyst_10.12_CCC2_Preview_Win7_Dec7 |
显卡分别为RadeonHD6850 1GB 775/4000MHz和Geforce GTS450 1GB675/1350/360MHz,它们在市场上的价格也相近。我们先来看双方的3Dmark11成绩。

| 3Dmark 11 | ||
| vga.it168.com | Geforce GTS450 1GB | RadeonHD6850 1GB 775/4000MHz |
|---|---|---|
| Performance | 3067 | 3300 |
从3Dmark 11测试成绩来看,HD6850的分数相比GTS450高了233分,那么在后面的游戏测试会有什么变化呢?
实际游戏全说不
在3D Mark11测试中HD6850领先不少,实际游戏应该继续领先才是。这里选了4款主流的DirectX11游戏,我们来看看实际的游戏运行流畅度。

▲鹰击长空2 游戏实测

▲巨石人 游戏实测

▲失落星球2 游戏实测

▲天堂2 游戏实测
可以看到,四张图表中绿色的线全都高于红色的线,也就是说GTS450的实际游戏成绩较HD6580更胜一筹。这是为什么?其实很简单,相对于3Dmark11的测试,真实游戏是对于显卡综合性能的客观考量,避免了某种单项成绩不足,导致的性能偏差,所以成绩排序更稳定。
总结:求Benchmark更给力
看了前面几页的测试,您可能对Benchmark有些失望,那么对于入门级的DX11显卡,我们更应该如何去客观的评测它们的性能呢,难道还要用各种挑剔的DirectX11特性Benchmark软件进行压榨级的测试,而后报一个可怜的结果么?
显然我们不需要这样去做了,因为与其这样还不如直接拿游戏实打实的比拼,拿各种增值应用进行全方位的PK。因为作为一款400元左右的入门独立显卡来讲,实用性是第一的,而不是在于那些华丽的DirectX11全特效和Benchmark的评分。
下面推给大家推荐一些可以进行评测的游戏DirectX游戏,以便帮您准确快速的选出适合的独立显卡。
孤岛危机2 | 北美:2011年3月22日 欧洲:2011年3月25日 (v1.9更新入加支持):2011年6月27日 | 单人游戏部分制作:Crytek Frankfurt 多人游戏部分制作:Crytek UK | 第一人称射击 | CryEngine 3改良版 |
尘埃3 | 欧美:2011年5月24日 | Codemasters | 竞速 | EGO Engine (v2.0) |
失落的星球2 | 北美:2010年10月12日 欧洲:2010年10月15日 | Capcom | 第三人称射击 | MT Framework 2.0 |
爱丽丝:疯狂回归 | 2011年06月14日 | Spicy Horse | 动作冒险 | Unreal Engine 3 |
极度恐慌3 | 北美:2011年6月21日 英国:2011年6月24日 | Day 1 Studios Monolith Productions | 第一人称射击 | Heavily modified Despair Engine |
上述几款游戏都是比较新的DirectX11游戏,如果您购买的是入门级独立显卡,我们建议您在评测的时候选几款常规游戏。比如说《使命召唤7》《鹰击长空》《星际2》这样的经典游戏,您会发现即使是一款3Dmark11跑分不太高的入门显卡,也能流畅运行这些游戏。