【IT168 评测】于北京时间2013年2月19号晚上10点,NVIDIA正式发布了基于Kepler架构GK110核心的新旗舰级显卡——GeForce GTX Titan。我们都知道GK110核心早在去年的GTC 2012上就已经亮相过,当时强大的规格,惊人的浮点运算能力已经让人叹为观止,可惜当时这仅是针对于超级计算机的NVIDIA Tesla K20X加速卡。而本次GeForce GTX Titan的正式发布同样给我们带来不少惊喜。
▲DNA Of the World’s Fastest Supercomputer
为何被命名为“GTX Titan”? 位于美国田纳西州橡树岭的Titan超级计算机装备了18688颗NVIDIA Tesla K20X GPU,在LINPACK基准测试中创下了17.59Petaflops的性能纪录,轻松夺得了TOP500榜单上的全球最快超级计算机的头号排名。而“Titan”这名号也被应用到桌面级市场上——“DNA Of the World’s Fastest Supercomputer”,寓意了这是全球最快、具备全球最快超级计算机的DNA的显卡。
GeForce GTX Titan的规格是相当的猛,2688个CUDA Cores,浮点性能为单精度FP32 4.5TFlops、双精度FP64 1.3TFlops,晶体管总数更是达到了71亿个。笔者看来,GeForce GTX Titan真不是一块显卡了,应该是超级显卡才对。拥有这么一款显卡就可以打造一台全球最强的个人游戏PC,同时拥有的强大运算能力堪比小型服务器。
NVIDIA GTX Titan规格概述
没有GTX680(GK104)那样冲破1Ghz的核心频率,GTX Titan(GK110)十分注重每瓦性能比,核心频率被控制在827MHz,GPU Boost频率也仅为876MHz。但即便是这样,受CUDA数量以及晶体管数据的负面影响,TDP热设计功耗达到了250W,比GTX680的195W高不少。同时显卡需要配备6+8Pin的辅助供电才能满足供电需要。
显卡核心规格对比 | ||||
vga.it168.com | NVIDIA GeForce GTX Tittan | NVIDIA GeForce GTX690 | NVIDIA GeForce GTX680 | AMD Radeon HD7970 GE |
---|---|---|---|---|
核心代号 | GK110 | GK104*2 | GK104 | Tahiti |
制造工艺 | 28nm | 28nm | 28nm | 28nm |
晶体管数量 | 71亿 | 35亿*2 | 35亿 | 43.1亿 |
核心面积 | 约570mm² | 294mm² | 294mm² | 365mm² |
显卡核心架构对比 | ||||
DirectX 版本 | DirectX 11.1 | DirectX 11.1 | DirectX 11.1 | DirectX 11.1 |
流处理器数量 | 2688 CUDA | 1536 CUDA*2 | 1536 CUDA | 2048 SP |
纹理单元 | 224 | 128*2 | 128 | 128 |
ROP单元 | 48 | 32 | 32 | 32 |
核心频率 | 837Mhz | 915Mhz | 1006Mhz | 1000Mhz |
Boost频率 | 876Mhz | 1019Mhz | 1058Mhz | 1050MHz |
显存频率 | 6008Mhz | 6008Mhz | 6008Mhz | 6000Mhz |
显存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
显存容量 | 6144MB | 2048MB | 2048MB | 3072MB |
显存位宽 | 384Bit | 256Bit*2 | 256Bit | 384Bit |
显存带宽 | 288.4GB/s | 192.2GB/s*2 | 192.2GB/s | 280.0GB/s |
设计功耗 | 250W | 300W | 195W | 250W |
供电接口 | 6+86Pin | 8+8Pin | 6+6Pin | 6+6Pin |
输出接口 | DP HDMI 2*DVI | DP HDMI 2*DVI | DP HDMI 2*DVI | 2*mDP HDMI DVI |
零售报价 | 7999元 | 7999元 | 3299~3999元 | 3299~3999元 |
从规格上来看,GTX Titan是绝对的王者。借鉴到GK104核心GTX680的性能表现,GTX Titan显卡性能肯定要比GTX680/HD7970 GE高出一截。而且配备6144MB超大显存容量、384Bit显存位宽、以及6008MHz显存频率,即便是在高分辨率高画质,甚至是多屏输出情况下都有着较好的性能表现。
▲GTX Titan是唯一能玩爽CRYSIS 3 @5760*1080的显卡
问:GK110为什么使用384-bit位宽而非512-bit?
答:使用512-bit位宽也会导致功耗及其他代价升高,GK110使用384-bit位宽则可以在性能和代价中保持平衡。
GK110核心强大之处
为何GK110有这么多的晶体管数量呢?原因在于GK110比GK104拥有更多的CUDA核心数量、更多的显存控制器数量、ECC校验单元以及运算双精度单元;SMX单元也增加到了15组之多,每级SMX单元保持192个CUDA Cores的设计,也就是说GK110实际上是拥有2880个CUDA。
现在的GeForce GTX Titan与Tesla K20X都仅有2688个CUDA Cores,明显就是屏蔽了一组SMX单元192个CUDA Cores。而为了为满足带宽传输需求,GK110提供了六组GDDR5显存控制器,组成384Bit显存位宽,显存带宽提升至256GB/s。可以结合GK110核心示意图与看到,6组显存控制器摆在最外边,包围着SMX单元。
除此之外,GK110为了增加双精度计算能力,在每组SMX提供多达64个FMA双精度单元,对比GK104只有8个FMA双精度单元。同时GK110也是首款支持Hyper-Q、Dynamic Parallelism并行调度的GPU。相比GK104有了显著的改善,这也是NVIDIA将GK110计算定位3.5代的原因。
资料参考:NVIDIA GK110白皮书
新型GPU Boost 2.0 技术
在GK104核心上,NVIDIA首次引入了GPU Boost技术,称之为“GPU Boost 1.0”。通过此技术,显卡能够在TDP允许的范围内,根据GPU负荷、功耗、电压以及GPU温度等数据实现自动超频,尽可能地提高GPU运行频率,进而提升GPU工作效率。而现在GK110核心上采用的是改进型的“GPU Boost 2.0”,当然两者本质上区别不大,只是GPU Boost 2.0能带来更高的GPU Boost频率。
简单一句话:新型的GPU Boost 2.0可自动提升图形性能,支持解锁电压和高级控制功能,让玩家可以更大限度地控制游戏和自定义超频。
▲GPU Boost 2.0增加更好的图形性能:更高电压,更平滑的高频表现
▲GPU Boost 2.0提供更高的电压
NVIDIA GTX Titan公版产品介绍
▲NVIDIA GTX Titan公版,支持3+1屏1080P输出
NVIDIA GTX Titan公版拆解
虽然GK104走的是中型核心战略,但NVIDIA并没有忘记大核心制胜,GK110明显就是大核心。拥有71亿个晶体管数量,让其核心面积达到了约570mm²,而GK104仅为290mm²,GK110几乎是GK104一倍。
显存选用三星的2GBitt GDDR5显存颗粒,正反两面24颗64MB*32Bit规格颗粒组成了6144MB/384Bit显存规格。显存颗粒编号为:K4G20325FD,后缀为:FC03,理论工作频率为6000MHz。实际上些颗粒可以跑到6600MHz,超频空间还不少。而笔者发布,三星GDDR5 PDF里已经显示有4GBitt GDDR5显存颗粒,也就是说GTX Titan或者还可以做到12GB容量也不定,当然新颗粒价格高、产量低。
2相显存供电设计相当的简单,一个2相供电控制芯片与两组各一个R33贴片电感+安森美的SO-8FL封装的4901NF MOSFET。
而6相核心供电的主控则为安森美出品的NCP4206六相PWM控制芯片,此主控也用在GTX690优异显卡上。主控电气性能相当不错,只可惜安森美官方并没有给出详细规格,但可以从NCP4208中窥探一二。而主控仍像GTX680一样做在一块小PCB上,这样据说是方便NVIDIA以及厂商测试及采用不同方案的主控而为。
由于NCP4206主控并没有内置驱动IC,所以配备DrMOS也很正常。DrMOS采用的是飞兆出品的FDMF6823 DrMOS芯片,集成了驱动IC、高压MOS以及低压MOS。此款DrMOS规格也相当强大,最高能支持60A电流,而且超过93%的转换率。
显卡默认配备6+8Pin辅助供电,而PCB上则余留了多一个8Pin辅助供电接口位置,笔者相信此PCB可做成双8Pin辅助供电设计,但得需要修改散热方案了。
测试平台
测试平台信息 | |
硬件平台信息 | |
---|---|
CPU | Intel I5 2500k 40*100Mhz=4.0Ghz |
主板 | 华擎Z77 OC Formula |
内存 | G.SKILL TridentX DDR3 2400 8G By XMP |
硬盘 | Galaxy Laser GT 240GB |
显卡 | Geforce GTX Titan (837/6008Mhz) |
软件平台信息 | |
系统软件 | Windows 8 (X64_CHS) DirectX Redist Jun 2010 |
驱动程序 | NVIDIA_314.09_win8_winvista_win7_64bit_english NVIDIA_314.07_desktop_win8_win7_winvista_64bit_whql AMD_12-8__vista_win7_win8_64_dd_ccc_whql |
测试软件 | Futuremark 3DMark Futuremark 3DMark 11 Futuremark 3DMark Vantage Unigine Heaven 4.0《天堂 4.0》 Unigine Valley 1.0 《山谷 1.0》 Crysis Warhead《孤岛危机:弹头》 Crysis3《孤岛危机3》 FarCry2《孤岛惊魂2》 FarCry3《孤岛惊魂3》 METRO 2033《地铁2033》 Just Cause 2《正当防卫2》 Lost Plant 2《失落的星球2》 Aliens vs Predator《异形大战铁血战士》 Colin McRae DiRT 3《科林麦克雷:尘埃3 》 S.T.A.L.K.E.R:Call Of Pripya《潜行者:普里皮亚季的呼唤》 |
测试说明
测试项目方面,我们加入了不少近期推出的DX11测试软件,例如3DMARK、Heaven 4.0以及Valley 1.0。而游戏方面若游戏有自带或者第三方Benchamark软件则使用,若没有的则使用FRAPS监查帧数变化最平均值,务求尽量获得最准确的数据;由于测试对象为旗舰级显卡,我们直接采用1920*1200高分辨率进行性能测试,所以部分要求强度相对较低的游戏,开启4xAA或者8xAA全屏抗锯齿的方式进行测试。
关于FPS:
衡量一块显卡的性能我们通常都会用到FPS这个单位,帧数这个数字越大代表着显卡的每秒渲染能力越强,数值越高代表着用户在游戏中将获得体验效果越流畅。
通常一个游戏的FPS数值是通过测试数值求平均值获得,这样的测试通常可以展现真实游戏中场景与体验的一个预先录制片段。这个录制的片段将会被应用在每款测试的显卡上,测试的前提是每款显卡都采用相同的画质设置,这样才能保证获得客观真实的测试结果。
vga.it168.com | |
帧数与游戏流畅度的关系 | |
---|---|
< 30 FPS | 非常有限的流畅度 |
30-40 FPS | 平均值刚好达标的流畅度 |
40-60 FPS | 较好的流畅度 |
> 60 FPS | 非常好的的流畅度 |
*假如一款显卡在测试中平均帧数低于30FPS,那就意味着无法顺畅的玩该款游戏。
*达到大约30~40FPS左右,我们将可以较为流畅的运行游戏,当然也会有片刻停顿的状况。总的来说,还是能够获得较好的游戏享受。在这个分辨率下获得匹配的非常好的分辨率。
*当一款显卡的平均帧数可以达到或者超越60FPS,那就是说我们可以放心地享受游戏带来的快感,并且打开所有可以打开的画质设置。
*超越100FPS的显卡?或许这是一款怪兽级的显卡有或者是在一款相当老的游戏才会遇到的情况
NVIDIA GTX Titan VS NVIDIA GTX680
2688个CUDA Cores、71亿个晶体管以及384Bit显存位宽等因素造就了,在还未测试前就已经知道GTX Titan定必大幅胜出GTX680。而受到供电设计以及功耗控制的影响,GTX Titan单卡很难达到双核心GTX690的性能水平,但是比高频版的GTX680还要强36%,已经让人喜出望外。当然根据NVIDIA的说法,GTX Titan单卡是比不上双核GTX690,但是GTX Titan双卡SLI后性能会是超越GTX690双卡SLI,毕竟四核心组Quard SLI效率很难提升。
NVIDIA GTX Titan VS Radeon HD7970 GE
HD7970 GE是AMD继HD7970后推出的1Ghz核心频率HD7970,我们理解为1GHz高频的HD7970,普通HD7970刷写BIOS则可以升级到HD7970 GE。推出之时就是为了打击GTX680气势而来的,而现在来看,在GTX Titan此等怪兽显卡面对,HD7970 GE也花容失色了。
NVIDIA GTX Titan温度测试
▲NVIDIA GTX Titan待机温度为33度,满载温度为81度
NVIDIA GTX Titan温度表现相当不错了,71亿个晶体管满载温度为81度,待机更仅为33度。显卡满载频率为810/6008MHz,电压0.987V,满载风扇转速为58%。噪音主观评定,稍微有点噪,但比GTX680当时好多了。
NVIDIA GTX Titan功耗测试
Seasonic的Powerangel功率测试仪器
在功耗的对比方面,我们选择了Seasonic的Powerangel功率测试仪器进行平台的功耗对比(不包含光驱、显示器及其他周边配件和外设)即机箱内设备功耗。测试主要划分为闲置、游戏与满载三个项目,其中闲置主要是针对进入系统后闲置的状态下,而满载则针对的是FURMARK进行渲染平均功耗读数测试进行。测试在都关闭主板板载的CPU节能功能的环境下进行。
功耗控制方面,而三卡其中最出色的仍是性能优异的GTX Titan显卡。待机功耗情况下,GTX Titan与HD7970 GE待机功耗控制很好,而GTX680则是非公版原因,待机功耗较高。而GTX Titan满载功耗低的原因在于,GPU 99%负载,核心频率降到810MHz,电压也降到0.987V,所以功耗自然走低了。而综合来看,拥有1GHz高频的HD7970 GE功耗表现并不理想,游戏负载就已经达到346W了。
NVIDIA GTX Titan超频测试
▲频率996/6008MHz,Boost频率1137MHz,3DMARK得分8950,比默认频率提升5.9%性能
相比GTX680以及HD7970 GE来说,GTX Titan的超频不能说很好,毕竟带着71亿个晶体管的身体跑起来是比较辛苦的,电压、温度、TDP在超频后都相对难控制,所以GTX Titan 5.9%的性能提升算中等。
总结:GTX Titan问鼎单核GPU性能宝座
关于性能测试:
拥有如此强大规格的GTX Titan显卡没有让我们失望,性能出众。首先自家上代旗舰产品对比,CUDA流处理器数据与384Bit显存位宽有着压倒性的优势,不说GTX Titan运算能力有多强了,仅是游戏性能就已经领先GTX680约36%。
而对于HD7970 GE来说,NVIDIA有意让GTX Titan抢夺性能王宝座,而HD7970 GE几本没有还手之力,最后只有落败。
关于价格:
目前NVDIIA官方GTX Titan报价为7999元,与双核心旗舰GTX690价格相当。7999元的定价其实也相当合适,除了出色的游戏性能外;GTX Titan即GK110核心显卡另一个最大优势是通用运算能力,浮点性能为单精度FP32 4.5TFlops、双精度FP64 1.3TFlops,这样强大的运算能力已经堪比小型服务器了。
关于温度和功耗:
温度与功耗,在新型的GPU Boost 2.0 技术加持下,GTX Titan的温度与功耗控制都相对较好。由于温度与功耗在GPU Boost 2.0技术下关系更紧,所以GTX Titan显卡的满载功耗都要比GTX680与HD7970 GE好得多:99%负载,核心频率降到810MHz,电压也降到0.987V,所以功耗自然走低了。
关于购买:
而关于购买,似乎国内的AIC厂商已经准备好了。实体卖场,淘宝、京东等电商平台都早就铺货完成,只等NAD一过就爆发式推广。例如:七彩虹在京东今晚就做首发,还送8G内存。但是这么贵的价到底有多少人买,是谁买了,真不知道。