4月伊始,酝酿已久的NVIDIA与ATI新一轮GPU对话终于选在今天展开,根据两家计划的国际时间NVIDIA GeForce GTX275的发布时间要比ATI Radeon HD4890发布时间晚10多个小时,因此我们在4月3日早晨看到了这次GeForce GTX275与Radeon HD4890的首次对话。
(点此查看大图)
由于2009年后,原定位于250美元左右的老产品GeForce GTX260+和Radeon HD4870不断降价,导致这块市场产品出现空隙。虽然大家都怀疑如此的降价是否还有利可图,虽然原本这个定位的产品更应追求利润而不是销量,但在不景气的市场大环境下NVIDIA和ATI都没有乖乖的“不折腾”,而是采用了“逆向思维”大折腾。这正是新品发布不断,“救市”各有不同。
今天的主角是相对于Radeon HD4890晚些发布的GeForce GTX275,GeForce GTX275占据NVIDIA亚优异位置,与单GPU的优异产品GTX285相比,如何确定规格NVIDIA似乎有很多选择。我们在前不久的文章XXXX中,曾经预测了GTX275的规格(有兴趣的读者可以访问3月19日的推测文章《全球抢先窥探GTX275性能》)。
(点此查看大图)
回头再看看我们的预测,我们差一点就100%成功,在此不得不佩服NVIDIA的魄力。我们当时预测的两个方案,其一是GTX295 单卡单GPU时状态,其二是GTX 260+提高频率,而今天最终GTX275是什么状态呢?它是我们预测的两个方案的结合:GTX295单卡的核心与显存架构规格并且提高频率。
从表格中,很容看出目前NVIDIA显卡规格的差别。GeForce GTX275具有和优异GPU一样的240个流处理器,在显存规格上与GTX285有所不同。
同为240个流处理器的GTX275/295单GPU和GTX285,可以分别搭配896MB/448bit的显存和1GB/512bit的显存,这种微调似乎一年前只有在Quadro中能够见到,例如G92核心的Quadro VX200 具有96个流处理器却搭配256MB/256bit显存。GT200核心流处理器与对应的显存控制器的搭配更为灵活,不像G92/G94时较多采用的成比例增减。
而回顾一天前大家刚刚看过的HD4890和相关产品对比,它仅仅是HD4870的超频版本。核心频率来到了850MHz,GDD5的规格也达到了恐怖的975MHz(等效3900MHz),关于RV790增加流处理器至960个的传言最终没有上演。但无论怎么看,ATI推出一个普通的超频版产品“折腾”的味道似乎更浓于GTX275的推出。
言归正传,不论之前有多少的猜测,HD4890率先最终定价至250美元(大陆市场1699元)而NVIDIA GTX275美元定价也确定为245美元,如果不出意外两者价格将保持同一水平。但令ATI难受的其实并不止与HD4890一同发售的GTX275,而是价格已低于200美元的GTX260+。要是考虑到品牌价值,ATI的优异单GPU产品HD4890还不得不面对NVIDIA优异单GPU GTX285的挑战。这也是我们今天要测试的主要方向。
和以前NVIDIA高端显卡操作思路不同,这次GTX 275发布并没有推出公版,而是全部交给厂商自行发挥——全部基于非公版。这无疑阻碍了部分没有研发能力品牌,但却给拥有研发实力的品牌提供了更大的施展空间。向来以非公版、偏重玩家口味著称的影驰,这次在GTX 275上颇费心思,推出了全球优异采用数字供电的GTX 275,而且整合了很多很元素进去,致力打造一款真正骨灰级的高端显卡。
影驰GTX275骨灰黑将版(点此查看大图)
数字供电和常见的模拟供电不同,前者采用了数字PWM,体积更小的整合了数字MOSFET和DRIVER的芯片,以及体积更小的数字排感,搭配多个MLCC;而模拟供电采用传统的PWM芯片,每相搭配2-4个体积比较大的MOSFET,每相搭配一个独立的电感,而且会搭配容量比较大的电容。所以从外观上,我们很容易分辨数字供电和模拟供电。影驰这款显卡采用了数字PWM VT1165MF,体积非常小、整合MOSFET和DRIVER的CSP封装VOLTERRA公司的VT1195SF MULTIPHASE电源芯片,以及CPL-4-50数字排感和MLCC,显然这是典型的数字供电。不过数字供电的意义不仅仅在于“体积”,更在于性能。
GTX 275骨灰黑将采用的PWM VT1165MF组成的数字供电(点此查看大图)
GTX 275骨灰黑将采用的PWM VT1165MF组成的数字供电,转换效率远高于模拟供电普遍保持的70-80%,而达到了90%左右;数字供电更为精确,输出GPU电压峰值幅度仅140mV,而模拟供电GPU电压峰值幅度却有300mV;模拟供电每相通常极限为30A,数字供电每相极限可达40A;数字供电CSP封装MOSFET工作温度上限为200度,而模拟供电采用的MOSFET工作温度上限为100度左右;数字供电MOSFET工作频率达800KHz,模拟供电常采用的MOSFET工作频率仅300KHz;数字供电排感工作频达1MHz,模拟供电常采用的电感工作频率仅300KHz;数字供电采用排感内阻要小于模拟供电常采用的电感。这样一来,数字供电适合对供电要求更高的场合,也更适合糟糕的工作环境。目前,采用数字供电GTX 275只有影驰骨灰黑将。
骨灰级散热 AC XTREME(点此查看大图)
骨灰级散热 AC XTREME(点此查看大图)
8我们都知道GTX 285是个发热大户,基于相同数量流处理器的GTX 275发热自然也要非常重视。影驰为GTX 275搭配了由三个大叶片低转速风扇,五根热管组成,且可智能变速的散热器。它不仅仅噪音小,而且可以把GTX 275核心稳定控制在非常低的水准——甚至只有50多度。
优异0.8ns显存(点此查看大图)
尽管NVIDIA规定的GTX 275的显存频率并没有GTX 285那么高,但以非公版、超频著称的影驰依旧为显卡搭配了可以稳定工作到更高频率的0.8ns显存,甚至可以达到3GHz以上,堪称强悍。
NVIDIA全球头号合作伙伴讯景也第一时间为我们提供了非公版的GeforceGTX275,因为GeforceGTX275与GeforceGTX260+可共用同样的PCB和散热器,所以讯景这款GeforceGTX275在总体上与我们报道过的GTX260+黑金版(可参看:《怒视ATI旗舰!N阵营最强GTX260+挑战4890》)是一模一样,而这款GeforceGTX275命名为GTX275黑甲版,是一款官方标准633/1404/2268MHz频率的版本。
XFX讯景GTX275黑甲版(点此查看大图)
XFX讯景GTX275黑甲版(点此查看大图)
XFX讯景GTX275黑甲版(点此查看大图)
GTX275+黑甲版采用了讯景自家设计的全封罩式黑甲散热器,由Coolermaster代为生产。黑甲散热器同样保留了讯景特有的PWM监控技术,驱动可通过PWM监控技术根据温度,自行监测和控制风扇的转速,当温度过低,风扇相应转速变低,这样在节能和降噪效果;当温度过高,PWM监控技术会自行调整风扇的转速,让风扇更有效率的发挥作用。
“高科技”金属固条已成过去,取而代之的是黑甲外形(点此查看大图)
(点此查看大图)
(点此查看大图)
显存(点此查看大图)
GeforceGTX275显存默认频率比GeforceGTX260+的2000MHz高出不少,达到了2268MHz,所以必须采用0.8ns的GDDR3显存才能满足。讯景GTX275黑甲版采用了口碑较好的三星显存,正面14颗16Mx32Bit颗粒组成了896M/448Bit的显存规格。
NVIDIA的新锐AIC索泰拿出了本次首测的第一款零售版GeforceGTX275,外观整体上与旧版GeforceGTX260十分相象,这主要是因为采用了黑色PCB+公版散热器所致,其实这款是GeforceGTX275是一款索泰自行研发的非公版产品,运行频率为接近官方标准的633/1404/2268MHz。
(点此查看大图)
(点此查看大图)
公版散热器的优秀设计可照顾到PCB上每一个发热量较大的元件。(点此查看大图)
既豪华又工整的5+1相核心/显存供电配置(点此查看大图)
附加价值包括了正版的3Dmar Vantage和超级房车赛
AMD即将上市4890的消息,稍稍打乱了nVIDIA的布局,使得原本已准备好上市的GTX275(公版)胎死腹中。然而nVIDIA马上转换思路,取而代之的将是非公版GTX275--近日nVIDIA宣布将由各合作伙伴直接推出各自特色的产品(即非公版)。然而在这个消息发布几个小时以后,全球高端显卡品牌耕昇(GAINWARD)即宣布了其GTX275孙策版上市的消息。
经过我们对耕昇GTX275孙策版的研究分析发现,该卡之所以能以如此快的速度首发上市,原来使用的竟是其自家GTX285曹操版的PCB!要说GTX275规格与GTX260+更为接近,故该卡应该使用自家GTX260+司马版的PCB才对,而GTX275孙策版使用了更高端的GTX285 PCB。
首先我们来看一下该卡的相关参数,耕昇GTX275孙策版使用nVIDIA最新55nm工艺GT200核心,配备完整240个Streaming Processor统一处理单元,这也是目前nVIDIA显卡最强的GPU配备,高于GTX260+的216个(一开始大家预计GTX275也会只配备216个流处理器)达到与GTX285相同规格。显存使用DDR3颗粒,规格为896MB/448bit,与GTX260+规格相同。默认核心/流处理器/显存频率为633/1404/2322MHz,与公版相同。
前面说了,耕昇GTX275孙策版使用了GTX285曹操版的PCB,所以其做工用料也更接近GTX285曹操版的水平!宽大的PCB保证即使是较多的元件排布起来也不至过于密集,供电部分为核心/显存分离式结构,4+1相供电设计,全部使用封闭式陶瓷电感,电磁屏蔽性更好。整卡全固态电容设计,均为日系名厂三洋出品,有效保证显卡长时间工作的稳定运行。散热器配备豪华,大口径双风扇设计,铜质底座迅速吸收核心产生热量,并传递至密集的铝制片,此外显存和MOS管上也分别覆盖了散热片,将热量带走。风扇支持PWM模式,可以根据核心温度调整风扇转速,自行取舍散热与静音效果。
耕昇的这款GTX275孙策版搭配的显存为Samsung K4J52324QH-HJ08颗粒,14颗16Mx32Bit显存组成896MB/448bit规格,显存频率设定为2322MHz。
算上之前耕昇发布的GTX260+司马版、GTX260+ 1792MB特别版、GTX285曹操版、GTX285 2GB特别版,GTX275孙策版的加入让耕昇的高端产品线更为齐全,且均为首发非公版,体现了耕昇深厚的研发功力。昔日个性非凡的红魔耕昇,又再度展现了“非公版之王”的风范。
素有“公版王”美誉的NVIDIA老牌合作伙伴映众,仍然是走着老道子,推出了完全公版的GeforceGTX275,无论是PCB、散热器还是默认频率,映众的GeforceGTX275仍然是保持着最朴素而实在的标准。
(点此查看大图)
(点此查看大图)
公板设计(点此查看大图)
在供电方面采用了6+1相分离式设计,具备双6pin电源接口(点此查看大图)
(点此查看大图)
硬件平台 | |
CPU | Intel Core2Duo E8400 |
Intel Core2Extreme Q9770 | |
主板 | Foxconn P45 Avenger |
显卡 | NVIDIA GeForce GTX275 |
NVIDIA GeForce GTX285 | |
NVIDIA GeForce GTX260+ | |
ATI Radeon HD4890 | |
ATI Radeon HD4870 1GB | |
内存 | KingMax DDR31333 2GBX2 |
硬盘 | Seagate 7200.10 320G |
电源 | TT 80 Plus 750W |
软件环境 | |
操作系统 | Windows Vista 32bit |
驱动程序 | Intel inf9.0.0.1008 |
ATI Catalyst9.3 | |
NVIDIA Forceware185.63 | |
测试软件 | Futuremark 3DMarkVantage |
Crysis:Warhead | |
Farcry2 | |
World in Conflict | |
Devil May Cry4 | |
Need For Speed 12 | |
Call of Duty:War of World | |
Grand Theft Auto4 | |
STALKER:Clear Sky | |
Mirror's Edge | |
Cryostasis Demo | |
Star Tales | |
ArcSoft SimHD | |
vReveal MotionDSP |
测试项目方面,我们舍弃了老旧的3Dmark06,只采用3Dmark Vantage作为理论性能的测试项目。而选择的游戏我们这次较以往有很大变化,近期新游戏接连出现,我们在众多的游戏中选取了其中5个DirectX10游戏、3个DirectX9游戏。除了赛车游戏优品飞车12使用Farps手动测试外,其他项目全部采用游戏自带或者第三方Benchamark软件测试,务求得到最准确的数据。
另外,我们增加了三款PhysX的游戏进行测试,他们是Mirror‘s Edge、Cryostasis和Star Tales。来自Arcsoft的SimHD功能和VReveal的MotionDSP软件是用来测试CUDA下的相关应用。
从测试成绩来看,GTX275要明显高于HD4890,而从此也让GTX260+在这项测试中解围。
GTX275在Crysis Warhead中小幅度领先于HD4890,明显高于GTX260+。而在farcry2中,GTX275的优势非常明显,成绩与GTX285接近。
从2008年下半年开始和GTX280的发布,NVIDIA的GPU从传统的单一3D渲染角色快速像通用并行处理器+3D渲染角色转变。近一年来,基于NVIDIA CUDA架构GPU的应用情况已经非常清晰。基于游戏的PhysX带来真实的物理效果;由Badaboom,TMPGEnc开始的基于视频特效和编码的CUDA加速;最新推出的Arcsoft和vReveal实时的视频处理;以及未来DX11的DirectX Compute和未来的OpenCL。
GPU带来新视觉计算,不仅仅是3D渲染和游戏
GPU运算能力增长远高于CPU
CUDA架构将完美支持基于CUDA的C语言(今后会更多高级语言),OPENCL和DX Compute
在前不久的GDC大会上,NVIDIA率先展示了今年底即将推出的DirectX11中的重要功能即关于并行计算功能的DirectX Compute。它与OpenCL一样,为开发人员提供了并行计算的API,而这与CUDA并不冲突。CUDA是指NVIDIA 并行计算的架构,无论OpenCL还是DirectX Compute都是可以通过CUDA架构运行的。其实,由于目前ATI并行计算方案开发投入远不能和NVIDIA相比,而Larrabee开发又受阻,NVIDIA其实成了DirectX Compute惟一可用的调试平台……下面,我们来看看DirectX Compute在NVIDIA CUDA下运行的效果。
DirectX Compute下FFT创造的波浪
DirectX Compute下的nBody
其实这两段视频在CUDA初期利用CUDA C语言开发早可以实现,FFT也作为CUDA C的库最早出现,NVIDIA这次展示DirectX Compute也说明对于GPU并行计算而言,NVIDIA CUDA已经遥遥领先。
MotionDSP vReveal的算法原本是用于将捕捉到的质量低下的视频或图片进行信息的还原。例如,视频拍到远处的车牌号原本图片中看不清楚,经过处理后则可以得到你想要的信息。
这是官方展示的一组效果对比,经过处理后右侧书名文字非常清晰
(点此查看大图)
最近,推出DVD倍线功能的播放软件非常多,老牌的新版本Powerdvd和Windvd都可以利用CPU支持DVD倍线,而Arcsoft的则是支持NVIDIA CUDA加速的倍线软件。对于熟悉DVD机倍线的用户来说,这个功能并不陌生,而且如果本身DVD片源质量优秀,得到的效果确实不错。而早在一年前,Intel也曾演示Powerdvd的倍线功能,大概需要3GHz E8400 几乎满负荷才能实现。
(点此查看大图)
(点此查看大图)
从HQV的画质测试来看,Arcsoft由于具有De Block而画质更好,Cyberlink TTHD技术和WinDVD的 All2HD技术画质不够理想。
(点此查看大图)
基于Unreal3引擎和PhysX设计的舞蹈游戏(点此查看大图)
衣服摆动均为真实布料引擎(点此查看大图)
衣服摆动是随机的(点此查看大图)
《Cryostasis》,点击看大图(由于视频被和谐,无法浏览)
|
《Cryostasis》的最大特点是将液体流体较大规模加入到游戏中(官方资料是3万个单位)。自从有了真3D渲染以来,大家对3D世界中水或者液体的效果就颇为在意,以现在技术多层水面的光影效果足以乱真(部分游戏只是出于负载考虑,层数不够导致效果稍差),但物体、人物与水的互动则假之又假。此次在《Cryostasis》改变了这一局面。
游戏女主角Faith,点击图片了解这款游戏 |
很容易看到,在视频左右两边打开和关闭物理效果的差异。最大差别主要是场景中类似布料、旗帜等布景,如果在游戏中关闭PhysX(并不是没有NVIDIA显卡或PPU加速,就不能打开游戏该选项,CPU一样可以实现特效和加速)将不能看到场景中的窗帘、旗帜等等。在玻璃破碎方面,我们看到即便关闭物理引擎,通过传统的固定路径方法,也可以实现玻璃破碎的效果,但玻璃掉在地上却不见踪影。
除了我们谈到的CUDA和PhysX的应用外,此次随着GTX275的发布,NVIDIA还推出了新系列的驱动Forceware185系列,在该系列中加入了Ambient Occlusion开关。从字面看Ambient Occlusion是指周围环境的吸收,目前NVIDIA官方中文翻译为“光源吸收”(也许是环境光源吸收?)
请注意看墙角的区别
Ambient Occlusion是指通过改进的模型,让光源与周围关系更加细化。例如在阴影下的物体不会再因为光线而影响到另外的物体。举例来说,例如一个墙面间、与天花板的拐角,因为存在顶部天花板的阴影,拐角总是要比周围更暗的,但没有AO是不可能考虑到这点的(如图)。
下面我们来看看几组游戏对比截图。
AO off
对于NVIDIA现有产品线而言,真正在市场上销售的显卡中,GeForce GTX275的配置可以称的上准旗舰级别的产品。不难看出,由于它与GTX285相比仅在频率上有细微差别以及显存位宽稍有差别,从测试不难看出,如果GTX275可以小幅度超频,性能将直逼GTX285。
(点此查看大图)