二、更高频率,微星9800GTX+为高性能打下良好基础
微星9800GTX+不仅采用了最新的55nm工艺,还提高了显卡的频率,比普通的9800GTX+频率更高,对于NVIDIA显卡来说,增加较少的频率就会提升很高的性能,这是因为G92的架构原因。
我们从基本架构谈起,传统的GPU因为采用了分离式的架构,所以经常会出现数据分配问题,极大的影响了渲染效率。而DirectX 10中最大的改进便是引入了统一渲染架构(unified shader),所谓统一渲染架构,最容易的理解方式就是Shader着色单元不再分离。正是DX10统一架构的出现,sp单元也就是流处理器成为了一个规格的重要衡量指标,因为流处理器是显卡像素处理、顶点处理乃至几何单元处理的关键。不过因为设计架构的不同,sp单元也不能完全等同,因为它们的处理能力并不相同。
对于RV770核心的HD4850,当消费者听到800个流处理器的时候,确实感到了数量众多,而9800GTX+仅有128个流处理器。从sp单元的内部角度说,9800GTX+采用完全标量的设计,显卡内部会把向量代码自动转换成标量代码,达到100%的运作效率,除了GPU中的其它因素例如带宽、存取延迟会对构成一定的性能影响,sp单元本身不存在任何延迟性能的结构。
![]() |
而基于RV770架构的HD4850的每个sp单元都包括5个算术运算单元和一个分支单元,如果采用特定安排的指令组合,最高可以实现每个周期发射、执行5条指令。理论上RV770每个sp单元在每个周期可以完成5条指令,因此ATI就用这样的计算方法来定义自己的流处理器数量,得出800个流处理器的结果。
但是根据功能的不同,RV770的sp单元的5个算术单元被划分为两种,即ALU和ALU.transcendental,两种单元都能执行 MULADD 等整数、浮点指令,不过两者都存在一些彼此不能执行的指令,例如CUBE、Dot4、MOVA指令不能在ALU.trans上执行,而SIN、COS、MULHI、MULLO、RECIP、SQRT等指令都只能在ALU.trans单元上执行。
![]() |
因此在某些情况下,RV770的执行效率并不会达到理论的顶点,也就是说,因为架构设计的特点,RV770也许并不会在同一周期发挥出800个流处理器的所有效能,这与3D程序的编程方式有极大的关系。此外如果指令分支增多,这种效率还会继续降低,ATI当然考虑到了这个问题,所以在sp单元中包含分支运算单元,只不过我们无法判断这个分支单元能为sp处理器带来多大的效率提升。
总而言之,对于实际游戏来说,9800GTX+架构的128个流处理器效率有基本的保证,而架构不同的RV770则不尽然,其实在运算中的效率问题各类架构优缺点并存。
今天我们测试的微星9800GTX+核心频率和shader频率都比公版9800GTX+要高,这就为提升性能打下了良好的基础,我们会在后面的测试中详尽展示微星9800GTX+的性能。不过9800GTX+不仅有架构优势,练就一身GeForce内功的它还有很多功夫没有秀出来。
三、支持三路SLI、智能SLI等等,微星9800GTX+功能丰富
除了DirectX10这样具备业界共同参与制订的统一性标准,如果提起显卡厂商独立的特有的技术,那么最为著名、应用最为广泛的非NVIDIA开发的多卡互联“SLI”技术莫属了。随着时间的推移,这项本身单纯为提升显卡3D性能的技术也在不断的发展,如果现在谈到SLI技术,作为读者或者是硬件爱好者的您,还仅仅停留在提升3D性能的印象,那么您就非常落伍了。
现在的SLI技术除了提升3D性能,还能做到节能、还能为物理运算进行加速,等等这些应用都已经渗透到了电脑的方方面面,而如果您使用了NVIDIA的显卡及主板产品,这些技术就已经存在于您的系统中,如果不合理的使用,那么会造成很大的资源浪费。
大家应该知道,一个事物发展往往需要某种外界因素的刺激,而对于SLI的发展来说,是为了给那些需要优良的3D效果才能得到满足的消费者,在大多数的时候一般的玩家是配上一张具有优越性能的显卡,来提升3D立体效果,但是单单是一张显卡并不能完成大量数据的运算,使得处理速度显得捉襟见肘。
SLI技术就是在这种环境下诞生的,将两块(或者三块)图形卡连接在一起,直接实现几乎两倍的图形性能,大幅度提升游戏的画质或者性能,实现方式非常简单。从SLI诞生至今,NVIDIA几乎全部的产品都能支持SLI,虽然竞争对手有类似的技术,不过NVIDIA SLI仍然化身多卡互联技术的代言,成为消费者最耳熟能详的图形技术之一。
而近期最热门的关于SLI的测试和消息就是X58对SLI的支持,因为自身有芯片组的设计和生产,所以NVIDIA一直对SLI爱护有加,不过在这次Intel发售新一代Core i7处理器的时候,NVIDIA却一反常态的将授权开放给X58,让喜爱Intel主板的玩家也能体验到优异图形性能的享受(相比较而言,ATI的CrossFire技术更早的开放给了Intel主板)。
![]() |
需要注意的是,NVIDIA虽然对X58开放了SLI技术,但并不是针对Intel,NVIDIA最近计划伸延SLI支持的政策,此次是将授权交予了主板厂商而并不是X58芯片组的开发者Intel,不管是不是绕了个圈子,在NVIDIA开放X58主板的原生SLI支持授权后,主板厂商热情大涨,纷纷开发了相关主板产品,迎接Nehalem Core i7处理器。
截至目前,微星已经推出了支持SLI技术的X58主板,且均通过了NVIDIA的授权认证,值得一提的是,NVIDIA的X58主板SLI方案包括原生和附加芯片两种方案,只有微星使用了NVIDIA的nForce 200桥接芯片,能为多路SLI提供充足的带宽(配备nForce 200桥接芯片可以实现三个PCI-E 16x通道的三路SLI,而原生方案只能实现三个PCI-E 8x通道的三路SLI,只不过nForce 200桥接芯片每个售价约20~30美金,比起原生SLI方案每块主板5美金的授权费要贵很多)。
除了X58主板对SLI的支持可以大幅度提升3D性能以外,SLI还能实现智能SLI的功耗控制和专门的物理加速两项比较创新的技术。HybirdPower混合动力技术,这项技术旨在为能耗的控制而生,作为集成的主体功能,在用户使用独立显卡和支持智能SLI技术的主板搭配使用时,起到了对显示输出能力进行控制和调节的作用,是为了提供更好的性能和功耗控制的管理方案。
混合动力可提供“高效能”和“低功耗”两种运行模式。其中高效能模式是板载GPU核心和独立显卡同时运行,在进行大型3D复杂运算时显著提高平台的整体性能。例如,3D游戏和图像处理等软件需求下,将板载GPU核心和独立显卡组成SLI模式,增强图形效能提高效率以节省用户的时间。而在低功耗运行模式下,Hybrid SLI平台将会关闭独立显卡,仅仅以板载的GPU核心运行输出显示,来实现降低功耗的目的。这一模式适合应用在平时用户上网和文档的处理等一些基本的需求,这样就可以是性能和功耗得到良好的控制,不至于造成不必要的“浪费”。对于GTX260+来说,这项技术非常实用和有效,毕竟我们在不玩游戏的时候,还保持着它的供电的确有些浪费。
![]() |
另外,对于最新的PhysX物理加速,SLI对此也有很好的支持,NVIDIA为多GPU的硬件系统进行了考量,为这类电脑打造更为完善的物理运算的加速模式,这其中包括两种模式:第一种是“SLI模式”,这种模式仍然是两块显卡各自承担图形渲染和PhysX物理运算的一部分工作,相当于平分工作,这种模式适合两款性能相当的产品。第二种是“Multi-GPU模式”,这种模式将图形渲染和PhysX物理运算的工作完全分开,一块显卡完全进行图形渲染,而另一块显卡则完全进行物理运算,这种模式适合两款性能有差异的产品,从示意图来看,目前图形渲染仍然是最高要求的部分,因此物理运算会交给性能相对薄弱的产品。
上述的第二个模式更加创新,对消费者也更有使用意义,比如如果消费者购买了一块GTX260+,同时还钟情很多具备PhysX物理加速的游戏,那么无需再购买第二块GTX260+,用原有的9600GT等NVIDIA产品(或者另购一块)直接作为物理加速的第二显卡,同时保证了游戏的速度和物理加速的需要、又节约了成本。
