在表中我们特意标红了两项相差最悬殊的核心规格,为何在同一定位的两款产品会出现如此大的差距呢,接下来我们慢慢详细解释。
根据ATI的说法,RV630核心内置了120个流处理器单元。从数字上看似要比对手NVIDIA同级G86的16个甚至中端G84的32个还要多出数倍,那究竟ATI那数量庞大的流处理器单元与NVIDIA的流处理器有何区别呢?
在过往,像素渲染单元和顶点渲染单元都分别负责着不同的数据渲染,比如说像素渲染单元负责着包括RGB(三原色)和这三原色的信息说明等一共四个数据的运算,而顶点渲染单元则是负责三角型顶点的XYZW坐标数据的运算,我们把这些任何一个单独的数据称为标量。因为在以前往往这两种数据都是4个标量为一组的,所以像素渲染单元和顶点渲染单元都被设计成单周期同时执行一组4标量的运算,这就是旧有的SIMD架构,SIMD架构在处理4标量为一组的矢量运算时效率非常高。
但随着游戏的复杂化,一组矢量未必数量一定为4的标量,那么比如在执行只有单一标量的矢量数据时,原来的SIMD架构效率就大打折扣了。虽然近代的ATI使用了“3+1” 的设计,允许一次处理4个矢量运算,或者同时处理一个3矢量运算和一个单标量运算。而NVIDIA的Geforce6和Geforce7系列则除“3+1”外还可以提供一个额外的“2+2”类型运算来提高效率,但由于的单标量运算日益频繁,加上长久以来像素渲染与顶点渲染比重的问题,所以SIMD架构终被取缔,DirectX9时代结束。随之而来的就是统一渲染架构的DirectX10时代。
到了DirectX10时代的统一渲染架构,NVIDIA采用的是全标量流处理器设计,流处理器既可以提供100%的标量运算效率,也能提供100%的矢量运算效率,并且运行频率是核心频率的一倍!而ATI则保持过往R580的策略,在每个流处理器里面放置更多的流处理单元,这里的更多是指由原来R580的1:3增加至1:5,所以RV630的120个流处理器单元组成的只是24个流处理器,不过这些流处理单元仍然支持标量与矢量并行运算,支持5个单独标量同时运算或者1组标量+2个标量的运算,和NVIDIA不同,ATI的R6xx的流处理器频率和核心频率是保持一致的,综合这些区别我们很难去换算ATI与NVIDIA在架构上的强弱,更多情况下取决于游戏设计者更喜欢那一种架构。