GTX460与其他相近定位产品的规格对比:
vga.it168.com | GTX460 1G | GTX460 768M | GTX465 | HD5830 |
---|---|---|---|---|
核心代号 | GF104 | GF104 | GF100 | RV870 |
制造工艺 | 40nm | 40nm | 40nm | 40nm |
晶体管数量 | 19.5亿 | 19.5亿 | 30亿 | 21.5亿 |
流处理器数量 | 336 | 336 | 352 | 1120(224x5) |
纹理单元 | 56 | 56 | 44 | 56 |
ROPs | 32 | 24 | 32 | 16 |
二级缓存 | 512K | 384K | 768K | N/A |
核心频率 | 675MHz | 675MHz | 607MHz | 800MHz |
显存频率 | 3600MHz | 3600MHz | 3206MHz | 4000MHz |
流处理器频率 | 1350MHz | 1350MHz | 1215MHz | 800MHz |
显存类型 | GDDR5 | GDDR5 | GDDR5 | GDDR5 |
显存位宽 | 256bit | 192bit | 256bit | 256bit |
显存容量 | 1024M | 768M | 1024M | 1024M |
DirectX支持 | DirectX11 | DirectX11 | DirectX11 | DirectX11 |
供电接口 | 6+6pin | 6+6pin | 6+6pin | 6+6pin |
功耗 | 160W | 150W | 200W | 175W |
售价 | 1499元 | 1299元 | 1899-2188元 | 1499-1799元 |
GTX460采用GF104核心,GF104采用了19.5亿个晶体管,大概比GF100要少了三份之一。GTX460拥有336个流处理器,不过却拥有256Bit和192Bit两种显存位宽的版本,256Bit版本包含完整4个64Bit显存控制器,售价初定为1499元、192Bit版本简化至3个64Bit显存控制器,售价初定为1299元。按照以往惯例来说同一核心不同显存位宽的显卡,NVIDIA都会用不同的型号来区别,但这次却两个显存位宽的版本都称为GTX460,想必在上市之后会给消费者选购带来一定的不便,而且根据上游厂商透露,NVIDIA已经确定此种方式,并不会区分开两个型号。
关于GF104核心内部规格的微调:
GF100核心的SM内部规格
GF104核心的SM内部规格
在更高端的GF100身上,拥有4个GPC(图形处理集群),每个GPC有4个SM(流处理器群),其每组SM拥有32个流处理器,全规格有512个流处理器。而GF104核心内部拥有2个GPC,每个GPC里面有4个SM,每个SM内拥有48个流处理器,全规格有384个流处理器。不过GTX460屏蔽了一个SM,所以就是7x48=336个流处理器。我们曾经询问过NVIDIA有关人员是否会存在GF104的满384流处理器规格的显卡型号,被回答为:“有可能,要看市场动向”
GF104历史性采用长方形封装,里面拥有两个GPC
GF104核心的每个SM拥有8个纹理单元
在纹理单元方面,GF104的配比也较GF100有所不一样,GF100每个SM内部拥有4个纹理单元,而GF104每个SM内部拥有翻倍的8个纹理单元。这个比例相当惊人,要知道在GT200核心内部,每三个SM才共享一个纹理单元。
GF104核心的SFU与CUDA核心比例提高
除了纹理单元之外,GF104核心的SFU(Special Function Units,特殊功能单元)也同样是数量较GF100翻倍了,达到8个,每6个CUDA核心搭配1个SFU(GF100是每8个CUDA核心搭配1个SFU)。
特殊功能单元SFU的主要功能是可执行抽象的指令,例如正弦(sin)、余弦(cosine)、倒数和平方根。图形插值指令也在SFU上执行。每个SFU在一个时钟周期内针对每个线程均可执行一条指令,一个Warp(32个线程)的执行时间可超过八个时钟周期。SFU流水线从分派单元中分离出来,让分派单元能够在SFU处于占用状态时分发给其他执行单元。复杂的程序着色器在特殊功能专用硬件上的运行优势尤为明显。
GF100拥有16个PolyMorph引擎,GF104拥有其一半数量的PolyMorph引擎
之前传出过GF104为了进一步减少晶体管,而去掉了用于顶点属性提取、Tessellation(曲面细分)、观察口转换、属性设置以及流式输出等功能的可扩展PolyMorph引擎,不过看来NVIDIA并没有这么做。GF104的PolyMorph引擎仍然为每个SM配备一个,也就是一共8个PolyMorph引擎。而GTX460因为屏蔽了一组SM,所以其PolyMorph引擎也相应减少至7个。
GF100与GF104核心内部规格示意图对比(点击放大)
总的来说,可以把GF100比喻成为一个四核GPU,而GF104则是双核GPU,不过GF104每个核心内的SM的各种单元比GF100的SM内部各种单元有不同程度的配比提升,所以理论上GF104每个核的运行效率比GF100要更高。
关于更多Fermi架构的特性,请参考:《主宰DX11新纪元!GTX480/470显卡详评测》