“我是单核GPC”:GT450核心架构分析
NVIDIA GeForce GTX460/GTS450/GTX260+/GTS250系列显卡规格对比:
NVIDIA GeForce GTX460/GTS450/GTX260+/GTS250系列显卡规格对比 | ||||
vga.it168.com | GTX460 | GTS450 | GTX260+ | GTS250 |
---|---|---|---|---|
核心代号 | GF104 | GF106 | GT200 | G92b |
制造工艺 | 40nm | 40nm | 55nm | 55nm |
晶体管数量 | 1.95 Billion | 1.17 Billion | 1.4 Billion | 754 Million |
流处理器数量 | 336_CUDA | 192_CUDA | 216_CUDA | 128_CUDA |
纹理单元 | 56 | 32 | 72 | 64 |
ROP单元 | 24(32) | 16 | 28 | 16 |
核心频率 | 675Mhz | 875Mhz | 576Mhz | 738Mhz |
流处理器频率 | 1350Mhz | 1750Mhz | 1242Mhz | 1836Mhz |
显存频率 | 3600Mhz | 4000Mhz | 1998Mhz | 2200Mhz |
显存容量 | 768MB(1G)_GDDR5 | 1G_GDDR5 | 896MB_GDDR3 | 1G_GDDR3 |
显存位宽 | 192bit(256bit) | 128bit | 448bit | 256bit |
显存带宽 | 86.4 GB/s (115.2 GB/s) | 64GB/s | 111.9GB/s | 70.4GB/s |
DirectX支持 | DirectX11 | DirectX11 | DirectX10 | DirectX10 |
供电接口 | 双 6-pin | 6-pin | 双 6-pin | 双 6-pin |
TDP设计功耗 | 150W(160W) | 105W | 171W | 145W |
GTS450采用GF106核心,GF106采用了11.7亿个晶体管,大概比GF104要少了40%。GTS450拥有192个流处理器,拥有128Bi的显存位宽,售价初定为899-999元。而完整版的GF106核心
▲GF106核心规格刚好是GF104核心的一半
▲完整版GF106核心为“双192规格”:192Bit,192SP
之前已经说过,GF106就是GF104的单GPC版本,即GF104核心的一半。所以GF106的核心内部规格与GF104的完全一样。完整版的GF106核心是拥有192Bit的显存规格,而目前发布的GTS450却只有128Bit的显存规格,可以得知,其核心上的某组显存控制器被屏蔽,从而得出128Bit的规格。而且从特殊的渠道得知,完整版GF106核心的GTS450会率先针对OEM市场推出,而我们曾经询问过NVIDIA有关人员是否会会推出GF106的满192Bit显存规格的显卡型号,被回答为:“有可能,要看市场动向”
关于GF104/GF106核心内部规格:
GF100核心的SM内部规格
GF104/GF106核心的SM内部规格
在更高端的GF100身上,拥有4个GPC(图形处理集群),每个GPC有4个SM(流处理器群),其每组SM拥有32个流处理器,全规格有512个流处理器。而GF104核心内部拥有2个GPC,每个GPC里面有4个SM,每个SM内拥有48个流处理器,全规格有384个流处理器。再到GF106核心内部则只有1个GPC,GPC里面有4个SM,每个SM内拥有48个流处理器,全规格有192个流处理器。
▲GF106采用正方形封装,里面拥有1个GPC
GF104/GF106核心的每个SM拥有8个纹理单元
在纹理单元方面,GF104的配比也较GF100有所不一样,GF100每个SM内部拥有4个纹理单元,而GF104/GF106每个SM内部拥有翻倍的8个纹理单元。这个比例相当惊人,要知道在GT200核心内部,每三个SM才共享一个纹理单元。
GF104/GF106核心的SFU与CUDA核心比例提高
除了纹理单元之外,GF104/GF106核心的SFU(Special Function Units,特殊功能单元)也同样是数量较GF100翻倍了,达到8个,每6个CUDA核心搭配1个SFU(GF100是每8个CUDA核心搭配1个SFU)。
特殊功能单元SFU的主要功能是可执行抽象的指令,例如正弦(sin)、余弦(cosine)、倒数和平方根。图形插值指令也在SFU上执行。每个SFU在一个时钟周期内针对每个线程均可执行一条指令,一个Warp(32个线程)的执行时间可超过八个时钟周期。SFU流水线从分派单元中分离出来,让分派单元能够在SFU处于占用状态时分发给其他执行单元。复杂的程序着色器在特殊功能专用硬件上的运行优势尤为明显。
GF100拥有16个PolyMorph引擎,GF104拥有其一半数量的PolyMorph引擎
GF100拥有16个PolyMorph引擎,GF104拥有其一半数量的PolyMorph引擎。同GF106的PolyMorph引擎仍然为每个SM配备一个,也就是一共4个PolyMorph引擎。
▲GF100、GF104、GF106核心内部规格示意图对比
总的来说,可以把GF100比喻成为一个四核GPU,GF104是双核GPU,而GF106则是单核GPU。只不过GF104/GF106每个核心内的SM的各种单元比GF100的SM内部各种单元有不同程度的配比提升,所以理论上GF104/GF106每个核的运行效率比GF100要更高。
关于更多Fermi架构的特性,请参考:《主宰DX11新纪元!GTX480/470显卡详评测》