GK110核心强大之处
为何GK110有这么多的晶体管数量呢?原因在于GK110比GK104拥有更多的CUDA核心数量、更多的显存控制器数量、ECC校验单元以及运算双精度单元;SMX单元也增加到了15组之多,每级SMX单元保持192个CUDA Cores的设计,也就是说GK110实际上是拥有2880个CUDA。
现在的GeForce GTX Titan与Tesla K20X都仅有2688个CUDA Cores,明显就是屏蔽了一组SMX单元192个CUDA Cores。而为了为满足带宽传输需求,GK110提供了六组GDDR5显存控制器,组成384Bit显存位宽,显存带宽提升至256GB/s。可以结合GK110核心示意图与看到,6组显存控制器摆在最外边,包围着SMX单元。
除此之外,GK110为了增加双精度计算能力,在每组SMX提供多达64个FMA双精度单元,对比GK104只有8个FMA双精度单元。同时GK110也是首款支持Hyper-Q、Dynamic Parallelism并行调度的GPU。相比GK104有了显著的改善,这也是NVIDIA将GK110计算定位3.5代的原因。
资料参考:NVIDIA GK110白皮书