GF110架构分析:
GTX580采用GF110显示核心,GF110显示核心同样属于Fermi架构,基本上GF110在架构上并没有任何变化,而GTX580采用的GF110显示核心只是在制造工艺上改进了,随着40nm制造工艺的成熟使得GF110的良品率要比GF110高得多,而功耗温度方面的表现要比GF110更为出色,这样使得GTX580能使用上完整的512个流处理器。详细的Fermi架构可以参考我们之前的文章《主宰DX11新纪元!GTX480/470显卡详评测》,下面我们来简单温习一下Fermi架构。
GF110核心架构组织示意图
GF110核心内部总共拥有512个CUDA核心,每32个核心构成一个SM(流式多处理器),共有16个SM。每个SM都是一个高度并行的多处理器,它们在任何时候都能够支持多达48个Warp。每个CUDA核心都是统一的处理器核心,能够执行顶点、像素、几何学以及计算内核。统一的2级高速缓存架构能够提供载入、存储以及纹理操作等服务。
GF110拥有48个ROP单元,它们可用于像素混合(Pixel Blending)、抗锯齿以及原子存储器操作。ROP单元每8个一组,共有6组。每一组均由一个64位存储器控制器来进行控制。存储器控制器、2级高速缓存、以及ROP群组全都密切关联,扩展一个单元就会自动地扩展其它部件。
GF110的主要计算单元——图形处理集群(GPC)
GF110的图形架构由大量叫做“图形处理集群”(GPC)的硬件模块构成。一个GPC包含一个Raster引擎以及最多四个SM。
GF110的每个GPC比喻成多核CPU的其中一个核
如其名称所示,GPC囊括了所有主要的图形处理单元。它代表了顶点、几何、光栅、纹理以及像素处理资源的均衡集合。除了ROP功能以外,GPC可以被看作是一个自给自足的GPU,而一颗GF110拥有四个GPC!
GF110架构的每个TPC中,每三个SM共享一个纹理单元
在GF110之前的GPU中,SM与纹理单元在一种叫做“纹理处理集群”(TPC)的硬件模块中聚集在一起。而在GF110中,每一个SM都拥有四个专用独立的纹理单元,这样就不再需要TPC了。