28nm+GK104核心 NVIDIA GTX680规格预览-显卡专区

28nm+GK104核心 NVIDIA GTX680规格预览

作者：ChrisR 编辑：李伟能 2012-02-13 00:37 来源：mydrive

　　【IT168 资讯】　　继昨天3DCenter.org后，一向善于深度分析的BSN网站也于今日放出了关于NVIDIA 28nm工艺Kepler架构GK104核心的消息：部分和本站昨日报道的大体相同，不过还有一些细微之处值得玩味。(关于昨日的传闻PCINLIFE管理员cho此次一反常态没有扔出一句"Fake"或者“瞎编”就走，此外多方来源已经间接暗示多数细节为真)

　　首先关于NVIDIA将核心频率和Shader频率统一这个早有相关报道。Kepler架构中一组SM的CUDA Core数量对比Fermi翻倍，由32升为96个。显存控制器为256bit界面，这些都与昨天3DCenter的消息相同。

　　接下来让我们来看看GK104的核心示意图：

28nm+GK104核心 NVIDIA GTX680规格预览
▲GK104的核心示意图

　　大眼一看和GF110类似，不过仔细看就能发现SP数量由512暴增至1536。BSN称，起初NVIDIA考虑GK104上市初的名称是GeForce GTX 660，但现在有99%的可能正式上市名称为GeForce GTX 680，剩下1%为GTX 660/670。价格方面也和之前大嘴查理所说的不同：GeForce GTX 680定位于GeForce GTX 560 Ti 2GB/GeForce GTX 560 Ti 448 Core/GeForce GTX 570的替代者，初步定价为349-399美元。性能方面当然要比上代旗舰GeForce GTX 580要高很多，最重要的是GK104不仅能干掉449美元的Radeon HD 7950 3GB，549美元的Radeon HD 7970也不在话下，有消息称3DMark 11 X模式得分可能会在3000左右，一夜爆降千元看来即将出现……(提示：1536/1024或768/512)

　　接下来是GK104的架构分析，Kepler时代一组SM以96个CUDA Core为基准，1个GPC(Graphics Processing Clusters)含4组SM共384个CUDA Core。GK104含1536个(4GPC)，不难推测优异的GK110可能含6GPC即2304个CUDA Core。显存控制器方面可能仍为低端入门级64bit，中端主流128bit，中高端256bit，优异384/512bit——应先用在HPC上，或者采用GK110的GeForce GTX 690。而Kepler的移动图形核心其实已经早已流片完成，CES上三星已经展示了搭载最低端(96CUDA Core)的笔记本电脑。(驱动程序对频率/规格识别有误)

28nm+GK104核心 NVIDIA GTX680规格预览
▲Kepler架构显卡

28nm+GK104核心 NVIDIA GTX680规格预览
▲Kepler架构，一组SM以96个CUDA Core为基准

　　和AMD的Tahiti XT对比，GK104在ROP和TMU数量上一样——均为32个和128个，但显存控制器指标仍然延续不如AMD的“传统”，2GB 256bit GDDR5显存对上Raeon HD 7970/7950的3GB。不过价格和性能上的优势相信届时也会迫使对手产品降价。

　　和GF110一样，GK104其实也有两个版本——生产Quadro和Tesla的双精度浮点性能为单精度的一半，而生产GeForce的理论上为四分之一。

　　目前GK104的核心频率暂定为950MHz，但BSN称消息来源表示在NVIDIA的实验室中起初有两个版本：772MHz用来和相同的GeForce GTX 580比较，925MHz用来和相同的Tahiti XT做比较，实际出货版本核心频率可能会在950-1000MHz之间。当然，类似AMD的蓝色小药丸，NVIDIA目前也在加紧调整BIOS，争取使公版的GK104核心频率届时站上1GHz。如果NVIDIA无法完成这一目标，那么将第一时间开放非公版/AIC超频版。

　　显存方面，目前暂定的频率为1.25GHz等效5GHz，相对GF100/110的提升了25%。这方面AMD在GDDR5显存/控制器上算是标准制订者之一，因此AMD的GPU工程师在提高GDDR5显存方面具有优势也就不稀奇。由前面所述的频率计算，GK104拥有160GB/s的显存带宽，对比GTX 580的192.4GB/s略有下降，但比起预计替代的产品GTX 560 Ti和GTX 560 Ti GF110核心版本/GTX 570的128.27GB/s和152GB/s均有提升。

　　所有这些规格带来的单精度浮点运算能力为2.9-3.05TFLOPS，双精度浮点为486-500GFLOPS。Quadro和Tesla版本会拥有解锁的双精度浮点运算能力——也就是1.5-1.6TFLOPS左右，和GTX 580的单精度浮点运算能力相当，显著高于Fermi核心的Quadro和Tesla。

　　BSN最后称，用户们不会等待太长时间，NVIDIA已经准备开始Kepler的预售/铺货等行动(包括中端的GK107——GeForce GTX 650等)，在市场行动上用来反击AMD将于2月15日发布的"Cape Verde"Radeon HD 7700系列和3月6日德国汉诺威CeBIT展会上发布的"Pitcairn"Radeon HD 7800系列。或许下个月市场上就能见到Kepler的实体。

关注我们