显卡 频道

28nm+GK104核心 NVIDIA GTX680规格预览

  【IT168 资讯】  继昨天3DCenter.org后,一向善于深度分析的BSN网站也于今日放出了关于NVIDIA 28nm工艺Kepler架构GK104核心的消息:部分和本站昨日报道的大体相同,不过还有一些细微之处值得玩味。(关于昨日的传闻PCINLIFE管理员cho此次一反常态没有扔出一句"Fake"或者“瞎编”就走,此外多方来源已经间接暗示多数细节为真)

  首先关于NVIDIA将核心频率和Shader频率统一这个早有相关报道。Kepler架构中一组SM的CUDA Core数量对比Fermi翻倍,由32升为96个。显存控制器为256bit界面,这些都与昨天3DCenter的消息相同。

  接下来让我们来看看GK104的核心示意图:

28nm+GK104核心 NVIDIA GTX680规格预览
▲GK104的核心示意图

  大眼一看和GF110类似,不过仔细看就能发现SP数量由512暴增至1536。BSN称,起初NVIDIA考虑GK104上市初的名称是GeForce GTX 660,但现在有99%的可能正式上市名称为GeForce GTX 680,剩下1%为GTX 660/670。价格方面也和之前大嘴查理所说的不同:GeForce GTX 680定位于GeForce GTX 560 Ti 2GB/GeForce GTX 560 Ti 448 Core/GeForce GTX 570的替代者,初步定价为349-399美元。性能方面当然要比上代旗舰GeForce GTX 580要高很多,最重要的是GK104不仅能干掉449美元的Radeon HD 7950 3GB,549美元的Radeon HD 7970也不在话下,有消息称3DMark 11 X模式得分可能会在3000左右,一夜爆降千元看来即将出现……(提示:1536/1024或768/512)

  接下来是GK104的架构分析,Kepler时代一组SM以96个CUDA Core为基准,1个GPC(Graphics Processing Clusters)含4组SM共384个CUDA Core。GK104含1536个(4GPC),不难推测优异的GK110可能含6GPC即2304个CUDA Core。显存控制器方面可能仍为低端入门级64bit,中端主流128bit,中高端256bit,优异384/512bit——应先用在HPC上,或者采用GK110的GeForce GTX 690。而Kepler的移动图形核心其实已经早已流片完成,CES上三星已经展示了搭载最低端(96CUDA Core)的笔记本电脑。(驱动程序对频率/规格识别有误)

28nm+GK104核心 NVIDIA GTX680规格预览
▲Kepler架构显卡

28nm+GK104核心 NVIDIA GTX680规格预览
▲Kepler架构,一组SM以96个CUDA Core为基准

  和AMD的Tahiti XT对比,GK104在ROP和TMU数量上一样——均为32个和128个,但显存控制器指标仍然延续不如AMD的“传统”,2GB 256bit GDDR5显存对上Raeon HD 7970/7950的3GB。不过价格和性能上的优势相信届时也会迫使对手产品降价。

  和GF110一样,GK104其实也有两个版本——生产Quadro和Tesla的双精度浮点性能为单精度的一半,而生产GeForce的理论上为四分之一。

  目前GK104的核心频率暂定为950MHz,但BSN称消息来源表示在NVIDIA的实验室中起初有两个版本:772MHz用来和相同的GeForce GTX 580比较,925MHz用来和相同的Tahiti XT做比较,实际出货版本核心频率可能会在950-1000MHz之间。当然,类似AMD的蓝色小药丸,NVIDIA目前也在加紧调整BIOS,争取使公版的GK104核心频率届时站上1GHz。如果NVIDIA无法完成这一目标,那么将第一时间开放非公版/AIC超频版。

  显存方面,目前暂定的频率为1.25GHz等效5GHz,相对GF100/110的提升了25%。这方面AMD在GDDR5显存/控制器上算是标准制订者之一,因此AMD的GPU工程师在提高GDDR5显存方面具有优势也就不稀奇。 由前面所述的频率计算,GK104拥有160GB/s的显存带宽,对比GTX 580的192.4GB/s略有下降,但比起预计替代的产品GTX 560 Ti和GTX 560 Ti GF110核心版本/GTX 570的128.27GB/s和152GB/s均有提升。

  所有这些规格带来的单精度浮点运算能力为2.9-3.05TFLOPS,双精度浮点为486-500GFLOPS。Quadro和Tesla版本会拥有解锁的双精度浮点运算能力——也就是1.5-1.6TFLOPS左右,和GTX 580的单精度浮点运算能力相当,显著高于Fermi核心的Quadro和Tesla。

  BSN最后称,用户们不会等待太长时间,NVIDIA已经准备开始Kepler的预售/铺货等行动(包括中端的GK107——GeForce GTX 650等),在市场行动上用来反击AMD将于2月15日发布的"Cape Verde"Radeon HD 7700系列和3月6日德国汉诺威CeBIT展会上发布的"Pitcairn"Radeon HD 7800系列。或许下个月市场上就能见到Kepler的实体。

0
相关文章