正如开篇所说,在1年多时间里我们看到了很多关于CUDA的成果。记得Badaboom这款所有普通用户都可以使用,GeForce8以上所有NVIDIA GPU均可以支持(包括板载GPU)的高清视频编码软件推出时,我们曾联想到与CPU的对比,同样是1年多的时间,同样是对视频的编码,基于Intel 45nm CPU的SSE4应用没有任何进步,而基于GPU的视频编码和滤镜加速软件则在2008年下半年全面开花!而且我们认为,这些基于CUDA的软件开发时间应该要从2008年算起。
2008年中,NVIDIA发布最新一代的GT200 GPU时,在硬件规格上明确提出了并行处理器的概念。这一代GPU从架构原生设计来说就考虑到两个方面,第一是传统的图形加速,第二是专门为并行计算的架构,两者稍有不同,但“并存”在一个GPU上。同时,NVIDIA也将CUDA版本升级至2.0,这也为下半年基于CUDA软件的全面丰收提供了良好的平台基础。
GT200并行运算架构 |
也许是为了表现CUDA的神奇和易于开发的特点,NVIDIA仅仅用了3个月时间,便将原Ageia公司的PhysX物理引擎成功使用GPU加速,同时在只要使用16个流处理器的条件下,性能便可以远胜当年价值几千元的Ageia物理加速卡。由于NVIDIA对Ageia公司的收购,也使PhysX顺理成章的进入了NVIDIA “The Way”游戏策略中,越来越多的游戏开始支持PhysX物理引擎特效,在体验过PhysX后,大家无不感叹:没有物理引擎的游戏,不是完整的游戏!
除了了视频和PhysX在民用端应用外,在高性能计算项目等科研项目上,CUDA的成果也非常迅速。首先,大家熟知的Matlab等数学软件,迅速将信号处理中必不可少的快速傅立叶变换FFT加入到了CUDA的库中,可想而知,以后使用Matlab做FFT,就像算加法一个,只是一个函数一行程序。另外,基于全球的分布式运算Folding@home(蛋白质折叠研究,针对癌症和人类疑难病症),也因为NVIDIA GPU的加入,而在短短几个月时间里迅速超越几年来全球无数CPU的积累和2年多来PS3积累的所有分数。如果我们有兴趣去CUDA Zone看一下,在2-3个月前,其中成果也许还只能以几百个形容,现在已经有几千个了。其中应用涵盖领域非常广泛。大家都在感受着这场计算的革命。