NVIDIA历来对未发布产品的保密工作是非常严格的,别说产品的详细规格,就连产品的名称在发布前也很难了解。可这次在GTC大会上,NVIDIA创始人兼CEO黄仁勋(Jen-Hsun Huang)一反NVIDIA的常规做法,在大会的第一天(9月21日)一口气公布了未来两代显卡产品的代号,它们分别是下一代的Kepler(开普勒)和更下一代的Maxwell(麦克斯韦)。
正如G80系列显卡以物理学家Tesla(特斯拉)命名、GF100系列显卡以物理学家Fermi(费米)命名一样,NVIDIA未来的显卡产品也以两位物理学家命名。按照黄仁勋的说法,Kepler将于2011年底发布,其将采用28nm工艺,双精度计算性能/每瓦有望在Tesla基础上提升四倍左右,在Fermi基础上提升两倍左右。
下一代Kepler和下下代Maxwell的性能提升幅度很大
而Maxwell则将于2013年发布,将采用22nm工艺,双精度计算性能/每瓦有望在Tesla基础上提升16倍左右,在Fermi基础上提升8倍左右。黄仁勋表示Kepler和Maxwell性能提升幅度如此之大一部分原因是因为工艺的提升,但更重要的原因还是图形架构的革新所带来的性能增长。
大会展示了即将发布的《鹰击长空2》游戏
从Kepler和Maxwell双精度计算性能大幅提升来看,它们应该仍然沿用Fermi的产品策略,在顶级产品上兼顾HPC计算和游戏性能,在中端以及更低档次的产品上放弃和HPC计算无关的功能和单元,更注重游戏性能的提升。
众所周知,如果要运行CUDA的话,必须使用NVIDIA GPU。而在本次GTC大会上,黄仁勋却表示NVIDIA将联合HPC计算编译器独立供应商PGI(The Portland Group)推出基于32bit和64bit的x86架构下的CUDA编译器,黄仁勋将其称之为“CUDA-x86”。这样一来,CUDA-x86就能够很好地和x86架构衔接,编程人员在基于x86架构上的集群、工作站上使用CUDA-x86进行编程的时候,可以不用强制使用NVIDIA GPU,直接利用CPU进行并行计算。
CUDA-x86的推出
事实上,作为一种全新的架构,CUDA在通用计算方面的潜力是非常巨大的,但要那些已经习惯了在基于x86架构下进行编程的人员完全接受CUDA的模式是比较别扭的,这并非是CUDA不好,而是这部分编程人员一旦接受CUDA就意味着必要换一种思路和方式进行编程。如今,CUDA-x86的推出改变了这种情况,利用CUDA进行编程无需强制运行在NVIDIA GPU上,可以跑在其他平台上,更可以直接用CPU来运行,强调CPU和GPU的通用性和兼容性。由此我们看出NVIDIA推广和普及CUDA的决心。
上图的后方是192颗4核心CPU组成的大型机组,前方的小型机器则由8个GPU组成,其并行计算性能更强。
虽然运行CUDA并不强制要求使用NVIDIA GPU,但从种种消息来看,我们有理由相信使用非NVIDIA GPU平台运行CUDA的性能和效率肯定不如使用NVIDIA GPU高。
本次大会的主题是展示GPU在通用计算方面的成果,自然少不了有关GPU在通用计算方面的应用分享。在GTC大会的第二天(9月23日),伊利诺伊大学厄本那香槟分校的世界顶级生物学家Klaus Schulten博士就发表了第二场主题演讲,主题就是GPU在计算显微镜、细胞破裂和病毒方面的应用和研究,这是目前GPU在通用计算方面应用的热门话题,顿时吸引了大家的关注。