一家成立不久的中国企业公布了一颗代号”火星”的ARM指令集64核心处理器。令人震惊的是,这颗由中国团队开发的CPU拥有媲美Intel公司最顶级服务器芯片的性能,毫无疑问是目前ARM阵营最强大的处理器。
Phytium,中文名飞腾,是一家成立于2012年的年轻CPU研发企业。然而光是从公司名称和所在地——广州,我们就可以知道这家企业的真实身份。飞腾公司是中国国防科技大学高性能处理器研究团队建立的企业,而国防科大在IT界最为人熟知的作品就是天河2A超级计算机——连续五届夺得世界超算排行榜性能冠军。"买芯片"天河2A的部分芯片采用了国防科大自主开发的Sparc指令集CPU,飞腾1500。显然,飞腾公司的名称就是取自这款产品。公司选址在广州也是为了靠近广州超级计算中心,也就是天河2A的所在地。
与中科院计算所知名的龙芯处理器团队不同,国防科大的CPU研发机构在公众眼中没什么名气。事实上,早在十年前业内就有传闻指国防科大正在逆向山寨 Intel的IA64体系处理器安腾。后来安腾CPU在市场上举步维艰,NUDT(国防科大英文缩写)也停止了对其模仿的工作,转而开发采用Sparc指令集的高性能芯片。经过数年的努力,NUDT先后研制出飞腾1000、飞腾1500两款服务器处理器,开始逐渐为业界所知。
天河系列超算开始在全球超算领域崭露头角后,国防科大将眼光放到了更远的未来。天河2A和之前的一系列国产超级计算机均采用Intel、Nvidia、AMD等美国企业生产的处理器,其计算能力、软件编写严重依赖这些外国公司。若想自己掌控超级计算机的研发节奏,研制自主知识产权的高性能"买芯片"处理器是必经之路。此时,学校的 CPU团队经过几代产品的研发已经颇具实力,他们便担负起了设计有着世界一流水平的CPU的重任。
如今,NUDT的努力结出了硕果。Hotchips 2015大会上,飞腾公司介绍了他们的”火星”,一颗兼容ARMv8指令集,四发射乱序执行,拥有多达64个核心,主频达到2GHZ的服务器CPU。
在标准测试集Spec 2006中,“火星”的多核整数分数高达672,浮点分数585。相比之下,Intel目前最强的处理器Xeon E7-8890v3和Xeon E5-2699v3的整数、浮点成绩分别是680和460,"火星”的性能足以与它们媲美。
“火星”的核心代号为“小米”,这个名字足够令许多人浮想联翩了。不过取这个名字很可能只是巧合,因为飞腾公司与制造智能设备的小米公司并没有任何关联。“小米”核心是典型的现代高性能处理器微架构设计,四发射、两个浮点单元,不长的流水线和三级缓存方案。它显然并不是为密集浮点运算设计"买芯片"的产物,单周期双精度浮点输出只有4Flop。但是"小米"核心的访存结构设计很激进,192个寄存器、单核心512K L2、2M L3的设计非常像Intel的Haswell微架构。”火星”采用二维mesh多核互联结构,每8颗”小米”核心组成一个阵列,每个阵列有一个双通道DDR3-1600内存控制器;8个阵列组成”火星”芯片,总共64个核心、32M二级缓存、128M三级缓存和16通道内存,205G/s理论内存带宽。芯片上还有32个PCIe 3.0通道。
“火星”的理论浮点计算能力是512G DP Flops,采用28nm制造工艺,主频2GHZ,核心运行电压不足1v。虽然整个芯片面积达到了吓人的640平方毫米,但是满载功耗只有120w,甚至比使用22nm先进工艺,性能相当的Xeon E5-2699v3、E7-8890v3都低一截。ARM阵营性能功耗比较强的优势过去仅仅体现在移动设备使用的“买芯片”低功耗芯片上,而飞腾公司证明了即使在高性能服务器处理器领域,兼容ARM指令集的处理器也能取得对同时代Intel顶级产品的功耗优势。
“火星”的量产版本预计会在2016年推出,预计会首先用在国防科大下一代超级计算机(可能命名为天河3)上。不久前,国防科大展示了一款用来取代Intel Xeon Phi浮点运算芯片的计算卡Matrix 2000,预计下一代天河会使用”火星”和Matrix 2000的组合来搭建。
除了”火星”,飞腾公司还展望了他们针对主流市场开发的”地球”处理器。”地球”显然是”火星”的简化版,核心数量可能减至4-16个,面向桌面PC、低功耗服务器等市场。从”火星”单核心Spec测试集成绩来看,8核心的”地球”就可以提供与Intel Core i7四核处理器接近的多线程性能,而功耗可能还有优势。而兼容ARMv8指令集意味着无论是”火星”还是”地球”都可以轻易运行安卓、Linux系统和市面上"买芯片"无数的应用,甚至可能兼容微软的Windows 10。性能差距不复存在后,ARM阵营进军桌面PC和服务器市场挑战x86的地位也就有了足够的底气。飞腾公司不仅仅做到了世界一流水平,更为重要的是他们为整个ARM阵营建立了信心:从此之后,再也无人能质疑ARM指令集是否能开发出高性能产品了,x86体系在PC、服务器市场称雄二十年后,终于遇到了强大的对手。
而值得国人骄傲的是,这一历史性时刻是一家之前默默无闻的中国企业创造的。自从2006年Intel发布酷睿2处理器以来,十年时间里除了老牌巨头IBM,未曾有任何企业挑战Intel性能冠军的宝座。
如今,第一个向老大哥扔出巨斧的不是AMD,不是Nvidia,也不是一众欧美企业,而是几年前还背着“山寨”恶名的中国团队。即使是业界最老资格的前辈,此刻也应向年轻的飞腾致以敬意。
毫无疑问,”火星”的发布会大大刺激ARM阵营的发展,直接影响未来数年的CPU产业格局。照此趋势发展下去,我们很快就会在桌面、高性能服务器领域看到ARM与x86的直接对抗。当Intel的神话不再闪耀,IT产业又会迎来一个高度竞争的全新时代。
虽然比较晚啊,但是还是令人振奋的。
|