6月23日消息,今天早上最新一期2020年6月全球超级计算机top500榜单公布,令人比较意外的是夺得冠军的是一台日本超级计算机。近年来,基于ARM架构的服务器在HPC高性能运算、云计算及边缘计算中的应用日趋广泛,以MARVELL为代表的厂商都在深度耕耘ARM服务器市场。
获得第一的这台日本超算名为Fugaku( 富岳),其Linpack(HPL)结果达到415.5 petaflops,比目前排名第二的Summit系统高出2.8倍。Fugaku由富士通的48核A64FX SoC提供支持,成为名单上第一个由ARM处理器提供支持的系统。以单精度或进一步降低的精度(通常在机器学习和AI应用中使用),Fugaku的最高性能超过1,000 petaflops(1 exaflops)。新系统安装在日本神户的理研计算科学中心(R-CCS)。
第二名是Summit,这是IBM制造的超级计算机,可在HPL上提供148.8 petaflops。该系统有4,356个节点,每个节点配备两个22核Power9CPU和六个NVIDIATesla V100GPU。节点与Mellanox双轨EDR InfiniBand网络连接。Summit在田纳西州的橡树岭国家实验室(ORNL)运行,并且仍然是美国最快的超级计算机。
排在第三位的是Sierra,这是位于加利福尼亚州的劳伦斯·利弗莫尔国家实验室(LLNL)的系统,在HPL上达到94.6 petaflops。它的体系结构与Summit十分相似,在其4,320个节点中的每个节点中均配备了两个Power9 CPU和四个NVIDIA Tesla V100 GPU。Sierra使用与系统互连相同的Mellanox EDR InfiniBand。
由中国国家并行计算机工程与技术研究中心(NRCPC)开发的系统神威。太湖Sunway TaihuLight跌至第四位。该系统完全由Sunway 260核SW26010处理器支撑。自2016年6月在中国无锡国家超级计算机中心安装以来,其93 petaflops的HPL值保持不变。
排名第五的是天河2A(银河系2A),这是由中国国防科技大学(NUDT)开发的系统。它的HPL性能为61.4 petaflops是采用IntelXeon CPU和定制的Matrix-2000协处理器的混合架构的结果。它部署在中国广州的国家超级计算机中心。
意大利HPC5排名第六,HPL性能达到35.5 petaflops。HPC5是由Dell制造并由意大利能源公司Eni SpA安装的PowerEdge系统,是欧洲最快的超级计算机。它由Intel Xeon Gold处理器和NVIDIA Tesla V100 GPU供电,并使用Mellanox HDR InfiniBand作为系统网络。
另一个新系统Selene以27.58 petaflops的HPL标志位居第七。它是DGX SuperPOD,由NVIDIA的新“ Ampere” A100 GPU和AMD的EPYC“Rome” CPU驱动。Selene已安装在美国的NVIDIA。它也使用Mellanox HDR InfiniBand作为系统网络。
Frontera是安装在美国德克萨斯州高级计算中心(TACC)的Dell C6420系统,在该列表中排名第八。它的23.5 HPL petaflops通过448,448个Intel Xeon内核实现。
第九名是意大利的Marconi-100系统,由IBM Power9处理器和NVIDIA V100 GPU组成,采用双轨Mellanox EDR InfiniBand作为系统网络。Marconi-100以21.6 petaflops登上榜单第九位。
排名第十的是瑞士的Piz Daint(19.6 petaflops),采用Cray XC50系统同时配备了Intel Xeon处理器和NVIDIA P100 GPU。
在超算领域,最近几年的榜首位置基本都是中国和美国轮流,日本曾经在2011年凭借K(京)超算拿下了TOP500冠军。去年K退役之后,日本理研计算科学中心联合富士通打造了代号为Post-K的新一代超级计算机,最终命名为Fugaku(富岳),基于ARM架构,由富士通的48核A64FX SoC提供支持,峰值浮点性能高达513PFLOPS(51.3亿亿次)。
其Linpack(HPL)结果达到415.5 petaflops,比目前排名第二的Summit系统高出2.5倍,不过功耗也达到了28MW,是Simmit的2.8倍。以单精度或进一步降低的精度(通常在机器学习和AI应用中使用),Fugaku的最高性能超过1,000 petaflops(1 exaflops)。
Fugaku超算的浮点部分是与ARM合作的SVE指令扩展,使用了512bit浮点运算单元,每个节点使用48核+4辅助核,IO及计算节点则是48核+4辅助核结构。目前的性能还不是完整版,后续还会继续升级到1000PFLOPS,也就是百亿亿次。
前十名的榜单中,由中国国家并行计算机工程与技术研究中心(NRCPC)开发的神威·太湖之光(Sunway TaihuLight)排名第四,该系统由Sunway 260核SW26010处理器供电,2016年6月在中国无锡国家超级计算机中心安装,HPL性能为93 petaflops。由中国国防科技大学(NUDT)开发的天河2A排名第五。
中国制造商在安装数量上摇摇领先,在500台超算系统中,联想集团(00992)以180台占据绝对主导地位,继续排名全球超算提供商第一名,相比上次榜单增加了六套系统。
另外,曙光68台和浪潮64台,中国制造商合计占312台。
责任编辑:gt
- ARM
+关注
关注
134文章
8913浏览量
364436 - 计算机
+关注
关注
19文章
7062浏览量
86725 - 服务器
+关注
关注
12文章
8603浏览量
84247
发布评论请先登录
相关推荐
评论