寒武纪MLUv01架构采用台积电16FF，MLU-100芯片-德赢Vwin官网网

寒武纪科技公司与华为海思合作，为麒麟970 智能手机芯片组提供AI IP，并为数据中心创建了自己的系列芯片。

麒麟970内部的IP被称为Cambricon-1A，是该公司的第一个可授权IP。当时，查找寒武纪的信息非常困难：它的网站是一系列静态图像，中文嵌入图像本身。有趣的是，我们的AI加速翻译功能应用在华为Mate 10上来翻译网站内容。快进12-18个月，寒武纪网站现在可以互动并提供即将推出的产品的相关信息，包括一些最近发布的信息。

大芯片：走向数据中心

基于台积电16FF，MLU-100是一款80W芯片，在1.0 GHz，或'标准'模式下，使用机器学习算法中常用的8位整数度量，具有64 TFLOPS的传统半精度或128 TOPS功能。寒武纪的首席执行官陈天石博士表示，他们的新芯片具有1.30 GHz的高性能模式，允许83.2 TFLOPS（16位浮点）或166.4 TOPS（ 8位整数），但功耗上升到110W。这在技术上降低了能源效率，但是允许使用更快的芯片。所有这些数据都依赖于启用稀疏数据模式。

该芯片背后的技术是寒武纪最新的MLUv01架构，该架构被理解为是用于麒麟芯片组的Cambricon-1A的一种变体，但规模更大更快。显然，与移动IP相比，必须对数据和电源管理实施额外的优化。寒武纪也有它的1H架构和最新公布的1M架构，但是没有公开如何将数据传递到芯片。

WikiChip的David Schor指出，如果提供给商业合作伙伴，这可能是NVIDIA的首次机器学习ASIC竞赛。为此，寒武纪还在制造PCIe卡。

寒武纪MLUv01架构采用台积电16FF，MLU-100芯片

很明显，NVIDIA在这方面拥有强大的用户群和多代产品，以及利用其硬件优势的软件。 Cambricon没有详细说明他们计划如何支持新芯片的SDK，但是它的网站上有一系列的SDK，支持TensorFlow，Caffe和MXNet。

进入数据中心：PCIe

在数据中心中即插即用的最佳方式是通过PCIe卡。 Cambricon的MLU100加速器卡就是这样的：一个PCIe 3.0 x16实现256位16或32 GB DDR4-3200内存，这对于102.4 GB / s的带宽是有好处的。要在NVIDIA上获得大量内存，需要高端显卡，但这些显卡提供多倍的显存带宽。 MLU100卡上的存储器也启用了ECC。

迄今为止的报告称，联想将其卡作为ThinkSystem SR650双Intel Xeon服务器的附加产品; 每台机器最多两个。从联想网站上看，它目前并不能使用。鉴于华为在企业中的巨大影响力，我们很可能会看到这些系统中的芯片。

下一代：5TOPS/Watt

另外报道的是新的Cambricon-1M IP，尽管该公司没有提供细节。 WikiChip公司表示，这款新IP主要针对7nm制造，所以当华为/海思开始发布7nm移动处理器，然后进入下一代面向服务器的产品时，我们很可能会看到它。与ARM的IP所宣传的3 TOPS /瓦特相比，这个IP的目标是达到5 TOPS /瓦特。寒武纪今年晚些时候会有一个培训和推理芯片计划，并在2019年再次进行更新。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

芯片

芯片

+关注

关注
455

文章
50714

浏览量
423138
台积电

台积电

+关注

关注
44

文章
5632

浏览量
166407
机器学习

机器学习

+关注

关注
66

文章
8406

浏览量
132561

原文标题：华为的麒麟NPU IP制造商寒武纪，生产出一个大AI芯片和PCIe卡

文章出处：【微信号：SSDFans，微信公众号：SSDFans】欢迎添加关注！文章转载请注明出处。

谷歌Tensor G系列芯片代工转向台积电

近日，谷歌Tensor G4将成为该公司最后一款由三星代工的手机芯片。从明年的Tensor G5开始，谷歌将选择台积电作为其新的代工伙伴，并采用

发表于 10-24 09:58 •353次阅读

台积电美国工厂投产A16芯片，苹果成首批客户

台积电位于美国亚利桑那州的Fab 21晶圆厂传来重大进展，据业内消息透露，该厂已正式投产，首批产品为采用N4P先进工艺的A16 SoC，专为苹果iPhone 14 Pro系列打造。这一

发表于 09-19 17:24 •606次阅读

台积电美国工厂启动生产苹果A16芯片

全球领先的半导体制造商台积电（TSMC）正式宣布，其位于美国亚利桑那州的先进代工厂已启动生产，首批产品即为苹果iPhone的核心芯片——A16

发表于 09-19 16:09 •836次阅读

X86架构处理器有哪些优点和缺点

X86架构处理器作为计算机领域的重要组成部分，具有多个显著的优点和一定的缺点。以下是对X86架构处理器优缺点的详细分析。

发表于 08-22 11:25 •1955次阅读

算力概念股寒武纪20cm涨停市值重回千亿

7月16日整个算力概念板块上涨；寒武纪（688256）上涨达20%，股价创年内新高，成交额超42亿，寒武纪的总市值重回千亿大关。此外，紫光股份（000938）、海光信息（688041）等概念股同步

发表于 07-17 15:30 •590次阅读

台积电正积极研发并推广背面供电网络(BSPDN)方案

的超级电轨（Super Power Rail）架构，这一架构因其卓越的性能和能效，在高性能计算（HPC）领域备受推崇，被视为解决复杂信号传输与高密度供电需求的优选方案。

发表于 07-05 11:50 •607次阅读

台积电准备生产HBM4基础芯片

在近日举行的2024年欧洲技术研讨会上，台积电透露了关于HBM4基础芯片制造的新进展。据悉，未来HBM4将采用逻辑制程进行生产，

发表于 05-21 14:53 •728次阅读

移动端芯片性能提升，Armv9架构新升级引发关注

“数码博主”5月17日的最新爆料指出，联发科积极推进Armv9新一代IP BLACKHAWK“黑鹰”的架构设计，预计天玑9400芯片将采用这一架构，有望以“全大核”设计再度领跑移动So

发表于 05-17 16:51 •1008次阅读

寒武纪2023年报出炉：营收稳健亏损收窄毛利率达69.16%

年报信息显示，寒武纪全年实现收入7.09亿元人民币，其中毛利率达到69.16％，比去年提高了3.40个百分点。在经历过上年度寛泛亏损之后，本年度盈利情况明显改善，向股东返还利润407913000元，降幅达32.47％。

发表于 04-30 09:39 •797次阅读

台积电重回全球十大上市公司

都是亚洲市值最高的公司之一；而且在芯片代工领域拥有强大的定价权，台积电是英伟达AI芯片A100/

发表于 03-12 17:00 •1121次阅读

“AI芯片第一股”寒武纪发布2023年度业绩快报亏8.36亿元！

“AI芯片第一股”寒武纪（688256）在2024年2月28日发布2023年度业绩快报。

发表于 03-04 13:41 •866次阅读

台积电熊本厂开幕计划年底量产

台积电熊本厂开幕计划年底量产台积电熊本第一厂今天正式开幕，计划到年底量产；预期总产能将达 4

发表于 02-24 19:25 •1189次阅读

arm架构和x86架构区别 linux是x86还是arm

、ARM架构和x86架构的概述 1.1 ARM架构 ARM（Advanced RISC Machines）架构是一种精简指令集计算机（RISC）架构

发表于 01-30 13:46 •1.8w次阅读

寒武纪与智象未来联手，推动视觉大模型的技术创新与应用

在大模型领域，寒武纪自底层硬件架构至基础软件更新，皆针对大模型的实际应用场景进行了细致优化。依托高效的推理引擎MagicMind，寒武纪思元（MLU）系列云端智能加速卡支持输入输出变换

发表于 01-24 09:59 •876次阅读

寒武纪与智象未来达成战略合作并完成大模型适配

1月22日，寒武纪与智象未来 (HiDream.ai) 在北京签订战略合作协议，双方将通过资源共享、优势互补，依托各自在大模型领域的技术积累，持续产品适配，携手推动视觉大模型的创新与落地。

发表于 01-23 13:46 •542次阅读

搜索历史

寒武纪MLUv01架构采用台积电16FF，MLU-100芯片

评论

谷歌Tensor G系列芯片代工转向台积电

台积电美国工厂投产A16芯片，苹果成首批客户

台积电美国工厂启动生产苹果A16芯片

X86架构处理器有哪些优点和缺点

算力概念股寒武纪20cm涨停市值重回千亿

台积电正积极研发并推广背面供电网络(BSPDN)方案

台积电准备生产HBM4基础芯片

移动端芯片性能提升，Armv9架构新升级引发关注

寒武纪2023年报出炉：营收稳健亏损收窄毛利率达69.16%

台积电重回全球十大上市公司

“AI芯片第一股”寒武纪发布2023年度业绩快报亏8.36亿元！

台积电熊本厂开幕计划年底量产

arm架构和x86架构区别 linux是x86还是arm

寒武纪与智象未来联手，推动视觉大模型的技术创新与应用

寒武纪与智象未来达成战略合作并完成大模型适配