这些团队开发了第一个内存计算芯片,以比其他平台更低的能量和更高的精度来处理一系列 AI 应用程序。
边缘 AI 计算的圣杯是同时提供高效率、高性能和多功能性的芯片。获得所有这三个一直以来对设计人员构成了重大挑战,因此,许多人已经开始完全考虑新的计算架构。
其中一种新架构是内存计算,旨在消除数据移动瓶颈,以实现比传统数字处理单元更高的效率和更好的性能。本周,一组国际研究人员发表了一篇论文,描述了一种基于电阻随机存取存储器(RRAM) 的新型内存计算芯片。
NeuRRAM 神经形态芯片。图片由UCSD提供
在本文中,我们将讨论用于内存计算 (CIM) 的 RRAM、这些解决方案的历史缺陷以及该小组的新“NeuRRAM”神经形态芯片。
用于内存计算的电阻式 RAM
在过去的 30 年中,设计人员一直在研究内存计算的想法,最近,基于电阻 RAM 的内存计算。
RRAM CIM 消除了冯诺依曼瓶颈,这是单独的内存和计算的结果,而是将它们合并在一起。在此架构中,电阻式 RAM 元件用于存储器存储,其中二进制数字基于每个单元中 RRAM 材料的电阻状态存储。在这里,施加电压可能会导致 RRAM 成为高电阻材料,代表数字 1,反之亦然。读取存储器中的位是通过向 RRAM 单元施加电压并读取产生的电流来实现的,该电流将根据 RRAM 的状态而变化。
使用 RRAM CIM 单元的乘法示例。图片由SemiWiki提供
RRAM 是一种非常节能、小型且非易失性的存储器。这种架构也非常适合人工智能计算的环境,因为机器学习计算严重依赖于可以用 RRAM 轻松实现的乘法和累加函数。由于感测电流能够读取 RRAM 结果,因此可以通过对一个或一系列结中的电流求和来轻松地将 RRAM 值相加和相乘。
RRAM CIM的缺点
尽管 RRAM CIM 有诸多好处,但这项技术的研发仍然充满了障碍。
一方面,早期的研究大多集中在 RRAM 芯片上执行 AI 计算,但仍然依赖片外资源来执行其他基本功能,例如模数转换和神经元激活。这不仅限制了系统性能,而且还影响了基准测试。从历史上看,结果是基于设备特性的软件仿真,这几乎总是乐观的。
除此之外,RRAM CIM 设备中的能源效率、多功能性和准确性之间存在固有的权衡。根据加州大学圣地亚哥分校 (UCSD)、斯坦福大学、清华大学和圣母大学的一组研究人员的说法,以前的研究从未尝试同时针对所有三个标准进行优化。
NeuRRAM 达到效率、准确性、灵活性
本周,来自加州大学圣地亚哥分校、斯坦福大学、清华大学和圣母大学的研究人员在 Nature 上发表了一份报告,描述了他们称之为NeuRRAM的 RRAM CIM 芯片。
据说 NeuRRAM 神经形态芯片由于采用了输出传感方法,实现了效率、准确性和灵活性的结合。与读取输出电流的传统技术相比,NeuRRAM 使用神经元电路来感应电压并在芯片上执行高效的模数转换。
CIM 内核和 NeuRRAM 架构的框图。图片由Nature 和 Wan 等人提供
该架构包括与 RRAM 位单元共存的 CMOS 神经元电路。NeuRRAM 是一种神经形态的 AI 芯片,由 48 个神经突触核心、256 个 CMOS 神经元和 65,536 个 RRAM 单元组成,它们执行并行处理,可以支持数据和模型并行性。这允许将不同的模型层映射到不同的内核以实现最大的多功能性。
国际研究人员团队声称,该芯片可以实现比传统数字处理器低 2.3 倍的能量延迟积 (EDP),同时还提供高达 13 倍的计算密度。据说 NeuRRAM 的手写数字识别准确率达到 99%,图像分类准确率达到 85.7%,语音识别准确率达到 84.7%。
总而言之,该研究表明,该芯片与传统数字芯片的精度相匹配,但能量消耗显着减少,密度更高。设计该芯片时考虑到边缘计算的研究人员声称,NeuRRAM 的低功耗和高性能可能会启用目前无法使用现有技术的新型设备。
审核编辑 黄昊宇
-
芯片
+关注
关注
455文章
50714浏览量
423138 -
内存芯片
+关注
关注
0文章
126浏览量
21861 -
AI
+关注
关注
87文章
30728浏览量
268886 -
RRAM
+关注
关注
0文章
28浏览量
21346
发布评论请先 登录
相关推荐
评论