AI驱动的国产硬件仿真芯神鼎如何加速超大规模芯片设计-德赢Vwin官网网

近年来，5G、自动驾驶、超大规模计算，以及工业物联网等领域呈现出强劲的发展势头。推动这些高速发展的产业是AI（人工智能）和ML（机器学习）的大规模应用。这种全新的技术布局不仅加速了更复杂的计算需求、更强的功能性和更快的数据传输速度，同时也为芯片研发人员带来了前所未有的挑战：即下一代芯片必须更快且更智能。

在当前的背景下，由于算力和存储需求正面临爆发式增长，这直接导致推动先进SoC（系统级芯片）设计和验证的压力也呈指数级增加。特别是在集成电路规模越来越庞大的现实情况下，从设计到流片（Tape-out）的全流程中，验证变得尤为重要。这是因为有效的验证不仅确保了电路在设计层面的完善，还保证了其在实际应用中的稳定运行，从而降低了修正和调整的成本和时间。

为了应对这一挑战并缩短验证周期，硬件仿真成为了超大规模集成电路验证的首选工具。它能在最短的时间内完成对电路功能的全面验证，这样就大大减少了整个设计到生产的周期。同时，AI/ML算力的飞速增长不仅促进了EDA（电子设计自动化）工具的快速演进，还与EDA工具结合，催生了一种“双向加速”的良性循环。

去年年底，思尔芯推出了首款国产企业级硬件仿真系统——芯神鼎OmniArk。值得一提的是，芯神鼎已将AI应用于编译流程中，这无疑推动了芯片设计领域的发展。

芯神鼎硬件仿真系统采用了由AI驱动的智能编译引擎，该引擎能够在编译流程中极大地减少编译时间和内存占用，实现增量编译，并能智能匹配P&R（布局与布线）策略，从而显著提高布线的成功率。本文将从多个独立模块的角度，深入探讨芯神鼎硬件仿真系统的智能编译流程。

并行综合：打破传统编译瓶颈

传统综合方法充满了局限性。在集成电路设计领域，传统综合方法主要有两种：Top-down综合和Bottom-up综合。1.Top-down综合
该方法对整个设计进行处理，以实现彻底的优化。尽管优化程度高，但这一方案的综合时间通常非常长，不适用于迅速变化的项目周期。2.Bottom-up综合
此方法首先对底层模型进行独立综合，然后逐步并入上层模块进行综合。虽然这适用于一些包含独立IP的复杂设计，但其在超大规模集成电路（VLSI）应用中表现出速度和灵活性的明显不足。对于超大规模集成电路，这两种传统综合方法通常成为编译过程的瓶颈。除了时间效率低下，其对计算资源，特别是内存的占用也相当巨大。
芯神鼎硬件仿真系统对并行综合进行了创新，采用Module-by-Module的综合方式，彻底改变了这一现状。首先，芯神鼎针对整个设计进行必要的全局处理和优化，例如XMR（Cross-Module Reference）处理。接着，以Module为最小粒度，启动多核并行综合过程。这一步是本系统最大的创新之一，它允许系统充分利用服务器/集群的并行计算性能。在所有模块综合完成之后，系统进一步进行跨模块边界（Cross Module Boundary）逻辑优化。此外，芯神鼎能根据服务器配置和实际负载动态调节并行任务数量，以实现负载均衡。
这种并行综合方法大大加速了超大规模集成电路设计的整体综合效率。实际应用中，对于多核NVDLA（NVIDIA Deep LearningAccelerator）这样的复杂设计。经测试，其加速率可以达到惊人的10~100倍，尤其在多核设计中表现出色。
通过创新的并行综合技术，芯神鼎硬件仿真系统成功地突破了传统综合方法在时间和资源效率方面的局限，为超大规模集成电路设计带来了前所未有的效率提升。
图一：并行综合流程

高效率与高质量的智能P&R

在基于硬件仿真的超大规模设计流程中，P&R（布局与布线）通常是编译的最后一步，负责生成最终的bitstream文件。虽然现有的编译工具提供了多种P&R选项，目的是适应不同设计需求和优化目标，但实际情况却远没有那么简单。由于各种SoC需求和应用场景的多样性，几乎没有一种“通用”的P&R选项组合能适用于所有场景。因此，开发人员需要根据特定的设计需求，手动选择或调整P&R选项，以求达到最佳的设计输出。
1. 基于机器学习的智能P&R
芯神鼎硬件仿真系统突破了这一局限，采用基于机器学习（ML）的智能P&R方法。通过使用大量的实际P&R数据进行深度训练，系统生成的ML模型能在推理阶段输出最优的P&R参数组合。更值得一提的是，这种基于数据驱动的方法在多个关键性能指标上都超过了人工专家的判断。例如，在布线成功率方面，经测试，可以显著提高布线通过率；同时，P&R所需的总时间也可大幅度减少。
2.优化任务调度和并行计算
除了使用机器学习进行智能选项推荐外，芯神鼎硬件仿真系统还进一步优化了任务调度算法。通过智能任务调度，系统能确保在进行P&R操作时充分利用编译服务器的多核计算能力。具体的并行能力和效率提升取决于编译服务器的性能和配置。
通过集成基于机器学习的智能P&R以及高效的任务调度和并行计算功能，芯神鼎硬件仿真系统为FPGA设计提供了一种更高效、更质量可控的解决方案。这不仅大幅减少了编译时间，同时也显著提升了输出结果的质量。
图二：任务调度和并行计算流程

增量编译

在超大规模集成电路（VLSI）的设计过程中，即使进行了多方面的编译流程优化，编译时间依然可能成为项目进度的瓶颈。更进一步地说，对于那些已经编译过但需做细微修改的工程，每次都进行全量编译会大大延长开发周期，耗费人力和计算资源。
增量编译（Incremental Compilation）是一种编程优化策略，用于加快编译过程。在一个大型或复杂的代码基础上，每次进行全量编译（即重新编译整个代码基础）通常会消耗大量时间和计算资源。增量编译的目标是只重新编译自上次编译后发生变化或被影响的代码部分，而不是整个代码库。
增量编译系统首先会跟踪代码中各模块、函数或文件的依赖关系。当某一部分代码发生改动后，编译系统会识别这一改动，并查找所有依赖于该部分的其他代码。只有被改动的代码和依赖于它的代码会被重新编译。其它未改动和不受影响的代码则不需要重新编译。重新编译的代码会与旧的编译结果合并，生成一个更新的可执行文件或库。对于代码库非常大的项目，增量编译几乎是必需的。
芯神鼎硬件仿真系统便采用了这种增量编译策略。它采用了一种先进的增量编译引擎，该引擎涵盖了综合模块、Partition模块以及工程生成模块等关键部分。这些模块都集成了增量编译技术，可以在二次编译过程中智能感知用户所做的任何修改。这种自动感知机制极大地减少了重新编译所需的计算量，因为它只针对修改过的部分进行编译，而非整个设计。这样不仅大幅度缩短了编译时间，还优化了资源使用效率。图三：增量编译流程

总结

AI+EDA的结合代表了一次跨越式的技术进步，它不仅有望延续并拓展摩尔定律的生命周期，还能显著节约研发时间和资本投入，提升行业整体竞争力。进一步地，这一结合还为全球芯片设计领域开创了全新的可能性，比如通过机器学习算法优化设计流程，从而缩短产品上市时间，或者在更短的时间内完成更为复杂的设计任务。
芯神鼎硬件仿真系统集多种创新技术于一身，如并行综合、智能P&R和增量编译等模块，不仅大幅度缩短了编译时间，还提高了整体编译质量。这些模块都运用了我们自主研发的先进技术，为客户在超大规模集成电路验证方面提供了强有力的支持。除了应对现有的编译挑战，我们的解决方案还具备极强的可扩展性，能够适应未来更高复杂度的工程需求。
通过持续的研发和创新，芯神鼎硬件仿真系统有望成为推动整个集成电路设计行业进入新“智”元的重要力量，开启一个全新的、以数据和算法为驱动的芯片设计时代。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

芯片设计

芯片设计

+关注

关注
15

文章
970

浏览量
54573
仿真

仿真

+关注

关注
50

文章
3944

浏览量
132840
硬件

硬件

+关注

关注
11

文章
3053

浏览量
65682
AI

AI

+关注

关注
87

文章
28544

浏览量
265819

超大规模集成电路（VLSI）中不可或缺的5种二极管

在快速发展的 超大规模集成电路（VLSI）设计世界中，选择正确的组件对于优化性能和效率至关重要。二极管在 超大规模集成电路的各种应用中起着不可或缺的作用，从整流到电压调节。本文深入研究了2024年

发表于08-20 18:28 • 299次阅读

<b class='flag-5'>超大规模</b>集成电路（VLSI）中不可或缺的5种二极管

如何利用低功耗设计技术实现超大规模集成电路（VLSI）的电源完整性？

本文要点 超大规模集成电路(Verylargescaleintegration，VLSI)是一种主流的集成电路(IC)设计模式。芯片尺寸微型化有助于降低单个晶体管的功耗，但同时也提高了功率密度。先进

发表于08-03 08:13 • 569次阅读

如何利用低功耗设计技术实现<b class='flag-5'>超大规模</b>集成电路（VLSI）的电源完整性？

SAS 24G+规范发布,为超大规模数据中心HDD和SSD

在当前 超大规模数据中心的演进历程中，尽管固态硬盘正日益向支持NVMe协议的PCIe接口转型，但串行连接SCSI（SAS）技术依然是众多关键应用不可或缺的支柱。SAS存储技术的生命力远未枯竭，这一点从

发表于07-25 15:13 • 493次阅读

燧原科技与清程极智携手共创AI未来：共筑超大规模智算集群新篇章

协议，双方将携手步入全新的合作阶段，共同探索并开发面向超万亿参数大模型和 超大规模集群的高性能系统软件方案，标志着双方在推动 AI技术边界、加速产业智能化进程上迈出了坚实的一步。

发表于07-05 14:50 • 477次阅读

Arm计划2025年大规模销售AI芯片

软银集团旗下的英国芯片巨头Arm近日公布了其雄心勃勃的 AI 芯片销售计划。该公司宣布，计划到2025年实现 AI 芯片的

发表于05-20 10:48 • 471次阅读

超大规模数据中心采用三星FDP SSD降低存储成本

主机数据放置技术一直是 超大规模数据中心关注的话题，因为它影响所部署的SSD的总体拥有成本（TCO）。

发表于03-07 15:39 • 1277次阅读

<b class='flag-5'>超大规模</b>数据中心采用三星FDP SSD降低存储成本

晶晟微纳发布N800超大规模AI算力芯片测试探针卡

近日，上海韬盛科技旗下的苏州晶晟微纳宣布推出其最新研发的N800 超大规模 AI算力芯片测试探针卡。这款高性能探针卡采用了前沿的嵌入式合金纳米堆叠技术，旨在满足当前 超大规模

发表于03-04 13:59 • 662次阅读

中国电信规划在上海建设首个国产超大规模算力液冷集群

中国电信规划建设首个国产 超大规模算力液冷集群人工智能技术的快速发展催生了巨大的算力需求；中国电信规划在上海规划建设可支持万亿参数大模型训练的智算集群中心。其中会搭载液冷技术，单池新建国产算力达10000卡，也是首个支持单池万卡

发表于02-22 18:48 • 1202次阅读

易鼎丰与国芯科技签署战略合作协议

近日，天津易鼎丰动力科技有限公司（简称“易鼎丰”）与苏州国芯科技股份有限公司（简称“国芯科技”）正式签署战略合作协议。双方将共同致力于汽车核心芯片

发表于01-24 17:02 • 739次阅读

6G超大规模多天线的技术演进历程

从3G到5G时代，天线规模发生了显著的变化，5G 超大规模天线技术具有许多优势，但面向6G的极致性能要求还需持续演进

发表于11-21 09:19 • 616次阅读

超大规模体系结构系统监视器用户指南

德赢Vwin官网网站提供《 超大规模体系结构系统监视器用户指南.pdf》资料免费下载

发表于09-14 11:12 • 0次下载

基于超大规模架构的FPGA存储器IP

德赢Vwin官网网站提供《基于 超大规模架构的FPGA存储器IP.pdf》资料免费下载

发表于09-13 17:31 • 0次下载

利用超大规模GTH收发器实现SMPTE SDI接口应用说明

德赢Vwin官网网站提供《利用 超大规模GTH收发器实现SMPTE SDI接口应用说明.pdf》资料免费下载

发表于09-13 11:09 • 4次下载

满足AI和超大规模数据中心等高容量需求的芯片问世，具备两种增益控制模式

崭新的选择。据了解，该芯片可以满足不断增长的带宽需求，尤其是 AI和 超大规模数据中心等高容量、低功耗需求的应用场景下。该芯片是一款高度多功能的

发表于09-08 09:52 • 416次阅读

超大规模数据中心的优势和面临的挑战

从本质上来说，数据中心是为 大规模运行而设计的，通常容纳数十个(如果不是数百个)物理服务器和虚拟机。 超大规模数据中心本质上是一个更高的级别，它可以支持数千台服务器和数百万个虚拟机。 超大规模数据中心可以

发表于09-08 08:29 • 736次阅读

搜索历史

AI驱动的国产硬件仿真芯神鼎如何加速超大规模芯片设计

评论

超大规模集成电路（VLSI）中不可或缺的5种二极管

如何利用低功耗设计技术实现超大规模集成电路（VLSI）的电源完整性？

SAS 24G+规范发布,为超大规模数据中心HDD和SSD

燧原科技与清程极智携手共创AI未来：共筑超大规模智算集群新篇章

Arm计划2025年大规模销售AI芯片

超大规模数据中心采用三星FDP SSD降低存储成本

晶晟微纳发布N800超大规模AI算力芯片测试探针卡

中国电信规划在上海建设首个国产超大规模算力液冷集群

易鼎丰与国芯科技签署战略合作协议

6G超大规模多天线的技术演进历程

超大规模体系结构系统监视器用户指南

基于超大规模架构的FPGA存储器IP

利用超大规模GTH收发器实现SMPTE SDI接口应用说明

满足AI和超大规模数据中心等高容量需求的芯片问世，具备两种增益控制模式

超大规模数据中心的优势和面临的挑战