基于FPGA的原型可满足不同目的需求
原型设计不是一个按几个按钮就能完成的过程,在它不同的阶段需要仔细的关注和思考。除说明这个过程需要完成的工作和涉及到的专业知识外,我们还应解释在 SoC 项目中该进行(或者不该进行)原型设计的原因。
在与原型设计人员多年交谈中,我们最常问到的一个问题是“为什么您这么做?”答案有多种多样,我们把它们总结成了表1中几条常见的理由。系统了解这些项目的目的和我们进行原型设计的原因,将有助于我们判断基于FPGA的原型设计是否能为我们的下一个项目提供帮助。
因此,让我们探究一下表1所述的目的以及基于FPGA的原型方法如何能帮助实现这些目的。
高性能与准确度
只有基于FPGA的原型才能提供正确测试设计各个方面所需的速度和准确度。我们把这个理由放在首位的原因是,虽然项目有许多需要实现的给定目的,但对需要进行原型设计的团队来说,这可能是所有理由中最根本的原因。举例来说,这个团队的目的可能是验证某些SoC的嵌入式软件,观察其在真实硬件上全速运行的情况,但使用原型的根本原因是为了确保高性能与准确度。我们在虚拟系统中可以在更高的性能水平下验证该软件,但我们无法达到使用真实的RTL所能实现的准确度。
实时数据流
难以验证SoC的原因之一是因为其状态取决于许多变量,包括其之前的状态、输入的次序以及更广泛的SoC输出系统效应(以及可能的反馈)。将SoC设计与系统的其他部分相连并以实时速度运行,可以让我们立即观察到实时条件、输入和系统反馈的变化带来的效应。
葡萄牙波尔图市Synopsys公司IP团队开发的HDMI原型中的实时数据流就是一个很好的例子。在本例中,高清(HD)媒体数据流经处理内核的原型输出到高清显示器上,如图1的方框图所示。
图1 HDMI 原型方框图
通过使用投片前的原型,我们可以立即看到和听到不同的高清数据在我们的设计上的效果,反之亦然。只有采用基于FPGA的原型方法才支持这种实时数据流,不仅给此类多媒体应用带来极大好处,也能给许多其他要求对输入数据流做出实时响应的应用带来诸多裨益。
软硬件集成
在上述实例中,读者可能已经注意到原型使用了一块小型MicroBlazeTM CPU,并备有外设和存储器,从而体现了一个 SoC的所有常见模块。在这个设计中,运行在CPU上的软件主要用于加载和控制A/V处理。然而,在许多SoC设计中,软件最耗精力。
鉴于软件已成为SoC开发工作的主体部分,软件工作在项目日程中占据关键位置越来越常见。当SoC能够有效达到量产标准的时候,决定项目实际完成日期的是软件开发和验证工作。在这种情况下,系统开发团队如何才能提升软件开发和验证工作的效率呢?要回答这个问题,我们需要查看软件开发团队把时间都花在什么地方。
为软件开发建立SoC的模型
软件由于自身的复杂性,很难做到完美。对我们在日常使用计算机的过程中遇到的软件升级、服务包和漏洞修补的情况,我们都已经司空见惯。但是,具体到嵌入 SoC 中的软件,这种无休止的软件改进方法就遇到了障碍。另一方面,相比于通用的计算机软件而言,与嵌入式软件互动的系统,其设定的使用模式和环境条件都更容易确定。而且,为较简单的系统开发的嵌入式软件可以比较简单,也就更易于全面验证。举例来说,控制车辆子系统或电子玩具的SoC比在实时操作系统(RTOS)上运行许多应用和流程的智能手机更容易进行全面测试。
如果我们更加仔细地观察运行在这类智能手机上的软件,例如图2所示的Android软件,我们可以看到一种多层布置,这称为软件协议栈。
图2 Android软件协议栈
在观察软件协议栈时,我们会发现,协议栈的最底层——也就是那些最接近硬件的部分,主要是为了满足将软件映射到SoC硬件上的需求。这就需要对硬件有绝对的了解,甚至包括地址和时钟周期等。软件协议栈最底层的设计人员往往称自己为平台工程师,他们的工作就是准确描述硬件,以便协议栈的更高层次能够识别和重复使用。这种描述被某些 RTOS厂商称为板支持包(BSP),与我们日常使用的 PC 的基本输入/输出系统(BIOS)类似。
协议栈从下往上第二层包含 RTOS的内核以及将较高层次的软件与被描述的硬件相连的必要驱动程序。在这些协议栈的最底层中,平台工程师和驱动程序开发人员需要在真实的SoC或完全准确的SoC模型上验证他们的代码。这个层面的软件开发人员需要全面了解各时钟周期软件的行为。
作为软件开发人员的另一极,在协议栈的顶层,我们可以看到用户空间,在这里可以同时运行多个应用,比如像智能电话中的联系人管理器、视频显示器、互联网浏览器和实际呼叫的电话子系统。这些应用中的每一个都不能直接访问SoC硬件,而且实际上在某种程度上违背了所有硬件考虑事项。这些应用依赖运行在协议栈较低层的软件代表自己与SoC硬件及系统其他部分通信。
我们可以归纳为:在协议栈的每一层,软件开发人员只需要一个足够准确的模型来让自己的代码认为自己运行在目标 SoC上即可。超过必要的准确度只会让模型在vwin 器上的运行速度下降。实际上,任何层面的SoC建模,都要求我们把硬件和协议栈描述为比当前层面更低的一层,以便进行验证。而且在理想的情况下,我们应该只要求够用的准确度,以实现最高性能。
这种只为软件层提供“够用的准确度”的建模方法为不同的软件开发人员提供了多种不同的建模环境,供他们在SoC项目的不同阶段使用。可以采用SystemC这样的语言进行事务处理层面的建模,创建出一个准确度低但速度足够快的仿真器模型,用来同时运行许多应用。如果实时的真实数据的处理不是很重要,那么考虑采用虚拟原型方法比较好。
不过,必须完整运行整个软件协议栈或处理真实环境中的数据时,最适合采用基于FPGA的原型方法。
使用原型验证软件的实例
只有采用基于FPGA的原型方法才能够打破建模方法中准确度与性能之间内在的相互牵制关系。采用FPGA,我们既能实现实时的速度,又能以完全的RTL周期精度建模。这样,单个原型不仅能供低层软件验证要求的准确模型使用,又能供高层应用开发人员需要的高速模型使用。实际上,整个SoC软件协议栈都可以在单个基于FPGA的原型上建模。德克萨斯州奥斯汀市Freescale Semiconductor公司移动产品部的Scott Constable及其团队开展的项目就是采用FPGA验证软件的一个很好的例子。
Freescale非常想加快SoC开发进程,因为手机市场上产品生命周期短,需要产品尽快打入市场。这不仅是为了赢得竞争,也是为了避免迅速过时。通过分析流程中耗时最多的环节,Freescale发现通过加快手机3G协议测试工作可以带来最明显的效果。如果测试工作能够在流片前完成,Freescale就可以将项目时间缩短数月。与通常只有一到两年的产品生命周期而言,这非常重要。
协议测试是一个复杂的过程,就算以较高的实时速度进行,也需要一天才能完成。采用FPGA是因为这是实现必要的时钟速度,及时完成测试的唯一途径。
协议测试需要开发产品的各种软件特性,包括硬件驱动程序、操作系统和协议栈代码。虽然如前所述主要的目的是协议测试,通过使用 FPGA,所有这些软件开发工作都能够在流片前完成,从而大大加快各种最终产品的开发进度。
Freescale构建了一个多芯片系统的原型,其中包括一个双核MXC2基带处理器和一个RF收发器芯片的数字部分。基带处理器内置一个用于调制解调器处理的Freescale StarCore DSP内核、一个用于用户应用处理的ARM 926内核,以及 60多个外设。
Synopsys HAPS-54原型板用来实现原型(如图3所示)。该基带处理器有500多万个ASIC门,Scott的团队使用Synopsys Certify工具将其在原型板上划分给3个赛灵思Virtex-5 FPGA,同时把数字RF设计布置在第四个FPGA中。Freescale 决定不构建模拟部分的原型,而是直接从Antritsu协议测试盒中以数字形式提供移动网络数据。
图3 Freescale的SoC设计在HAPS-54原型板上的分区
较早的内核使用的某些设计技术对ASIC来说非常有效果,但对FPGA来说却不太好用。另外,RTL的一部分是从系统级设计代码中自动生成的,由于其过于复杂的时钟网络,对FPGA来说也是相当不利的。因此,必须对RTL进行一些调整,使其更加兼容FPGA,这样做的成效非常显著。
仅在完成首个芯片后一个月,Freescale团队就成功地从这个系统中拨出了第一个移动电话呼叫,把产品开发进度缩短了6个多月,这非常具有里程碑式的意义。
这个例子说明基于 FPGA的原型方法能够给软件开发团队提供什么样的增值工具,能够在产品质量和项目进程方面带来怎样显著的回报。
接口优势:测试真实条件下的数据效应
很难想象有这样一种 SoC 设计可以不遵守输入数据、处理数据、生成输出数据的基本结构。实际上,如果我们深入SoC设计,就会发现无数的子模块遵循着同样的结构,直到单个门级。
要在这些层级中的每一个层级验证正确的处理,要求我们提供完整的输入数据集,并观察处理结果的输出数据是否正确。对单个门来说,这个工作很简单,对小型 RTL 模块来说,也是可能的。但随着系统日趋复杂,从统计上来说基本没有可能确保输入数据和初始条件的完整性,尤其是在有软件运行在一个以上的处理器的时候。
最后一点非常重要,因为不可预测的输入数据能扰乱所有的SoC系统,即便是精心设计的关键SoC设计也难以幸免。与新输入的数据或者输入数据不寻常的组合或序列相结合的,是非常多的SoC 可能的前置状态,可能会使SoC处于某种无法验证的状态。当然,这种情况不一定是什么问题,SoC可以在无需系统的其他部分干预的情况下恢复,或者用户根本就没有察觉。
但是,不能验证的状态必须在最终芯片中避免,因此我们需要尽可能全面地测试设计的方法。在设计的功能仿真过程中,验证工程师会采用有力的方法,比如受约束随机激励和高级测试工具来完成多种测试,旨在达到可接受的测试覆盖面。但是,完整性仍受验证工程师选择的方向和给定的约束条件的限制,并受限于可用于运行仿真的时间。结果虽然受约束随机验证永远不可能穷尽,但能够大大增强我们已经测试了所有输入的组合(包括可能的输入和极端情况输入)的信心。
对实验室可行性实验的优势
在项目的初始阶段,需要对芯片拓扑、性能、功耗以及片上通信结构做出基本决策。部分决策采用算法或系统级建模工具便可良好执行,但也可以采用 FPGA 进行某些额外的实验。这是否是真正基于FPGA的原型设计呢?我们正使用 FPGA进行某个概念的原型设计,但这与使用算法或数学工具不同,因为我们需要某些可能是由这些高级工具生成的 RTL。一旦进入FPGA,就可采集早期信息帮助推进算法和最终SoC架构的优化。基于FPGA的原型为项目该阶段带来的优势是,可使用更准确的模型,而且这些模型的运行速度非常快,能够与实时输入互动。
这种类型的实验性原型值得一提,因为它们是在全面的SoC项目中使用基于FPGA的原型设计硬件和工具的又一途径,可为我们的投资带来更高的回报。
在实验室外使用原型
基于FPGA的原型设计可用于验证SoC设计的一个真正独到之处,是其独立工作的能力。这是因为FPGA可通过闪存EEPROM卡或其他独立介质进行配置,无须主机PC管理。因此该原型不但可独立运行,而且还可用于各种环境下的SoC设计测试,这与其他建模技术(如需要依赖主机干预的仿真)提供的环境俨然不同。
在极端情况下,原型可以完全从实验室中取出,用于现场真实环境中。比如将原型安装在开动的车辆上,研究设计对外部噪声、移动、天线场强等条件变化的依赖性。比如,本文作者就曾将移动电话的基带原型安装在车辆上,通过公共GSM网络在移动中拨打电话。
芯片架构师与其他产品专家需要与早期客户互动,展示其算法的重要特性。基于FPGA的原型设计在项目极早期的这个阶段可能是非常关键的优势,但这种方法与主流SoC原型设计略有不同。
基于FPGA原型的不足
我们撰写本文的目的是公正地看待基于FPGA的原型的优势与局限性,因此在前面谈及各种优势之后,我们将在下面介绍部分局限性。
首先最重要的是,FPGA原型不是RTL模拟器。如果我们的目的是编写一些RTL,然后尽快在FPGA中实施,以查看它是否能工作,那么我们应该重新思考所忽略的东西。FPGA对运行RTL“模型”来说确实是一种速度更快的引擎,但当我们开始设置该模型的时候,速度优势就会大打折扣。此外,模拟器的仪表盘部分能够完整地控制激励和掌握结果。我们应该思考仪表化FPGA的方法,深入了解设计的功能性,但即便是在这方面最完善的设计,也只能提供一部分真正能用于 RTL 模拟器仪表盘的信息。因此,该模拟器是用于重复编写和评估RTL代码更加理想的环境,因此我们应该等到模拟基本完成后,RTL相当成熟后才能将其交付给FPGA原型设计团队。
基于FPGA的原型不是ESL
Synopsys的Innovator或Synphony等电子系统级(ESL)工具或算法工具可在SystemC中完成设计,或通过预定义模型库进行构建。然后,我们不但可在相同的工具中模拟这些设计,而且还可深入了解其系统级性能,包括运行软件,在项目初期阶段进行软硬件权衡。
使用基于FPGA的原型方法,我们需要RTL,因此它不太适合研究算法或架构,因为这两者通常不采用RTL方式表达。对软件来说,FPGA原型设计的优势是在当 RTL 成熟得可以构建硬件平台的时候,软件可在更加准确以及更加真实的环境中运行。对那些具有天马行空想法的人来说,可以编写少量RTL在FPGA上运行,进行可行性研究。这是一种极少而又非常重要的FPGA原型设计的使用方法,但别把它和整个SoC的系统级或算法研究混淆在一起。
持续性是关键
优秀的工程师往往会为其工作选择适当的工具,但应该随时有一种方法可以将半成品交给他人继续完成。我们应该能够在尽量不增加工作量的情况下,将来自ESL模拟的设计移交给基于FPGA的原型。此外,部分ESL工具还可通过高层次综合实现设计,生成RTL供SoC项目整体使用。基于FPGA的原型能够接收该RTL,并以高周期精度在电路板上运行。但我们需要再次等到RTL相对稳定下来,这需要等到项目软硬件分区和架构研究阶段完成后。
采用FPGA进行原型设计的原因
当前SoC是从算法研究人员到硬件设计人员,乃至软件工程师和芯片布局团队等众多专家的工作结晶,在项目不断发展的同时,各类专家也都有自己的需求。SoC项目的成功很大程度上取决于上述各类专家所使用的硬件验证、软硬件联合验证以及软件验证的方法,基于FPGA的原型设计可为每一类专家带来各种不同的优势。
对于硬件团队而言,验证工具的速度可对验证吞吐量产生巨大的影响。因此一些团队采用基于FPGA的原型为这种硬件测试提供具有更高性能的平台。例如,我们可以在近乎实时的条件下运行整个操作系统的引导程序,节省需要花上数天才能达到相同目的的模拟时间。
对于软件开发团队而言,基于FPGA的原型可为目标芯片提供独特的流片前模型,能够在开发接近尾声时高速、高度准确地进行软件调试。
对于整个团队而言,SoC项目的关键阶段是在软硬件初次结合的时候。硬件将由最终软件执行,而执行方式可能是单纯硬件验证方案难以预见或预测的,从而最终将出现新的硬件问题。这在多核系统中或者在那些运行同步实时应用的系统中特别普遍。如果这种软硬件的采用要等到第一个器件制造完毕后,那么毫不夸张地说,到那时再发现新的缺陷就不太好了。
评论
查看更多