1
完善资料让更多小伙伴认识你,还能领取20积分哦, 立即完善>
多核技术正成为PC产业谈论的焦点。事实上,为了应对成本、上市时间和复杂多变技术带来的挑战,现实中的嵌入式 SoC设计已经大量采用了多核架构,远远地走在了前面,例如IBM为索尼PS3游戏机定制的Cell就是一枚拥有9个处理器核心的多核处理器。如果你和处理器内核供应商Tensilica公司总裁兼首席执行官Chris Rowen博士谈谈这个话题,他会很自豪地告诉你,思科最先进CSR-1路由器的核心——硅包处理器(Silicon Packet Processor)内集成了188颗Tensilica的可配置处理器内核。从最初的可配置处理器内核到最近推出的标准处理器内核,Tensilica始终顺应和推动着多核SoC设计的发展潮流。
一直以来,通用CPU+硬件逻辑(硬件加速器或协处理器)是嵌入式SoC的主流架构。通用CPU来自ARM和MIPS这类通用内核授权商,而硬件逻辑由SoC设计者通过RTL开发实现。后者是对前者的补充,因为通用CPU在需要大量数据处理的应用中速度仍然太慢,同时I/O数与计算带宽往往不够。但RTL开发也有自身的弱点,开发周期长,灵活性差,难以适应复杂多变的技术发展趋势。以手机为例,各种音频(WMA/MP3)、视频(MPEG-2/4、H.264、VC-1)以及无线(蓝牙、Wi-Fi、ZigBee、GPS、UMTS等)标准和技术涌入,RTL开发难以应对。 |
|
相关推荐
2个回答
|
|
Tensilica平台崭露头角
20世纪末,Tensilica推出了革命性的可配置处理器内核Xtensa,替代音频、视频、包处理、存储网络处理、图像处理和加密等RTL开发,用作协处理器,与ARM或MIPS核互补。通过Xtensa,设计人员能够配置并扩展处理器的存储、外围设备和特殊功能,以适合特定应用。Rowen表示:“如果应用和功能确定了,相比通用处理器,可配置处理器在性能和功耗效率方面有几十倍的提升。”据介绍,Xtensa在全球有超过85个客户和200个设计,其中有超过80个设计被用于大量出货的主流产品,包括手机音视频、打印机影像处理、移动电视和VDSL/VDSL2 Modem等,客户既有思科、索尼、NEC、LG、佳能、爱普生和NTT等领先OEM,又有ST、国半、Broadcom、科胜讯、ATi和赛普拉斯等知名芯片供应商。 不过,Tensilica并不满足用于大数据量处理的协处理器应用,又在今年2月宣布推出“钻石”(Diamond)系列标准处理器内核,包括从面积紧凑的低功耗通用控制器到高性能DSP等6款现货供应的可综合内核,直接与ARM和MIPS核竞争,与原有的Xtensa产品线互补。Rowen指出,如果客户不能够确定应用或者不需要很高的性能,就不需要可配置处理器,需要标准处理器。除了市场需求外,Tensilica在Xtensa架构上的成功,也为钻石的推出打下了基础。Rowen指出,“几年前,Tensilica还是一个年轻的公司,处理器结构尚未经验证,我们还不能开始这个产品线。如今,我们在众多市场领域拥有超过80家稳定客户群,而且主流的设计者一直要求其ASIC提供商提供Tensilica的标准处理器。基于Tensilica现有的上百个设计,我们相信预先配置好的这些内核将满足多种主要应用领域的需求。” 由于钻石系列标准内核基于通过验证的Xtensa可配置和可扩展处理器架构,因此也延续了其低功耗和高性能的特点。Rowen介绍说,正是因为如此,钻石系列非常成功,“若以感兴趣的客户数量来衡量,钻石是Tensilica推出的最成功的产品”。自从发布后,Tensilica和很多以前从未接触的新客户商谈,平均每两周就会授权一个新的客户。Rowen强调说:“有好几个客户都是直接从ARM和MIPS平台转向Tensilica平台,甚至有客户从最初接触到最后完成软件代码从ARM到Tensilica的移植和硬件布局布线,只花了一个月的时间。有一些客户顾虑软件移植性的问题,担心在ARM和MIPS上写好的软件,移到新的平台上会有问题,这可以理解。事实证明,这对我们来说不是问题,不少客户都在这样做,而且发现很容易做。”7月初,Tensilica宣布,韩国PnpNetwork获得两款钻石内核的授权,用于移动电视芯片设计,其中,Diamond 330HiFi用于音频处理,Diamond 212GP作为芯片的控制处理器。由于一项新产品发布后通常需要半年以后才会释放出影响力,对于钻石系列来说,这只是故事的开始。 对于中国市场来说,可配置处理器是一个新生事物,需要一个接受的过程。相比较而言,简单易用、性能强大和“攻击性定价”的钻石标准内核却迅速引起了不少中国厂商尤其是IC设计公司的兴趣。这也是因为钻石系列的特点是低功耗和高性能,特别适合消费电子和多媒体应用,尤其是移动多媒体应用,而中国消费电子和多媒体应用市场巨大,不少本地IC设计公司从事该领域。为此,钻石系列发布后不到半年时间里,Rowen两次来中国,和中国企业商谈合作。Rowen表示:“与ARM和MIPS相比,我们进入中国的时间较晚,不如他们知名,我们将扩大在中国市场的存在。”Tensilica目前在中国设有代表处,并考虑在上海设立新的办事处,增加更多的员工和资源。另外,Tensilica将和更多本地厂商建立合作伙伴关系,构建完整的生态系统,目前Tensilica已经宣布和创意电子、中芯国际和台积电等本地厂商达成了战略合作。 Rowen介绍说,Tensilica未来有四大发展方向,一是开发可配置性更强、性能更好和更容易配置的Xtensa核;二是推出更多多媒体解决方案,HiFi音频方案已经齐备,很快将是视频方案;三是完善系统开发工具,使设计更加自动化,更容易进行任务划分、编程、配置和多个内核协同仿真等;四是推出更多预先配置好的钻石内核。 |
|
|
|
多内核、多线程和多发射之争
Tensilica的钻石标准内核与ARM、MIPS性能对比 由于可配置处理器内核是一种精简核,面积和功耗很小,很适合多核应用。Tensilica介绍说,每个客户平均在一个SoC中使用约6个Xtensa核,多核可以取代RTL模块,实现设计灵活性和设计速度最大化。与Tensilica看好多核技术相反的是,MIPS强调多线程的优势,并认为是未来处理器的发展趋势。曾作为MIPS公司创建者和MIPS微处理器开发副总裁的Rowen表示:“多线程不是一个正确的方向,多核才是。” 他指出:“多线程内核(Multi-threaded core)的优点是当一个线程因存储而停止时,处理器可以执行其它线程。不过,多线程会大大增加处理器面积和功耗。对于单个线程的性能、内核成本和功耗并无好处。只有存在多个线程时,才适用——最好是多个线程执行相同的任务,比较容易设计,例如网络处理器中同行处理很多包。”Tensilica中国区总经理李冉补充说,多线程一个的挑战是,编程和调试非常复杂,尤其是多个线程执行不同的任务时,如何将任务动态划分,非常复杂。与此同时,一般工程师都习惯于单线程编程,当前又没有很好的编译器和调试器,所以目前还没有多线程处理器能够很智能地进行任务划分。 Rowen总结说:“多线程要花费很大的力气,但收益并不大,因为多线程在物理上还是同一时间只有一个线程,它的极限是一个周期执行一个指令。”相反,Rowen指出,多核架构可以将非常复杂的任务分解到多个内核中,而且在嵌入SoC设计中,任务划分不是问题,因为不同的核承担不同的任务,已经预先定义好,是一种静态划分,相对简单。Rowen强调说:“由于不同的内核可以执行不同的线程,多核架构在一个周期内可以执行多个指令。”不过,如果内核比较大,多核架构成本会倍增,不太适用。当然,这对Tensilica不是问题,因为Tensilica的内核十分精简,尺寸非常小。李冉补充说,事实证明当内核的时钟频率超过200Mhz后,其布局布线后得到的面积和功耗成指数增长,所以多核一定是未来的发展趋势。 此外,ARM和Tensilica都采用了超标量架构,也就是所谓的多发射核技术(Multi-issue core),它可以在一个周期内执行多个操作,为单个线程提供最高性能。和多线程类似,它的缺点也是附加的执行单元不能得到完全利用,增加了内核面积和功耗。不同的是,多发射可以在一个周期内执行多个指令,而且由于是单线程,编程简单。 为了比较多线程、多发射和多核的性能差异,Rowen举例说,单发射内核钻石212GP的面积约0.7mm2,对应的单线程内核MIPS 24K的面积为2.8mm2,都是约0.7个指令/周期;多线程单发射内核MIPS 34K的面积达4mm2,也只有约0.8个指令/周期;而多发射内核570T面积只有1.6mm2,能达到1.2个指令/周期;如果是多内核架构,将4个钻石212GP放在一起,面积也只有2.8mm2,却高达2.8个指令/周期。 |
|
|
|
只有小组成员才能发言,加入小组>>
小黑屋| 手机版| Archiver| 德赢Vwin官网 ( 湘ICP备2023018690号 )
GMT+8, 2024-12-21 15:28 , Processed in 0.629723 second(s), Total 78, Slave 60 queries .
Powered by 德赢Vwin官网 网
© 2015 bbs.elecfans.com
关注我们的微信
下载发烧友APP
德赢Vwin官网 观察
版权所有 © 湖南华秋数字科技有限公司
德赢Vwin官网 (电路图) 湘公网安备 43011202000918 号 电信与信息服务业务经营许可证:合字B2-20210191 工商网监 湘ICP备2023018690号