本文首先简要介绍了充满奇想的航天时代,在此基础上,从统一的体系结构模型,虚拟的并行计算阵列与仿生的物理实现技术三个方面,讨论了天基嵌入式MPP图像处理技术的功能,结构与物理实现问题。
充满奇想的航天时代
1961 年4月12日,苏联宇航员加加林乘“东方”1号载人飞船,开创了充满奇想的航天时代,至今已有499名宇航员圆了飞天之梦,12名宇航员圆了登月之梦。 21世纪,美国采用载人飞船不仅要在月球上建立基地,而且要完成载人火星探测。不仅如此,人们还瞄准了太空游,充满好奇心的美国人的蒂托(2001)、奥尔森(2005),南非的沙特尔沃斯(2002)和美籍伊朗人安萨里(2006)4名富翁,花了2000万美元在国际空间站住了8天,环绕地球120周,完成了轨道式的太空游;第5名太空游的富翁将是软件奇才美籍匈牙利人希莫尼。
正如瑞典的物理诺贝尔奖评委会主任Sune Svanberg 所说的,“一个好的科研成果有时候就来自一个灵机一现的想法,而不是像培养运动员那样机械式的训练。诺贝尔奖鼓励好奇心驱使下的自由自在的研究。”碳纳米管能承载比自身重5万倍物体的特殊性能,使人们现在又产生了灵机一现的研制太空天梯的奇想,估计要50年后才会成功。
航天时代不仅促进了运载火箭技术,应用卫星技术与深空探测技术的迅猛发展,而且也使地基因特网发展成了天基太空网,延伸到了1亿2千万公里的火星,促进了天基嵌入式图像处理技术等航天微电子应用技术的迅猛发展。
嵌入式图像处理技术
天基嵌入式图像处理技术的特点有:一是嵌入性,也就是体积、重量与功耗的要求很高;二是复杂性,要处理G级的像素帧;三是可靠性,要求适应恶劣的工作环境,寿命长;四是实时性,一般要求秒级的计算时间。为了实现这些特点,需要从航天嵌入式计算机的功能、结构与物理实现三个方面进行研究。
(1)统一的体系结构模型
为了同时满足能提高芯片集成度与缩短设计周期的要求,以IP核为基础的设计平台技术以及从功能到体系结构的协同设计方法得到了发展。由于非控制流的计算机体系结构复杂、效率低,现在的计算机体系结构都采用控制流的体系结构,按照我们提出的计算机体系结构的分类模型,控制流的体系结构可分为三类:一是基于指令流的体系结构,也就是以微处理器为代表的体系结构,按照 Flynn采用指令流与数据流两个逻辑概念的分类共有SISD、SIMD、MISD、MIMD四种体系结构;二是基于数据流的体系结构,也就是以ASIC(例如Systolic array)电路为代表的体系结构,因为它只有数据流的概念所以只有SD与MD两类,由于ASIC 电路效率虽然高,但为了克服没有处理器灵活这个缺点,又出现了静态可编程FPGA电路;三是基于构令流(Configuration Stream)的体系结构,通常叫做可重构的(Reconfigurable)体系结构,也就是动态可编程电路,共有SCSD、SCMD、MCSD、MCMD四类。
这些按逻辑概念分类的体系结构可以组合起来使用,其选择方案可以有1023种。就具体实现而言方案更多,例如,不同厂家的处理器的指令集合都是不相同的。
而功能与体系结构的协同设计,是通过功能到体系结构的映射完成的,为了确保这种映射的高效与统一,提出了一种统一的体系结构模型,从三个方面对体系结构进行了统一:一是提出了一种Unified _ISA模型,如图1所示,能将上述三种体系结构从指令集合上统一起来;二是提出了一种将高级语言与汇编语言折中的中间映射语言,能将高级语言的兼容性和可读性,与汇编语言的程序高效性和映射直接性统一起来;三是通过中间映射语言的编程,能将软构件与硬构件的设计统一起来。
图1 Unified _ISA模型的逻辑概念图
具体对指令流体系结构来说,其SISD、SIMD、MISD、MIMD四类体系结构的指令子集合是统一成SISD体系结构的指令集合,对于数据流与构令流的体系结构是通过增加相应的指令,统一成SISD体系结构的指令集合的;换句话说,图1中的SIMD、MIMD、ASIC与RC Device四种 MPP Unit都是可以通过软构件描述的。这些软构件是可以在SIMD或MIMD体系结构上直接执行的,或者是可以自动映射成ASIC或RC Device电路的。
(2)虚拟的并行计算阵列
由于G级像素帧遥感图像处理的需要,MPP并行计算阵列得到了发展,因为图像帧总是二维的,相应的处理元阵列也是二维的,如图2中所示。虽然芯片集成度已经很高,但现在还不能在一块芯片上研制G级像素帧的G个处理元的阵列,现在还只有采用WSI技术完成的百万个处理元的阵列。因此,还只能采用虚拟处理元阵列技术,解决MPP程序设计的方便性与程序本身的可读性。换句话说,MPP图像处理程序是按虚拟并行计算阵列设计的,也就是MPP程序设计时,总是假定图 2中网格阵列的M与N的值是与图像帧的维数大小相等的,而实际的处理元阵列的大小m×n是远远小于M×N的,MPP程序是通过自动映射到实际的处理元阵列上执行的。针对图像处理算法的特点,图像处理的MPP计算阵列通常是按SIMD体系结构设计的。相应的设计问题有:处理元PE的位置表示与位置选择问题,采用PIM设计解决图像处理器与图像存储器之间的带宽问题,以及并行重采样问题。
图2 M×N的虚拟处理元阵列
(3)仿生的物理实现技术
对宇宙和大脑奥秘的渴望,激发了人类的太空之旅与人体之旅,使嵌入式计算技术从传统计算模式,发展到自主计算模式,走向了自然计算模式。传统计算的芯片实现技术现在已从单功能芯片发展到多功能的SoC芯片的新阶段,软件实现技术已从结构化程序设计,到面向Object的程序设计,到基于Component的程序设计以及到基于Agent的程序设计。
1956 年8月,约翰。 麦卡锡首次提出了人工智能(AI,Artificial Intelligence)的概念,当时他说:“机器会思想的时代不要20年就会到来”,但现在人工智能还处于初级阶段,只在“认知科学”和专家系统方面取得了成功,这说明了人工智能的艰难。人们估计从200X年到201X年将会步入 30nm的纳电子时代,机器人的自主移动操作、重力行走与气流发音,以及鱼眼镜头的拍摄等自主计算的仿生实现技术将会更加完善。自主计算的仿生实现技术目前主要是从利用模糊逻辑的推理能力、神经元网络的学习能力与基因计算的优化能力等方面展开研究工作的,而真正的挑战在于改变与重新定义计算硬件的性质。
在许多方面,人体是一种最有效的计算机,人体中的神经系统是由于纳(Na Sodium)离子与钾(K,Potassium)离子的运动,在大脑与遍布人体的神经中心之间传递信号,并由大脑解释与处理,从而支配人体活动的。人们估计从201X年到20XX年将会步入10nm的纳电子时代,促进量子计算的自组装技术,化学计算的DNA技术以及容错计算的神经元技术等自然计算的仿生实现技术的发展。特别是分子自组装技术,已经取得了实验室芯片 (ALM)等实用化的成果。
结束语
综上所述,我们从功能上提出了一种统一的体系结构模型,从结构上将设计一种能够有效支持虚拟并行计算程序设计的处理元阵列,从物理实现上将研究一种能支持自组装技术的设计平台。总之,SoC芯片、纳米制造与自主装技术等,将会进一步促进航天时代的嵌入式图像处理技术的发展。