工业人工智能及应用研究现状及展望
来源:《自动化学报》,作者李杰等
摘 要 工业4.0 将工业制造流程以及产品质量优化从以前依照经验和观察进行判断转变为以事实为基础,通过分析数据进而挖掘潜在价值的完整智能系统.人工智能技术的快速发展在工业4.0 的实现中扮演着关键的角色.然而,传统的人工智能技术通常着眼于日常生活、社会交流和金融场景,而非解決工业界实际所遇到的问题.相比而言,工业人工智能技术基于工业领域的具体问题,利用智能系统提升生产效率、系统可靠性并优化生产过程,更加适合解决特定的工业问题同时帮助从业人员发现隐性问题,并让工业设备有自主能力来实现弹性生产并最终创造更大价值.本文首先介绍工业人工智能的相关概念,并通过实际的工业应用案例如元件级的滚珠丝杠、设备级的带锯加工机与机器群等不同层次的问题来展示工业人工智能架构的可行性与应用前景.
关键词 工业人工智能,智能制造,自动化,工业4.0
目前,很多国家正积极发展着眼于工业4.0 的智能制造技术,许多领域的龙头公司均通过投资和科研来开发其核心方法即人工智能技术.在2017 年,加拿大首开先例宣布政府将以12.5 亿加币投资人工智能[1].同年的七月,中国发表了次世代人工智能发展计划,以1 500 亿人民币的投资来帮助国内人工智能产业的发展,以期在人工智能方面占领一席之地[2].次年8 月,德国推行5 点数字策略期望在2025 年成为人工智能的领军者[3].2019 年二月,美国政府推行了类似的人工智能政策来刺激产业发展[4].工业人工智能也体现在流程工艺上,如钢铁或炼油制造产业等.从零部件级到设备端的预测维护均有相应的研究成果,以石油业为例,石油管线衰退评估是个重要的课题,其中管线孔蚀现象是最主要、影响最大的损坏机制,孔蚀的成长性与不确定性让衰退预测变得更为困难,为了可以良好地评估管线内部侵蚀的情况,如何用一个好的衰退模型对孔蚀作预测是主要的研究方向.在分析的方法上,可以分成基于物理模型和数据驱动这两大类,而传统基于物理模型虽能在长期预测上有一定的优势,但是其根本是简化的物理公式或假设,对于例如管蚀这种复杂且高度不确定的机制会较为困难,数据驱动模型则可以较好地处理这类问题[5].在更高层级的平台整合或是工业人工智能应用层面,也有相关企业正着手进行研究,例如埃克森美孚持续的改进自有的全球资讯系统,在标准化、安全化或是生命周期评估等方向上都有相应成果,同时也在改进生产排程、工程应用工具等方面有相关研究[6].今年埃克森美孚与CPLANE.ai 公司宣布将携手合作进行工业协作,在环境法规日趋严格与开采成本提高的情况下,将会对其发展有着重要的影响.另一方面,我国的首钢钢铁也有相应的工业人工智能应用在流程工艺上成功的案例,通过智能平台可以用少量的技工调控其所有的炼钢炉,同时也能回收在制造过程中产生的90 %废弃物和废水,实现每年九百万吨以上高品质钢铁的产出.
对于基于智能技术的工业4.0 来说,这些措施都促使工业界产生前所未有的转变,智能工厂所装备的智能感知器在各个生产过程中产生大量的数据,因此数据变成增强产业竞争力的重要关键[7].通过实时数据分析来为决策者提供更全面的信息来做决策、提高生产效率、预测生产需求、自动化制造与库存品优化[8].然而,根据现行的工业4.0 技术,数据处理过程仍需人类专家的介入来做决策,人工智能方案通常要能满足及时决策与最少的人员介入的目标[9−10].因此,智能制造需要结合工业互联网[11]、大数据分析[12]、云端计算[13]与网络实体系统[14]等技术来实现弹性且有效率的数据处理.
即使有着诸多优势,产业界仍对这样的方案存有疑虑,主要的原因是对于同样的问题,工程师在使用不同的算法会给出不同的方案,而这样的情况会违反三个必须的特征:系统性、快速性与可继承性.
另一方面,人工智能应用的主要成功来自于图像处理、自然语言处理、社群网络、机器人等方面,在工业环境下的制造设备所产出的数据架构和形式与前述大不相同,造成可应用性的局限[15−19].
其次,尽管部分产业已开始进行相关工作,但缺乏全面的技术蓝图与架构来有效地结合自身的发展策略.
第三个可能的原因是缺乏标准化的数据.目前,不同类型的机台所产出的数据大不相同,形式也有差异,造成数据不一致.
第四个原因是故障数据难以取得,这个是阻碍人工智能技术发展的主要原因之一.在具体场景中,工业界难以允许机台发生故障.另一方面,健康与故障的数据有时难以区分,这些因素都阻碍了人工智能技术的应用.
针对上述问题,如何有效利用人工智能完成实际生产应用的任务,是当前工业人工智能研究的热点问题之一.2006 年,Anghel 等基于极大极小概率回归模型,在实际数据上准确地预测出污染物排放中各气体浓度[20].2015 年,Min 针对遗传算法在供应链管理中的应用,回顾了以往的成功案例,提出了供应链管理中最适用于遗传算法的领域[21].同年,Hu 等通过多目标优化算法,实现轧制规程的优化,提高热轧带钢的产品质量[22].2018 年,Yang 等通过对文字数据的知识提取以及可视化处理提取到有用的信息并应用在汽车零部件数字化预装的质量改进[23].同年,Cupek 等针对传统方法难以准确预测小批量多变量生产的问题,采用了基于K 均值聚类的方法,实现了性能指标的自动估测[24].同年,Mundada等通过神经网络和vwin 退火算法准确预测出了不同磨铣作业的工件表面粗糙度[25].2019 年,Liu 等对钢带表面缺陷进行了研究,基于GoogLeNet,提出了可以用于实时分类的方法,并在6 种表面缺陷的钢带数据上实现了98.57%的准确率[26].2020 年,Kesse 等提出了一种智能化惰性气体焊算法用于帮助操作人员选择理想的系数从而达到良好的焊接质量[27].同年,Li 等提出了基于深度学习的寿命预测方法,并在实际生产中用于切割液晶屏的刀具上表现了较好的准确性[28].同年,Kalil 等建立了一个用在切削刀具上的磨损监测系统,通过对刀具的边缘图像处理,达到94.3%的磨损以及破碎检测率[29].
由于人工智能的实际应用需要一系列关键的基础技术与创新思维,李杰教授提出了一套系统性的方法来实现人工智能并命名为工业人工智能[30−33].工业人工智能由一套完整的技术体系与标准化方法架构所组成,其核心技术包含数据技术、分析技术、平台技术与运筹技术,Cyber physical system (CPS)的5C 架构则作为实现这个闭环过程的功能框架[30−34].
1 CPS 的5C 技术体系与方法架构
自从计算机的诞生以来,赛博空间与实体空间的组合快速成为人类日常生活不可或缺的一部分,从高度普及的家用电器到日益成熟的无人机,从发电站的调度安排到实时的人体机能监控,无不体现了赛博空间与实体空间的深度融合[35].而CPS 作为一种整合网络世界和物理世界的多维度的变革性智能技术体系[36],以大数据、网络与海量计算为基础,通过核心的智能感知、分析、挖掘、评估、预测、优化等技术手段,融合计算、通信与控制,做到以数据为模型驱动的自治和智能支持促进工业的智能化发展.如图1 所示,5C 作为CPS 在制造领域的架构为其在制造领域的开发和部署提供了完整的指导方针.5C 分别代表Connection (智能感知层)、Conversion (智能分析层)、Cyber (网络层)、Cognition (智能认知层)、Configuration (智能决策与执行层),具体含义如下:
图1 CPS 在制造领域的支撑技术[32-34]
Fig.1 Enabling technologies for realization of CPS in manufacturing[32-34]
1)智能感知层(Connection):如何以高效率和高可靠性来采集数据是在机器或是组件层面上的首要任务.如从数据的来源、采集和管理方式来确保质量和全面性,构建CPS 上层的数据环境基础.除结构环境和采集通道外,另一核心的概念是按照目标和分析的需求自动地选择所偏好的数据采集方式.
2)智能分析层(Conversion):在工业环境中,数据来源于各种不同类型的资源,这些代表着机器的不同状况,但必须将原先采集到的低价值数据转化为有意义且实际的信息.在这层中可以对数据进行特征工程、分类和优先级排列等工作来确保数据的可解释性,其中也包括对数据的前处理.
3)网络层(Cyber):即网络化的管理,网络环境中信息的融合和建模,将机台状况、周围环境与群体结合,包括精确同步、关联建模、变化记录、分析预测等以构建能够指导实体空间的分析环境.
4)智能认知层(Cognition):依据不同的需求进行数据评估与预测,与其他数据作比较,并能提供解决方案,同时结合数据可视化工具和决策优化算法工具为用户提供决策.
5)智能执行层(Configuration):依照目标的不同与前一层的分析结果,对决策进行优化,并将结果回馈给管理系统,使管理人员能基于信息做出正确的决策,保证时效性和管理的协同性.
在实际的工业领域中通过智能技术来发挥制造系统的最大价值需要系统化、结构化地建立信息世界和物理世界的纽带,找到对解决问题最重要的影响参数而不是盲目地积累数据,最终形成闭环优化.另一方面,如何在技术层面来执行CPS 架构则是另一重大课题.工业人工智能4 个核心技术中,平台与数据技术是工业智能化的首要条件,有效的数据连接与传输和成熟的平台技术是其系统实现的前提,分析技术是设备展现智能化的灵魂,而运筹技术是创造价值的关键,以下将对这4 个核心技术分别做讨论:
1.1 数据技术(Data technology)
工业人工智能的基础来自于数据本身,高质量的数据是成功的关键,为从设备中取得具有代表性且质量良好的数据,此类技术将着重在解决以下几类问题:
1)数据采集与传输;
2)数据的储存、管理与大量数据的实时处理;
3)边缘计算.
第一类的问题依靠传感器与通讯技术的进步,和工业数据的内在物理意义.为进一步了解设备特性,传感器的加装可以有效的获取具代表性的信息,在更为复杂且关键的工业过程如半导体产业更是如此.通过传感器来进行数据采集,而传感器的选择、位置安装、改良与研发应用都是在DT 数据技术层面中所要面对的关键问题.
传感器技术的长足进步也引发第二类问题,大量的数据考验着从业者如何去传输、储存、管理,因此需要先进的通讯技术和设备来进行稳定的传输.现行的设备与通讯技术大多可以满足其基本需求,常用的通讯协议包括MTconnect、Modbus 等.在数据管理和储存方面,应用云端和数据库技术来进行高效率的储存、搜寻和实时处理,并用当下热门的边缘计算来实现数据挖掘的实时性并节省储存空间.基于这些技术,此类关键问题着重于保证数据的稳定性和安全性,以及节省计算资源与储存空间.
1.2 分析技术(Analytic technology)
分析技术是工业人工智能的灵魂.分析技术用于发现数据的潜在模式、数据间的关系与制造本身的未被发掘的隐含信息,这些此前未被发现的信息都将为后续的决策提供依据.此外,其有用的分析结果可累积成为数据库,一方面可避免因人事变更或是流动造成其经验或是技能流失,另一方面,也可以提升产业的核心竞争力.分析技术主要着重在两个方面:
1)特征工程:数据预处理、特征提取、特征筛选
2)机器学习和模式识别
特征是对数据中有用信息的数学总结.特征工程在分析技术是重要的一环,通过数学方法来得到代表性的信息,如对时域或是频域进行特征提取方便后续的建模工作[37−38].在实现特征工程的过程中,首要考虑的是数据的可靠性.在采集数据的过程中,会有各种不确定性的因素存在,如不同来源信号的采样频率不同,以及采集过程中可能存在损坏点等问题,需要先进行预处理排除,以得到较好的数据进行分析[39−40].在完成提取特征的步骤后,往往会再进行特征筛选,进一步去除不必要、不相关的特征,只保留对分析目标有用的特征.在特征筛选中,最具代表性的主成分分析(PCA)与费雪准则(Fisher criterion)被广泛用在各工业场景.费雪准则主要对应分类问题,该方法通过对原始特征中的每一个特征来评价分类的有效性.接下来的步骤为模型建立,主要是用机器学习、模型识别算法来辨认数据潜在的模式并挖掘其中的关系.常用的算法如回归算法、分类、聚类、估计算法等,各自对应不同类型的问题与应用场景.目前热门的深度学习与迁移学习等技术也在诸多实际问题中取得了良好的成果.以上主要介绍的是特征工程中的手动特征提取.手动特征提取的局限性在于需要利用领域知识对特定问题从零构建特征.目前热门的深度学习与迁移学习等技术让自动特征提取在诸多实际问题中取得了良好的成果[41−51].自动特征提取能够根据不同的应用以及数据更有效率地建模,同时还能提供更好的模型表现以及预防数据泄露.通过深度学习实施的自动特征提取可以在几天内赶上以前人工花几个月甚至几年的工作成果,而且工业门槛更低,特征覆盖更全面,可以把大数据的优势应用在更多设备上建模.因此,对于从业人员来说,需要考虑的关键问题在于如何在不同的应用场景下选用适合的算法.
1.3 平台技术(Platform technology)
平台技术是其他技术的载体,在工业人工智能的架构下,其主要包含如下方面:
1)数据存储平台:数据的安全存储与快速检索;
2)智能计算平台:智能平台的计算能力、计算效率和可扩展性;
3)用户接口平台:用户接口和功能扩展.
云平台的应用可以帮助企业实现对于数据的统一管理的需求并支持不同客群的快速数据检索和信息共享[52].云平台可以解决ERP (企业资源计划系统)、MES (制造企业生产过程执行管理系统) 和SCM (供应商管理系统)等造成的信息隔离,从而对多来源信息进行有效管理[53−54].信息集中化更方便实现智能分析和快速部署算法,平行计算等核心技术可以大幅降低时间成本,提高计算效率.在这方面,先进的GPU 与TPU 技术提供了相关的解决方案,与串行处理的CPU 相比,GPU 拥有数以千计的处理核心,让其在并行运算上有极大的优势,而TPU又名张量处理器是一款可编程的AI 加速器,可用于加速模型测试过程所需的运算.
对于用户接口平台而言,良好的人机接口与可扩展功能有助于将数据与信息可视化,而设计友好的软件系统可以提高服务质量,平台接口的多样化,如个人电脑、手机、远程集控中心等,也有助增加用户粘性,进而生成新的商业生态.
1.4 运筹技术(Operation technology)
运筹技术的主要目的是分析结果转化成新的价值,客户基于有用信息做出决策,因此运筹技术是实现价值创造的最后一步.在工业人工智能领域,运筹技术可以帮助实现:
1)设备的自感知、自预测、自适应等功能
自感知、自预测与自适应是工业人工智能领域的重要课题,自感知所代表的具体意义为设备对于潜在故障有着自动预警的功能,在运行过程中由实时分析传感器所收集的数据,对系统本身与关键零组件的故障作诊断.自预测所代表的是基于侦测到的故障,对其严重程度作评价,并预测未来的使用寿命.自适应则是基于优化模型对设备本身进行保护,如降速运行等操作来避免实际的损坏和更加严重的事故发生.
2)弹性制造系统
弹性制造指的是面对生产过程中出现的突发状态可以弹性的调整,以保证生产活动的不间断进行.其特色是在实际生产发生变化的时候,可以基于智能优化计算并依照现场情况,对控制系统进行修正.
3)运维排程及优化
排程优化和设备维护是每个企业和工厂都需面对的考验,在这个部分,排程的优化和设计需要明确了解其状态和健康程度并安排相对应的生产和维修活动.
2 工业智能带来的新机会空间
生产系统中的问题大致可以分为可见的和不可见的问题.设备衰退、润滑不足、精准度损失、零件磨损以及资源浪费都是不可见问题中的常见问题.可见问题通常由不可见因素例如零部件故障、机器故障以及产品质量下降等因素累计而成.传统的人工智能技术注重于解决可见问题并试着取代在重复工作上人类专家的知识和判断.这些人工智能模型并没有帮助人们更好地理解和处理潜在的风险.另一方面,工业人工智能的系统实现可以帮助解决不可见的预测问题并通过避免并修复实现制造过程的无忧化.具体来说,工业人工智能可以被划为4 个机会空间如图2 所示:
图2 工业人工智能机会空间的4 个象限
Fig.2 The four quadrants opportunity space in industrial AI
1)第一个机会空间注重通过生产系统的持续改善与连续优化,解决生产系统中的可见问题.
2)第二个机会空间注重通过分析数据,挖掘新的系统知识以避免可见问题.
3)第三个机会空间是对数据线索、数据关联性和因果性进行深入挖掘,通过建立这些关系来实现不可见问题的显性化.
4)第四个机会空间注重在不确定的动态环境中寻找和弥补不可见的价值缺口,并减弱不可见因素的影响.
在此阶段,大多数制造企业都将重心放在改善第一和第二机会空间,可以解决可见问题.在第三和第四机会空间中,需要制造系统产业链闭环式的整合去优化系统的设计方面,进而避免不可见的问题.采用工业人工智能技术可以在生产中增强创造新价值的机会.例如,在机械刀片损坏后去替换的方法属于第一和第二空间,通过人工智能技术基于振动以及其他数据对机械刀片的寿命进行预测,在刀片故障前进行刀片更换的方法属于第三和第四空间.
3 工业人工智能的案例分析
3.1 零部件级别的案例分析
3.1.1 滚珠丝杠
滚珠丝杠是制造系统里需要高准确性的关键部件,任何潜在的损坏或是退化都会影响其效率和位置精度,甚至会影响到机台的控制精度或造成机台损坏,而其复杂的运动轨迹及安装位置的空间限制,让数据采集与分析变得非常困难.
实际上,在滚珠丝杠的衰退分析中,其预载损失是一种最常被观察到的现象,其分析方法可分为两大类,一为基于物理模型的分析方法,另一类则是数据驱动分析法.物理模型利用其损坏机理来推算轴承内环轨道损坏频率,但至今仍没有公认的公式可以用来分析,而数据驱动则是利用量测数据本身来预测其健康度,因此可以较为有效地应用在实际场景.
在实际的工业应用上,相关的制造商也开始搭建自己的工业人工智能系统,如图3 所示,在DT数据技术上,数据来源通常来自加装的加速度传感器与其内部的控制器,控制器本身可以提供转速和力矩数据等有用信息以供分析,AT 分析技术上会全盘比较不同的信号来源所产生的特征,并用特征工程对特征进行系统性的筛选提取,在模型建立上则是运用几种常见的算法,如:支持向量机、线性回归和高斯过程等算法来解决不同的任务,而为了实现早期诊断机台故障的目标,常用分类模型来对不同的衰退情况作分类,将衰退情况分为三大类:无衰退、些微衰退与完全衰退,接着再将三种不同的分类转换为健康指标,最后再依此指标预测寿命.
图3 滚珠丝杠维护系统工业应用架构图
Fig.3 Industrial application architecture of ball screw maintenance system
在PT 平台技术上采用云计算系统,用户将可通过手机应用程序线上读取当前滚珠丝杠的健康状态,查看如剩余寿命预测、润滑油量诊断和温度诊断等关键指标,进而通过OT 技术来进行决策.
3.1.2 齿轮箱
PHM 协会在2009 年承办的工业大数据竞赛,以通用工业齿轮箱为目标,通过振动加速度数据与齿轮箱本身的规格来进行故障诊断与估计如图4 所示.要求参赛者在没有任何故障标签的情况下,利用信号处理的方法与相关的背景知识来识别出故障部件、程度和模式.
数据集一共有560 个样本,每个样本各4 秒,包含3 个变量,2 个采样频率为66.7 kHz 加速度传感器装在输入输出轴的支撑板上,1 个每转10 脉冲的转速传感器装在输入轴上,三者同时通过采样得到.齿轮箱本身由正齿轮与斜齿轮组成,数据一共包含10 种工况,14 种故障模式.
以下将简述几种有效的诊断策略.在这次的比赛中,前两名皆来自美国辛辛那提大学智能维护系统中心(IMS)团队.冠军队伍提出了信息重组法,利用18 个带通滤波器组合来重建频谱并对特定的频域做特征提取,通过聚类来做工况区分且以HOLO系数雷达图对14 种故障进行分类,这个方法迭加了多个带通滤波器,在全局分析同时可以发现局部特征,对于模型建立提供了很好的帮助.
第二名的队伍则是采取了不同的策略,先对信号本身做常见的时域与频域处理与小波分解、包络谱等,在特征提取上取得了大量的特征,再由观察输入轴的转速变化分离负载,利用齿轮啮合频率与频谱相似性来分辨不同的齿型,再用健康评估的方法来得到无故障的样本作基准,将剩余样本与其找出的基准计算距离作对照,并以机率模型给出分类结果.
第三名的方法使用一种基于包络谱和谱峭度来作分类的方法,在包含故障信息的信号微弱而噪音为主导的情况下,包络谱分析并不能提供有效的信息,因此在进行包络谱分析前需用特定的带通滤波器来进行滤波,可降低噪音对信号的影响.
在DT 数据技术上,主要依靠加速度传感器与转速传感器来采集齿轮箱包含故障信息的信号.在AT 分析技术上则是侧重在数据处理的部分,通过不同方法来降低信号的噪音并提取特征,如利用带通滤波器来改善数据质量,再转成包络谱等提供相对应的特征.
在此次的比赛中所进行的故障诊断主要为稳定的工况与固定的负载和转速,在实际的应用场景中,信号的噪音可能较强或者工况可能为动态变化,因此仍需进一步的研究来探讨负载和转速快速变化的情况下,相对应的数据处理策略与分析方法.
图4 PHM 2009 数据竞赛:齿轮箱的故障诊断
Fig.4 2009 PHM data competition fault diagnosis of gearbox
3.2 单台设备级别的案例分析
3.2.1 设备刀具
成功的工业人工智能技术需要良好的架构,包含最小化点对点的通讯阶层、行动装置的支持、位置感知与装置间的互动.在这样的设计之下,装置可以存取多种来自传统云计算和网络边缘计算的资源.这样的架构有着几项优势:
3)安全且高容量的数据存取而不必传输所有原始数据;
2)增强物理层和网络层的连接能力;
一个传统的方法是依靠操作人员的经验,通过人员的观察或是切削声的程度来判断刀具的健康状况(图2 左下区),人工智能技术可以通过侦测、诊断和预测刀具状况来避免问题发生(图2 左上区).然而,数据质量、数据可见性及结果的可重复性等因素阻碍了传统人工智能的发展和无忧智能制造系统的实行(图2 左上区),需要新的适应性强的人工智能算法来系统性的应用,实现实时且准确的刀具健康信息评估,完成工作量与废弃量的减低(图2右下区).
4)超算中心提供可扩展的网络;
5)实时的数据存取;
6)通过平行运算进行实时的大数据分析.
一个概念性的架构设计如图5 所示,两台切削机被实时监控且机器效能、刀具更换以及必要的维修可以被操作人员得知.
每一台机器都安装额外的振动信号传感器与10 kHz 采样频率的工业控制器,量测数据会被送到雾层作为主要的分析,在雾层中进行数据的前处理以得到干净的数据并区分刀具的不同工况.由于刀具的状况可能来自不同的操作区间,必须对相似的工况作完整的分析.数据的前处理完成后,干净的数据以及必要的分析会整合在一起送入云层作进一步的分析,通过基于一种相似性方法的分析,每一个刀具的性能会与相似的刀具做比对而且具有代表性的信息如刀具的健康状况、预测刀具损坏的时间与维修计划会告知操作人员来做决策.
这个例子中,DT 对应的是适合的传感器安装,控制器通过工业级的通讯协议如MTconnect、Modbus 等来传递数据,而更先进的通讯技术如4G 网络被用来解析来自雾层的数据;AT 创造一个流程来转换数据,让先进的机器学习模型如卷积神经网络可以用来评估刀具的健康状况或是预测刀具的剩余寿命,刀具和其他部件的健康状况通过可视化来呈现,相关的结果可从行动装置和网络服务得知.最后基于分析结果,操作人员来决定是否对该机台进行维护、更换刀具和其他零部件等.
一般来说,在切削过程中,不同的结构件用不同规格的刀具加工,在这个例子,切削刀具的衰退以及剩余寿命的预测都是不可见的信息.工作量的降低、废弃物的减少以及免忧虑是实现智能制造的关键.因此,工业人工智能的目的之一就是创造无忧的制造系统.
1)通过提供预测分析工具给终端而减少网络阶层;
图5 工业人工智能在刀具智能制造系统上的应用
Fig.5 An application of the cutting tools in smart manufacturing systems of industrial AI
3.2.2 数控机床
数控机床主轴的健康监测和维护是工业人工智能在设备级别应用的范例.主轴是数控机床中最为关键的组件之一,不可预测的主轴故障会对经济成本和作业时间造成显著的影响.通常,工厂不会储备主轴备件,因为主轴是机床中最为昂贵的部件并且故障率比较低.这就导致更换主轴的周期偏长.因此,主轴的生产商高度重视在客户端随时监测主轴的健康并在主轴产生故障前邮寄主轴备件.自我意识、自我配置、和自我预测是主轴智能化的三个标准,并对主轴厂家的高收益提供保证.
通过对主轴的智能系统进行数据采集模块安装,可以采集到高质量的振动数据以及电流监测数据等.数据采集是通过FCFT (固定工况特征测试)的方法,让系统定周期重复在固定工况下运行并采集相应数据.在数据采集的过程中机床会进行恒速运行以及变速运行.采集到的数据会通过通信模块和机床控制器的 “握手”进行整理.机床和数据采集单元的交流会提前让系统为FCFT 做准备,并通知DAQ 系统采集数据的时间.
分析技术是由两个部分组成的:1)前端的信号处理与特征提取部分;2)服务器(本地或远端)上的数据驱动建模与学习部分.信号处理的专用特征是基于轴承的几何形态、电机的型号以及传动轴的转速提取的.特征随后会同其他厂房相同规格的机器一起储存在数据库中.机床的健康模型会通过利用在服务器的机器学习算法来合成.当系统检测到一个偏差,人工智能技术会与资料库中的数据进行比对,推理出故障种类以及预测下一次零件质量偏差发生的时间.
智能主轴的平台技术由前端处理单元Cyberbox 组成.前端处理单元Cyber-box 包含内置数据采集器、通信模块以及计算处理器,是平台技术里重要的组成部分.当一个FCFT 周期完成采样后,系统会将数据按照机床运行速度进行划分然后对时间和频率的域特征进行提取,提取出的特征会发送到服务器的数据库中进行进一步的处理.人工智能技术会提取机床健康信息然后与机床信息以及时间戳一起储存到服务器的数据库中,同时会生产一个含有机床实时健康状态和诊断信息的网页界面.健康评估的分析结果可以让机床对本身的健康状态有自我意识的能力;同时,机床可以通过检测到的故障对主轴进行剩余寿命预测,给予机床自我预测的能力;最后,主轴可以在运行中完成自我配置运行参数进而避免故障同时延长寿命.
图6 工业人工智能生产线机床的5C 架构体系
Fig.6 The flow of data and information in a 5C architecture based production line for machine tools
图6 所展示的是用在数控机床维护网络中的5C 架构.在零件级别,主轴的传感器数据会被转化成信息,数字孪生技术会对未来进行规划来对每个零部件实现自我意识和自我预测.在第二层,更高级别的机床数据(例如控制器参数)会被整合在零部件信息中用来检测机床状态以及生成每个设备的数字孪生系统.这些CPS 设备中的数字孪生还会提供额外的自我比对能力.在第三层(生产系统),通过对零部件和设备级别的知识整合,可以实现工厂的自我配置和自我维护.这个级别的知识不仅可以保证无忧虑和 “近零故障”的生产,同时还可以提供工厂管理生产规划和库存管理规划.最后,CPS 的5C 架构可以部署在云端平台并应用在全世界各地的工厂.
3.3 生产级别的案例分析
3.3.1 富士康贴片机吸嘴的健康管理
SMT (Surface-mount technology)是一种表面贴焊(装)技术的工艺,在工厂内是比较成熟且自动化程度相当高的一项工业过程.这项工艺主要是将电子零组件焊接在电路板表面上的一种组装技术.该流程在电路板(Printed circuit board,PCB)上通过锡膏印刷机(Printer) 印上锡膏后,使用贴片机(IC mounter)执行打件处理(例如电阻、电容、二极管、晶体管和集成电路等),再经回焊炉(Reflow oven)工站的热风使锡膏溶融,由此使得电子零件与电路板结合,完成零件的装配与焊接,之后再通过AOI 光学检测仪器来管控生产的质量.
SMT 制程中的贴片机台(IC mounter)通过使用真空吸力技术来搬运电子零件,通过吸嘴滤芯传输真空来吸取零件,如BGA IC、联接器(Connector)等,将这些电子零件放置到正确的电路板位置上.在实际生产中,吸嘴滤芯的使用寿命和使用程度将会影响到生产中的良率、吸嘴维护、更换工时和抛料成本,如果可以提前预测吸嘴的健康状态,就能够提升生产效率及稳定性进而增加公司的竞争力.此案例介绍工业人工智能体系应用于贴片机台的方法,对贴片机台上吸嘴的健康状态实现有效的管理.
传统的吸嘴一般没有标记编号,且无法进行有效地搜集和追踪吸嘴滤芯的健康状态,需通过人工目检的手段来检验滤芯脏污情形进行预测,然而这样会造成手工作业时间成本增加.同时,检验人员的判断标准不一致,一般会导致漏检率高达10 %.因此,立项的前期,研究人员在设备生产端进行数据采集,试图找出影响吸嘴的寿命的主要影响因素.通过收集生产57 小时的数据,分析得知吸嘴吸料次数和真空值有明显的相关性,因此能够将真空值视为一个主要失效关键测量值.在以数据为基础进行分析后,研究人员进一步提出算法构架并建立吸嘴健康预测模型.
若能收集实时数据(吸料次数、抛料率、置件良率)建立模型来评价滤芯脏污面积并检测吸嘴健康程度,于吸嘴衰退老化程度达到预警程度前及时进行滤芯清洗或自动更换,就可以达到降低抛料率、漏检率的效果,同时缩短人员的手工作业时间.
在DT 采集数据过程中,通过镭雕二维码让吸嘴具备独立的ID,并通过IoT 技术与机台连接,采集吸嘴持续使用至设备真空门坎值或吸嘴失效的数据,利用分布概要图可以分析出失效区间之相关性.
在收集有效数据后,分析技术(AT)方面通过机器学习等方法训练数据驱动模型,让设备能自动判断滤芯脏污区域,再通过改善吸嘴滤芯的洁净度,延长其使用寿命.此模型目前在富士康集团经历了多次优化及改善,使每一支吸嘴都有专属的独立健康模型,并植入所开发的APP 中,如图7 所示,可以及时反应吸嘴受堵的异常状态并警示维护人员,又能预测部件可用的剩余寿命.
图7 Nozzle 吸嘴预测性维护APP
Fig.7 Nozzle predictive maintenance APP
通过吸嘴健康周期预测和自动更换,智能维护系统可有效降低吸嘴保养成本、更换吸嘴维护的工时同时节省66 %抛料费用成本,并降低64 %吸嘴库存量.
3.3.2 富士康机床部件的预测性维护
机械加工的核心部件是用来切削工件的刀具部件,最直接影响加工工件的质量.在加工的过程中刀具会随着切削工件而逐渐磨损,这样会造成加工效率和质量的下降.同时,在磨损到一定程度后要进行更换,若无更换的话,严重则会导致主轴发生故障,引起更加严重的损失.富士康集团拥有超过10 万台不同种类的精密加工CNC 设备,需要海量的人工来管理及监控加工状态和切削刀具的磨损情况,同时根据经验来判断更换刀具的时间.而刀具管理过程有很强的不确定性,例如材料差异、参数设定等因素,都会对刀具损耗的速度造成影响.所以,通常难以单纯使用经验法则来预测刀具的剩余使用寿命.
具体来说,在手机结构件机加工和模具制造等过程中都会大量使用不同规格的刀具.对于车间的操作人员来说,刀具的剩余寿命和磨损状态是不可见的,过去能够凭借经验来对其进行粗略估计,或者凭借操作员的经验通过观察切削火光和声音判断刀具状态.目前富士康以无忧刀具为目标,使刀具的状态能够被实时并准确地评估,提高切削刀具的稳定性和寿命.此项目一直是富士康集团的核心研发项目之一,同时也是在国际上机械加工领域中的重要研究课题.
在实际生产中,影响刀具寿命和稳定性的因素很多,比如刀具的材料、结构、涂层以及加工机床的状态、工件的材料、加工冷却效果与场地环境等因素.传统刀具寿命管理的痛点和瓶颈在于无法精确预测刀具加工过程中的正常磨损以及断刀等状况,通常通过加工者的经验、刀具的加工时间或切削长度进行刀具寿命管理.然而,过早替换刀具部件会造成生产成本的提高,过晚替换刀具则可能造成产品质量异常,甚至引起加工机床重大损失.一般企业需要一定的人员进行质量的监控和检测,同时承担异常品的损失.因此,刀具寿命监控及预测的机制非常关键,可以显著提高切削加工的效率及质量.传统的数学分析方法在高频数据与多种影响因素的干扰下难以满足实际的分析需求.因此,需要利用工业人工智能技术对海量数据进行分析建模,解决刀具寿命预测的难题.
为了有效地进行刀具寿命监控及预测,首先在数据技术(DT)方面,在目标机床上部署边缘端智慧硬件,将采集的原始传感数据进行信号处理和特征提取后传送至拥有高运算能力的FII 云计算平台.通过使用边缘计算,提取能够表征刀具衰退状态的400 多个影响健康状态的特征,将传输的数据体积缩小了近百倍,有效降低了数据传输和算力的负担,减小了通信等基础设施的投资成本.在收集数据后和在建立模型前先评价数据可用性,采用有效的信息特征来建立数学模型并加以训练,避免低质量的数据影响模型性能.
在本案例中我们通过采集传感器与控制器中的高频数据以及PLC 低频数据进行分析,包含振动、电压、电流信号以及加工单节、加工时间等数据信息.在进行数据的前处理、分割、特征提取后,得到不同种类的时域和频率特征集合,并采用不同的自动化特征选取方法,建立刀具的磨损量评估模型,同时基于刀具磨损量的评价结果建立刀具剩余寿命预测模型.
最后将该模型部署于生产中的服务平台,实现上层应用的用户定制化界面开发,提供接口供指定刀具传输实时数据,实现刀具剩余寿命监控及预测能力.本案例技术构架如图8 所示,通过采用刀具部件寿命监控及预测维护系统,可以最大限度的降低维护成本并优化产品质量.此系统为某条机壳加工线所带来的效应根据初步统计,能够减少60 %的意外停机时间,降低50 %巡视监控机台状态所需的人力,并且质量缺陷率从6 ‰进一步降至3 ‰,每年能够节约16 %的刀具成本.
3.4 机器群级别的风力发电风场案例分析
风电行业是一个正在高速发展的领域,近十年中国在这方面保持着飞速发展的趋势并且成为风电行业装机规模增速最快的国家.越来越大的市场需求对风机的性能提出了更高的要求.风机设备制造商(OEM)在降低风机成本方面付出了很多人力物力,但是随着风机制造技术的不断完善,所剩余的改进空间越来越小.相对而言,风机的运营管理还处在一个起步阶段,风机的故障诊断和健康管理还没有被良好地利用.研发智能化风机系统的难度在于:
1)风资源的难预测性包含着风速、风向以及风能密度的非线性变化.这些随机性的动态过程变量对于预测风速和风功率的精准性提出了更高的要求.
2)风场多建于偏远地区以及环境多变的海上,这就对于维护工作提出了更高的要求,也会应用到一些特殊设备,导致维护成本和周期长度的提升.
3)风机传动系统的衰退程度、润滑状态以及偏航齿轮条的磨损程度等会受风资源的复杂性影像而具有较大的个体差异性,因此传统的预防性维护很难应用在风场运维中.
图8 刀具寿命监控及预测技术构架图
Fig.8 The four enabling technologies framework for tool life monitoring and prediction
基于目前的风电发展趋势和运维挑战,智能化风机系统需要满足的关键功能总结如下:
1)风机以及其关键零部件的健康管理与衰退的精确化和透明化分析;
2)风机以及其关键零部件的健康趋势分析和剩余寿命预测;
3)风机发电性能的实时监测和风场级别的风机性能分类;
4)风场基于风资源预测技术的智能调度管理;
5)风场基于风机以及其关键零部件性能检测的运维优化调度.
智能化风机健康维护系统的核心是基于风机关键设备状态的精准评估、环境情况的精准预测以及运维任务状态的精准分析下,对风机运维的调度、排程和执行进行管理决策方面的优化.风机所处的周围环境比较复杂,风机的运行机制多样,风机内部的关键零部件较多,同时运维任务的流程和涉及到的情况比较复杂,这就需要在CPS 的框架构造基础上对系统的功能层级以及顺序进行分析.以IMS 中心创造的CPS 的5C 架构作为模版,开发智能化风机健康维护的CPS 功能结构,每一层的具体要求和实际机制如图9 所示.
风场具有一个典型多源异构体的数据类型.数据主要来源于监控和数据采集系统(Supervisory control and data acquisition,SCADA),以及状态监测系统(Condition monitoring system,CMS).这些信息资源提供了环境信息、工作状态信息、控制变量、状态变量、关键零部件的振动信号,以及一些其他数据.额外的数据资源包括电网调度信息,工单系统,人事管理以及资源状态的维护等.通过IMS 中心提供的Watchdog Agent 大数据分析工具包对以上各种数据资源的综合分析,对风机进行建模以及可视化,形成一个可以广泛应用的风机性能评估,剩余寿命预测和风场运行维护管理系统.
关于智能化风场的健康管理和运行维护方面的研究与开发分为两部分:对于风机性能的预测分析和维护排程的优化.首先,通过对实时数据的分析,可以完成对当前工作环境的有效路径识别和风资源的状态评估.其次,提取的有效的健康特征可以建立风机以及关键零部件的健康模型,当前的风机衰退状况也会被评估和分析.通过对风机以及关键零部件的健康评估,潜在的运营风险和仪器的可能失败模式可以被进一步判断,而且剩余的有效寿命也可以被预判.这些都可以作为最大化风机发电能力的保障,同时尽可能地减少系统的停机时间,避免重大停机问题的发生.
智能风机系统的模块化设计具有更多的可伸缩性.例如,部署云端服务器可以提供更多的风场定制化服务的同时完成风机的智能化升级.通过对风机的数据进行处理,相关的特征和模型可以上传到云端服务平台来实现统一化管理.用户也可以通过这个平台实现多个风场风机的远端实时监测和历史性能的追踪.
风场动态运营维护的优化需要对每一个风机进行精准的健康状态评估,以及同步目前风扇健康信息,环境信息以及维护资源信息.风资源的预测也是风扇调度优化的一个重要方面.风机的维护需要在风资源贫乏的时候进行,这样可以尽可能地减少由于停机维护而造成的发电影响.IMS 中心已经研发了一个用于海上风场的中短期运行维护计划的优化模型.这个模型是基于风场的真实情况和优化设计方案以及非线性的约束条件来确保实际维护实施拥有最大限度的扩展性,该模型同时可以提供最优决策.
图9 基于CPS 的5C 架构体系的智能化风力发电风场
Fig.9 The flow of data and information in a 5C architecture based wind farm
海上风场维护计划的优化是基于海上风场维护工作的特性而定,船只的使用、天气因素、维护人员安排、维护订单安排、风机的健康状态以及导航的费用都需要进行考虑.对于每一次维护作业,不同的维护团队可以被安排在不同艘维护船只来提高维护计划的灵活性同时降低成本.但是这样一来就增加了可行性的搜索范围,需要增加优化要求来解决更加复杂的优化问题,常用的优化软件如Matlab Optimal Toolbox 和Guribi 很难在合理的时间内解决这种问题.为此IMS 中心设计了一种两层的基因算法模型用于解决海上风场的运行维护优化问题.这个算法有着强大的扩展性,与商用优化软件相比更好的计算能力以及可以更好地满足风场的智能化实施.以一个海上风场的维护任务为例,与传统调度计划相比优化后的智能调度计划可以降低多于25 %的维护成本,显著提升了风场运行维护的效率.
3.5 Watchdog agent toolbox
IMS 中心在过去的研究中,从大量的应用场景中归纳总结出一套分析流程与算法工具包:Watchdog agent toolbox,如图10 所示,其分析流程采用了以下的预测与诊断框架,包含数据采集、信号处理、特征提取、健康评估、健康预测与结果可视化.
这样的分析流程已被广泛地应用在不同层面上,从结构较为简单的旋转机械元件如轴承,到组成更为复杂的工程系统如发动机,也从产业如传统制造到半导体制造等.在不同应用中,都需要通过算法工具获取关键信息,而即使在同一应用环境下,仍然要根据实际情況来选择适当的算法工具来进行分析.因此,IMS 中心发展了一套特別针对故障预测与健康管理的工具包来将广泛使用的算法整合在一起,用系统化的方式对每种算法作优先度排序以减少实际应用中需要反复实验的次数.
图10 Watchdog 工具包简介
Fig.10 Descriptions of the Watchdog agent toolbox
其预测结果可与企业本身的生产规划系统结合来确保适当的维护措施可以在故障实际发生前进行,并加以优化维修策略,进一步降低额外的生产成本.
4 结束语
工业4.0 是将工业进程以及产品质量从过度依赖人员经验转移到注重以事实为基础的智能系统.虽然人工智能在这个过程中起着至关重要的角色,但是传统的人工智能技术过于注重日常生活、社会交流、金融等行业.相比而言,工业人工智能是一个基于工业领域,注重于效率性、可靠性、重复性以及系统优化的智能系统.工业人工智能技术更加适用于解决特定的工业问题.尽管当前工业人工智能技术正在飞速发展,然而整体上仍处于起步阶段,工业界的许多实际的问题仍然没有得到有效解决,如何发展工业人工智能方法体系以更好地服务实际工业生产并创造价值是未来的研究方向.具体来说,首先以深度学习为代表的计算方法是构建智能系统的核心因素,此类技术的发展会直接提升我们对工业大数据的利用能力;同时,当前对工业系统的分析主要集中于对传统信号的处理,如振动信号、控制信号等,将最新的机器视觉方法引入传统工业中对解决如质量检测、实时反馈控制等实际问题有着巨大的潜力;随着5G 技术的发展,低延迟的分布式工业物联网系统也会为工业人工智能体系带来新的机遇,进一步推动完善工业级数字孪生系统.本文所提出的工业人工智能系统框架预期会帮助专业人员探查复杂系统的隐性知识,同时通过对工业设备实现自主判断能力来完成弹性生产并最终创造更大的社会价值.
审核编辑:符乾江
评论
查看更多