1 为什么说图灵测试不适合做产业数智化基准-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

为什么说图灵测试不适合做产业数智化基准

脑极体 来源:脑极体 作者:脑极体 2020-11-24 11:43 次阅读

临近岁末年初,各大科技厂商都卯着劲儿相继发布新技术、新产品,其中,一场关于“新图灵测试”的探讨,及其所打开的广袤空间,就成为业内热议的对象。年中的2020 智源大会上,京东集团技术委员会主席、京东智联云总裁、京东人工智能研究院院长、IEEE Fellow 周伯文,在与斯坦福大学教授、人工智能实验室负责人克里斯托弗·曼宁(Christopher Manning)的对话中,提出了图灵测试的“替代方案”。

而前不久的CIIS2020上,京东将多模态内容生成、多轮对话等AI技术,与智能交互机器人流程自动化(RPA)相结合,打造出能够适配千变万化的消费者需求和服务产业复杂业态的智能交互技术体系。不仅让“新图灵测试”成为可能,也让我们看到了AI与RPA结合的“京东思路”,正在从决策到管理、执行的联动,给产业数字化带来的全新发展机遇,正逐步清晰地浮现在我们眼前。

一种悖论:为什么说图灵测试不适合做产业数智化基准

图灵测试(The Turing test),是人工智能领域的基础名词,艾伦·麦席森·图灵在1950年预测,到2000年人工智能可以在5分钟的问答中骗过30%成年人。那么,发展了数十年的AI到底有没有达到图灵的预测标准呢?伴随着GPT3、BERT等大规模、高性能的算法出现,AI不仅能写诗绘画讲故事,甚至还能模仿客服给消费者打营销电话,骗取人类信任……看起来似乎已经达到了预测中的水平。

但究其本质,图灵的预言其实指向一种具有真正智能的机器的可能性,意味着人类能够打造出具备思考能力的机器。2014年人工智能软件尤金·古斯特曼(Eugene Goostman)通过了图灵测试,被认为具有人类智能,但实际上,这位“尤金”还远远不能思考。这种表与里的悖论,让图灵测试作为智能的评测基准(Benchmark),在落地产业AI化过程中存在两个待解的问题:

一是无法量化。尽管目前许多算法可以通过图灵测试,但这一评测基准对AI应用落地产业没有直接帮助和参考。因为图灵测试没有规定问题的范围和提问的标准,跟人类进行随机的、无特定内容对话的交流。要评价一个AI系统的智能程度,就如克里斯托弗·曼宁教授在会议中所提到的那样,“需要找一个另外的方法,标量真正的理解、真正的持续对话”。

图灵测试的第二个问题,则是无法检验AI系统在产业应用的效率。在产业智能化进程中,AI往往需要被用来解决具象的问题,比如帮助零售商与消费者流畅地沟通,这就要求其具备一种“宽泛的心理能力”,需要调动意图感知、语音识别、语义分析、内容生成等等具体能力,而这都是图灵测试无法具体评测到的。从这个角度看,寻找新的评测标准,是AI走进社会化大生产之后水到渠成的产业需求。

一个可能:AI+RPA如何打开新图灵测试的天地

既然图灵测试并不能满足产业应用AI时的评测需求,所以周伯文才会提出一个很新颖的概念,直接让两个对话型 AI 做直播带货,通过统计以每小时能卖出多少商品的可量化指标,来对比哪个 AI 的对话更吸引人,从而评估对话型 AI 的智能化水平。这个创意,在CIIS 2020上就变成了现实。周伯文在现场分享了这个进阶版的“带货测试”:

京东对数以亿计SKU进行卖点挖掘,自动生成文案、背景音乐、虚拟形象,再配上咨询导购客服,整套服务可以自动化地生成每件物品的专属主播介绍,与观众用弹幕和语音实时交流,答疑解惑,把直播产业以规模化、自动化的方式推广到亿级的播放和商品销售上去。

要完成这一实时、可量化的智能交互,需要的技术是非常多面的。首先需要利用深度学习神经网络和知识图谱对物品资料进行识别和理解,然后系统根据多模态数字内容生成技术,可以自动生成一个精彩的解说词,自动挖掘卖点、自动生成销售文案、生成语音背景和音乐,还会为每个消费者生成独特的虚拟形象,再利用京东TTS语音驱动虚拟主播进行讲解。

举个例子,当消费者跟智能客服或智能主播对话时,用文字表达自己的困惑“我想找一件黄色的、有波浪边的轻薄连衣裙”,多模态智能对话可以快速将这些文字以图像化的形式表达出来,将符合要求的图片呈现出来,同时,主播还会活灵活现地向消费者介绍“裙摆可以像风一样摆动哦~”解说过程中,根据消费者的实时弹幕,系统需要快速根据上下文多轮对话策略进行内容识别、意图感知,来实时调整自己的讲解节奏、内容、情绪。

令消费者缩短无效观看时间,与主播一对一交流;同时也可以让众多商家低门槛、自动化地用直播方式带货。AI主播还可以进一步收集消费者的问题与困惑,及时地反馈给商家进行迭代和优化,等于拥有了一个零售顾问。京东平台的实践数据显示,目前该技术已经在好货频道、社交电商、售前导购机器人京小智、搭配购、什么值得买APP等生成了5000万个素材,其中AI素材曝光点击率是人工素材的1.4倍。让机器更懂人心、更会说话,这正是京东将AI+RPA融合之后的智能服务所带来的魅力。

顺着“带货主播”模式开始延伸,我们可以看到作为“新图灵测试”背后的技术组合——AI+RPA到底与传统的智能体有哪些不同?首先,同样是人与机器的交互,AI+RPA的效果可以量化,支撑产业端的运营、管理、决策。比如对话型 AI 做直播带货,可以在与消费者的对话中不断自我学习进化,在垂直领域变得更具智能感,输出更吸引人的内容。

其次,AI+RPA的协同赋予了自动化服务以自主判断、决策、推理能力,设计了具体而清晰的协作任务,如同一个智慧的大脑突然具备了四肢和行动能力,其中AI作为大脑可以提升系统的服务效率,独立承担起一些简单、重复的工作。最后也是最重要的,AI+RPA背后的核心逻辑与技术体系有着很强的泛化能力,在服务业数智化转型中的许多流程中都有着清晰的价值体现。

执行层将服务员、客服等一线员工从重复中解放出来,帮助他们提升工作效率;管理层,抽离出有用的信息,利用逻辑推倒实时分析业务变化;最后形成直观的可视化报告或数据图,帮助决策层提升决策效率。比如基于京东在智能交互RPA和数据智能领域的积累,京东智联云所打造的“咨询大脑”,就被用来构建城市咨询智力中心,可以提供涵盖民生、政务服务、精细化管理、公共安全等多个领域的服务。

从智能交互出发,可以清晰地看到服务业的迭代路径与可行性。这也是为什么,周伯文会说,这种任务导向型对话智能(Task-oriented Conversational Intelligence)将带来人机交互技术驱动的万亿级市场。

三方突围:京东如何破解服务业数智化的三重困境

在CIIS2020上,周伯文表示,产业数字化是传统行业利用AI等新一代信息技术提升效率,而服务业涉及非常多的行业,如金融、教育、电商、物流,数字化和智能化水平并不一致。接下来应该是人和AI协作的深化,进一步提升服务的效能。这是智能时代科技企业的增长密码,也是京东努力的核心方向。

目前来看,服务领域的数智化存在三重难题:

一是服务业的重塑之难:很多现有的标准化服务流程完全可以被重塑、重造,进而提升服务效能,但传统服务业在智能技术认知和基础设施方面相对较弱,加上需求、规模、痛点的千差万别,需要一个全场景的体系来实现适配。

二是基础设施的运维之难:许多服务业对于智能技术都存在认知不足、人才短缺等问题,而AI项目落地的成功率直接取决于其批量复制、高效运维的能力,如何把工程化的数据运维、模型运维、开发运维三大核心支柱,通过工具化的生命周期管理整合并提供给产业,是科技企业必须努力解决的。

三是多模态的交互之难:在复杂的现实环境中,用户的意图往往会以多模态方式来展现,语言、文字、图像、视频等等都可以作为媒介来传递信息,传统AI一旦需要处理边界和规则不清晰的问题,效率就迅速下降。只有在解决深度语义理解、多模态交互技术、对话内容生成、复杂场景下的多轮对话与决策技术等等之后,智能交互才能真正释放行业创新价值。

也正是如此,京东发布的多模态交互与内容生成等一系列解决方案,让千人千面的智能交互应用开始真实地走入产业端,服务业数智化转型的浪潮快速到来。

举个例子,传统的客服机器人只能将市民抱怨的问题记下来,然后提交给后台工作人员去安排和处理。而伴随着智能交互系统的落地,山西大同的12345近来就出现了一些显而易见的改变,可以通过智能动态交互的方式准确地理解是哪里、是什么情况、什么路灯,通过数字化的私有云管理体系调动相关区的卫生局,通过和相关人员进行AI外呼联系解决这个问题,并创建这个工单和状态。

在确认修好之后,市长热线再外呼电话,告诉市民修好了这种接诉即办的智能服务,会不会让每一个打开电话的市民感受到一种城市管理的速度与文明呢?在疫情防控严格的当下,智能交互基础上的智能疫情外呼系统,也可以自动化完成外呼疫情排查、通知、信息采集、病例回访等工作,是不是可以有效减轻医护和基层人员的负担?

我想上述答案都会是肯定的。智能交互还可以应用到客服领域。如果你也曾厌倦过拨打客服电话时冗长的等待、牛头不对马嘴的沟通,那么智能交互可能会在未来拯救你和客服双方。传统客服模式下,人工客服需要将三分之二时间用在理解客户的需求上,剩下是用在后台查询、业务办理,以及创建摘要,为客户完成后续服务的跟踪和闭环上。而京东智能交互可以在分配电话坐席前,就进行机器探索,把合乎的画像和需求匹配到最适合的人工智客服那里;比如手机的特殊功能,会找到手机专家回答问题。

在实时对话中,系统会自动识别高浓度负面情绪。在疫情期间,智能客服就曾在与一位年轻客户的交谈中,感知到对方在购药之后出现了情绪低沉的情况,在安抚的同时,及时联系了心理咨询专家。618期间,智能人机交互系统就为京东平台服务了7800万人次,使得原来的人海战略客服变成智能接待的方式,使得客服中心效率提升90%。

从识别到理解,再到生成千人千面的个性化服务,是AI能力的迭代进化,也展现出京东对连接技术与产业的独特思考。在技术创新的同时,赋予其广袤的产业价值机会点,在产业AI化、AI产业化的当下,进一步点燃了AI改造世界的可能性。周伯文在发言的结尾说道:下一个10年,以技术为本、基于智能交互的服务业数智化将是我们下一个产业巨大的浪潮。

这是未来的起点,也是等待你我一起去挖掘和感受的特殊时刻。

fqj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 智能化
    +关注

    关注

    15

    文章

    4869

    浏览量

    55343
收藏 人收藏

    评论

    相关推荐

    请问为ADC选Driver主要要看哪几项技术指标呢?

    to 20-Bit, Differential, High-Speed SAR Drivers,这时THS4561就不适合做Delta-Sigma (ΔΣ) ADC Drivers吗?请问为ADC选Driver主要要看哪几项技术指标呢?
    发表于 12-16 06:00

    DAC81408适合做信号发生器吗?

    DAC81408适合做信号发生器吗?8路输出,频率40-60Hz,各路相位相对可控,幅度最大10V。
    发表于 11-29 07:18

    请问能不能推荐适合做电压跟随器的电流型运算放大器?

    请问能不能推荐适合做电压跟随器的电流型运算放大器?
    发表于 09-25 06:20

    图灵测试的内容是什么_图灵测试的作用

    图灵测试(Turing Test)是由英国数学家和计算机科学家艾伦·麦席森·图灵(Alan Turing)在1950年提出的一种测试方法,用以判断机器是否具有人类智能。
    的头像 发表于 09-16 16:11 1780次阅读

    图灵测试什么意思_图灵测试是干嘛的

    图灵测试是由英国数学家、密码专家和数字计算机的奠基人艾伦·麦席森·图灵提出的一种检验某个对象(通常是机器或人工智能系统)是否具有智能的测试方法。其核心思想在于,如果一台机器在与人类的对
    的头像 发表于 09-16 16:09 1364次阅读

    使用哪种运放比较适合做衰减用,且不会失真很严重?

    您好:我想用运放做衰减用,输入信号的幅度为0~10V,衰减5倍左右。输入信号的频率为135H和15Hz组成的正弦波包络。 请问,使用哪种运放比较适合做衰减用,且不会失真很严重,谢谢!
    发表于 09-10 07:20

    请问lmv324适合做跟随器吗?

    请问lmv324适合做跟随器吗?如何阅读手册曲线图判断一个运放是否合适做跟随器呢?
    发表于 09-03 07:06

    LM2904适合做电流采样吗?

    最近在做一个项目需要一个电流采样功能,由于之前LM2904的成本比较低,所以选用的LM2902,但采集的数据有一些问题,所以想请教一下各位,是电路设计有问题还是LM2904这颗料不太适合做电流采样?具体电路图如下,谢谢!
    发表于 08-19 08:16

    OPA1641是否可做PA级跨阻放大器?

    的引脚,GUARDRING要做怎么样的处理?还是OPA1641虽然有很低的电流噪声,和较宽的增益,但由于某些性能限制,其不适合做跨阻放大器?
    发表于 08-09 07:16

    TLV9002-Q1用官网上的模型搭了个滤波器,跟用理想运放的输出幅频特性差异很大是怎么回事?

    现象:用官网上的模型搭了个滤波器,跟用理想运放的输出幅频特性差异很大 问题:是官网上的模型不适合做AC分析?还是我找的这个模型不对? 电路很简单,源仿真文件我就不放了。
    发表于 08-05 07:10

    请问stm32是不是不适合控制有位置要求的交流伺服pmsm电机?

    stm32很适合控制无传感器pmsm电机,是否可以认为:stm32不适合控制有编码器的交流伺服电机
    发表于 05-16 07:31

    基于微软数据中心的FPGA讲解分析

    FPGA 和 GPU 最大的区别在于体系结构,FPGA 更适合做需要低延迟的流式处理,GPU 更适合做大批量同构数据的处理。
    发表于 02-27 14:45 665次阅读
    基于微软数据中心的FPGA讲解分析

    电阻可以串联,为何二极管不适合串联?

    电阻可以串联,为何二极管不适合串联? 二极管是一种非线性电子元件,其工作原理与电阻截然不同。由于其独特的电学特性,二极管不适合串联使用。 首先,我们来了解一下二极管的基本原理。二极管由PN结构组成
    的头像 发表于 02-18 10:00 2021次阅读

    为什么锂电池适合做UPS电池呢?

    为什么锂电池适合做UPS电池呢? 锂电池是一种目前非常流行的电池技术,它具有多种优点,这些优点使其非常适合用于UPS(不间断电源)电池。 1. 高能量密度:锂电池具有高能量密度,即单位质量电池能够
    的头像 发表于 01-11 14:09 648次阅读

    请问是否有用软件控制电阻值的电位器?

    请问是否有用软件控制电阻值的电位器?看资料数字电位器内部使用MOS链接,不适合做纯电阻元件?是否是这样的?我需求一个电位器,使用软件控制其阻值,阻值分布在小于1Ω到1KΩ之间,请问有没有合适的芯片?
    发表于 12-27 08:15