1 阿里语音机器人首次实现与主播的实时互动 反应速度是Siri的20倍-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里语音机器人首次实现与主播的实时互动 反应速度是Siri的20倍

工程师邓生 来源:猎云网 作者:猎云网 2020-11-02 17:47 次阅读

10月30日消息,刚刚结束的李佳琦直播间里,剁手党通过阿里语音机器人首次实现与主播的实时互动。直播过程中,数十万用户同时用语音回答李佳琦的提问,最终机器人在50毫秒内就完成了语音识别和语音反馈全过程,反应速度是传统语音的20倍。

淘宝直播间观众用语音与李佳琦互动

今年双11期间,淘宝直播间推出 “语音猜价格”功能,观众在直播间也能实现语音交互,例如动动嘴就可以响应主播发出的猜产品价格任务。语音机器人成为决定这一互动过程能否顺畅的关键。

据介绍,一场淘宝直播的观众数量可达百万甚至千万,并且用户分布在全国各地,口音差异较大,目前主流的语音技术方案很难做到短时间内快速响应如此体量的用户语音,例如类似Siri识别用户语音的响应时长就在1秒以上,无法满足直播场景强互动的要求。

此次淘宝直播间采用了达摩院最新的移动端离线端到端语音识别技术。基于全新的网络结构和语音识别框架,即便在低配手机上,也能在50毫秒内完成语音交互过程,速度是传统语音识别的20倍;此外,该技术还解决了快语速、重口音等问题,高难度场景中的语音识别错误率降低近三成。

达摩院语音实验室技术专家万玉龙表示,“在实时性要求极高的场景,传统的云端语音方案无法满足需求,这套语音技术的创新在于同时实现了识别速度和准确度的提升,语音AI模型部署在每个用户的淘宝直播APP上,即便直播间有千万级别的用户,AI也不会漏听慢判。”

过去几年,阿里语音AI在基础研究和应用上取得了一系列突破。2019年,阿里语音AI入选《麻省理工评论》“全球十大突破性技术”,是唯一上榜的中国科技公司;今年7月IDC发布的《中国AI云服务市场半年度研究报告》显示,阿里语音AI以44%的市场份额,在云上语音AI市场中位居第一。

责任编辑:PSY

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28379

    浏览量

    206905
  • 语音识别
    +关注

    关注

    38

    文章

    1739

    浏览量

    112632
  • Siri
    +关注

    关注

    4

    文章

    206

    浏览量

    37022
  • 阿里
    +关注

    关注

    6

    文章

    438

    浏览量

    32827
收藏 人收藏

    评论

    相关推荐

    【「具身智能机器人系统」阅读体验】+初品的体验

    解决许多技术的和非技术的挑战,如提高智能体的自主性、处理复杂环境互动的能力及确保行为的伦理和安全性。 未来的研究需要将视觉、语音和其他传感技术与机器人技术相结合,以探索更加先进的知识表示和记忆模块,利用强化学习进一步优化决策过程
    发表于 12-20 19:17

    《具身智能机器人系统》第1-6章阅读心得之具身智能机器人系统背景知识与基础模块

    ,互联网行业占成熟经济体的GDP增长的21%,世界经济正面向数字经济转型的大趋势。具身智能机器人集成人工智能、高端制造、新材料等技术,其核心在于通过智能体与环境的动态互动实现智能行为。 在第2章“具身
    发表于 12-19 22:26

    汤姆猫发布AI语音情感陪伴机器人研发进展

    ,能够智能识别声音来源的位置与方向,实现120°的自由转头,确保始终面向用户进行语音对话。这一设计不仅增强了机器人互动性,还大大提升了用户的沟通体验。 此外,汤姆猫AI
    的头像 发表于 12-17 11:27 439次阅读

    机器人语音功能

    经典卡通角色的声音成为了它们的“名片”。那么,机器人语音功能究竟是如何实现的?它与智能模组有什么关系?谁是这类服务机器人语音“指挥官”?
    的头像 发表于 12-02 10:50 324次阅读

    【书籍评测活动NO.51】具身智能机器人系统 | 了解AI的下一个浪潮!

    复杂环境互动的能力及确保行为的伦理和安全性。 未来的研究需要将视觉、语音和其他传感技术与机器人技术结合,探索更加先进的知识表示和记忆模块,利用强化学习进一步优化决策过程。 具身智能的发展需要更多跨学科
    发表于 11-11 10:20

    语音识别机器人的工作原理

    语音识别机器人的工作原理主要基于一系列复杂的技术流程,包括信号采集、预处理、特征提取、声学模型匹配、语言模型预测以及最终的解码输出。 一、信号采集 语音识别机器人首先通过麦克风等音频输
    的头像 发表于 10-25 09:25 439次阅读

    基于导纳控制的机器人拖动示教原理和实现步骤

          基于导纳控制的机器人拖动示教是一种常用的机器人控制策略,它允许机器人直接互动实现
    的头像 发表于 10-23 15:52 191次阅读

    构建语音控制机器人 - 线性模型和机器学习

    2024-07-31 |Annabel Ng 在该项目的[上一篇博客文章]中,我介绍了运行机器人电机、处理音频信号和调节电压所需的电路的基础知识。然而,机器人还没有完全完成!尽管机器人可以正确移动
    的头像 发表于 10-02 16:31 203次阅读
    构建<b class='flag-5'>语音</b>控制<b class='flag-5'>机器人</b> - 线性模型和<b class='flag-5'>机器</b>学习

    开源项目!用ESP32做一个可爱的无用机器人

    简介 作者在完成硕士论文答辩后,利用空闲时间制作了一个他一直想做的机器人——可爱无用机器人。 无用机器人原理是一个连接到开关的电机,通过逻辑门控制。当开关被推到“开”时,机器人启动
    发表于 09-03 09:34

    开源项目!用ESP32做一个可爱的无用机器人

    简介 作者在完成硕士论文答辩后,利用空闲时间制作了一个他一直想做的机器人——可爱无用机器人。 无用机器人原理是一个连接到开关的电机,通过逻辑门控制。当开关被推到“开”时,机器人
    发表于 08-30 14:50

    ROS让机器人开发更便捷,基于RK3568J+Debian系统发布!

    安全可靠。“实时性”、“安全性”是如今工业自动化行业的普遍追求,特别是对于AGV开发,若AGV机器人的主控制器、雷达、摄像头、GPS等部件的控制、通信的实时性与安全性得不到保障,导致的后果将是核心数据泄露
    发表于 07-09 11:38

    Al大模型机器人

    金航标kinghelm萨科微slkor总经理宋仕强介绍说,萨科微Al大模型机器人有哪些的优势?萨科微AI大模型机器人由清华大学毕业的天才少年N博士和王博士团队开发,与同行相比具有许多优势:语言
    发表于 07-05 08:52

    基于FPGA EtherCAT的六自由度机器人视觉伺服控制设计

    和增强系统处理图像的实时性,本文提出了一种伊瑟特的六自由度机器人视觉伺服控制系统,将摄像头集成到基于 Zynq的伊瑟特站上,提高了视觉伺服的实时性.经测试,该平台能够对视觉检测目标的
    发表于 05-29 16:17

    stm32f303的比较器反应速度多少啊?

    stm32f303的比较器反应速度多少啊?有木有20mv的数据?手册上说:100mv的压差反应延时为35ns。怎么我的应用里用PA0输出光上升沿就用了5ms之多呢?(为了验证一下,我直接断点,捕获的波形)比较器配置为为高速模式,
    发表于 05-08 06:08

    其利天下技术·搭载无刷电机的扫地机器人的前景如何?

    地毯并增加吸力,或是绕过障碍物进行清扫。同时,通过手机APP远程控制、语音指令等方式,用户可以方便地操作扫地机器人实现个性化的清洁需求。 3.扫地机器人面临的技术壁垒与客户体验问题
    发表于 05-05 15:03