1 华为研发语音唤醒方法及电子设备的语音交互技术-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

华为研发语音唤醒方法及电子设备的语音交互技术

454398 来源:搜狐 作者:搜狐 2021-01-09 09:07 次阅读

通常语音交互过程通常分为唤醒、响应、输入、理解、反馈几个环节,语音交互技术也一直是IBM、微软、百度等遥遥领先。

几个月前,华为消费者业务CEO余承东表示华为正在研发国际版的语音助手,同时建立自己的AI服务,并将在未来扩展到国际市场。

人工智能的潮流推动下,智能化语音技术不断发展,许多电子设备中都添加了语音助手,如Siri、小爱同学、天猫精灵等,用来协助用户进行人机交互过程。为了使得语音助手能够及时检测并响应用户发出的语音交互指令,电子设备一般会预设一些唤醒词,如“Hi Siri”等,当检测到用户输入唤醒词时,可触发电子设备与用户进行交流。通常设备设置唤醒词的声强门限60dB,当用户输入声强大于60dB时,电子设备检测成功,然而当用户距离设备较远时,由于输入声强的降低,电子设备往往难以检测到输入语音信号从唤醒失败。在这种情况下,如何在远距离下提高语音助手唤醒成功率成为诸多企业竞相研究的热点。

华为公司于2019年7月25日提出了一项名为“一种语音唤醒方法及电子设备”的发明专利(申请号:201910677390 .9),申请人为华为技术有限公司。

此发明专利介绍了一种语音唤醒方法及相对应的电子设备,可以在较广的位置范围内保证电子设备被成功唤醒的几率,从而提高用户的使用体验,而该种方法可以被应用于诸如智能家居设备、PC、手机、音箱等具有语音交互功能的电子设备之中。

o4YBAF9uXB6ASSloAACJI4NT3Lc054.png

图1 语音交互过程示意图

通常语音交互过程可分为唤醒、响应、输入、理解、反馈几个环节。当设备处于待机状态时,需要识别用户输入的语音唤醒信号,如果识别成功则切换到工作状态,此后则可以通过语音识别算法用户对输入的语义内容进行识别并响应,整个过程如图1所示。

从上述过程可以看出,成功唤醒电子设备是实现人机语音交互的基础,而唤醒设备的过程就是通过预设的唤醒参数检测用户的语音输入。唤醒参数如唤醒门限、拾音方向、噪声抑制参数、放大增益等的取值决定了电子设备在检测唤醒输入语音时唤醒率的高低。在实际使用过程中,用户相对设备的位置差异导致了唤醒率的不同,因此根据用户所在的位置动态设置唤醒参数可以使得电子设备在不同位置场景下保持较高的唤醒率。

pIYBAF9uXCCACWbGAAEKoHGuKwk742.png

图2 语音唤醒方法应用场景示意图

图2为上述提到的基于用户位置信息来划分区域,从而进行语音唤醒的示意图。电子设备在待机状态时可周期性地通过摄像头采集用户图像信息,并根据图像确定用户所在的位置信息。对于不同区域,设备可预先设置对应的唤醒参数,以声强为例,在近处的区域设置较大的门限,而在远处区域设置较小的门限,从而使各个区域都达到较高的唤醒率。如图2所示的三个区域各自具有一套唤醒参数,从而提高了语音交互场景下用户的使用体验。

o4YBAF9uXCGAUjaBAAITFAM0hTk601.png

图3 语音唤醒方法流程图

图3是此专利提供的一种语音唤醒方法流程示意图。以智能电视为例,首先设备通过摄像头采集图像,并通过采集的图像确定其中是否包含用户,如果包含则确定图像中第一用户所在的第一目标位置,并获取该位置下的唤醒参数。当用户输入语音后,设备根据上述唤醒参数处理输入语音信号。如果用户从区域1切换到区域2,则设备获取区域2中的唤醒参数并进行信号处理,包括模数转换、降噪、放大等,因此该设备可根据用户所在位置实时动态的对切换唤醒参数,达到更好的人机交互效果。

在智能语音服务上,Google和亚马逊的是目前公认的业界巨头,然而从此项专利可以推断出华为在语音业务上也在不断努力发展!

编辑:hfy
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 华为
    +关注

    关注

    216

    文章

    34411

    浏览量

    251470
  • 人工智能
    +关注

    关注

    1791

    文章

    47182

    浏览量

    238199
  • 语音交互
    +关注

    关注

    3

    文章

    286

    浏览量

    28002
收藏 人收藏

    评论

    相关推荐

    基于语音识别的智能会议系统具备哪些交互功能

    标贝科技专注智能语音交互领域多年,在语音识别和语音合成领域有着多项大型企业合作案例,标贝与多个智能会议系统厂商合作,成功将语音识别
    的头像 发表于 12-20 10:35 20次阅读

    电子语音芯片方案,低功耗语音播报ic,NV256H

    随着科技的不断发展,电子锁已成为现代社会中,安全性和便利性并存的必备设备。如何为电子锁行业增添智能化、人性化的功能已成为行业内的热门话题。在这个迅速发展的市场中,广州九芯电子推出了一款
    的头像 发表于 12-06 01:01 83次阅读
    <b class='flag-5'>电子</b>锁<b class='flag-5'>语音</b>芯片方案,低功耗<b class='flag-5'>语音</b>播报ic,NV256H

    基于智能语音交互的智能呼叫中心工作机制

    作为实现智能呼叫中心的关键技术之一的智能语音交互技术,它通过集成自然语言处理(NLP)、语音识别(ASR)和
    的头像 发表于 12-03 16:44 270次阅读
    基于智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>的智能呼叫中心工作机制

    智能语音的驱动力:揭秘8脚语音芯片在智能设备中的非凡角色

    语音技术渗透生活,8脚语音芯片以微缩体积、低功耗、卓越性能成智能设备语音功能核心,集成识别、合成、压缩解码等功能,实现精准
    的头像 发表于 12-02 14:23 143次阅读

    车载电子设备功能唤醒利器-震动开关

    震动开关作为车载电子设备功能唤醒的利器,在智能汽车的发展中扮演着举足轻重的角色。随着智能汽车技术的不断发展,震动开关的应用范围将进一步扩大。未来,震动开关将更加智能化、集成化,能够同时感知多种类型的振动信号,并通过先进的算法进行
    的头像 发表于 09-26 17:41 1434次阅读
    车载<b class='flag-5'>电子设备</b>功能<b class='flag-5'>唤醒</b>利器-震动开关

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    大模型语音问答、拍照识图、大模型绘图等丰富供能示例,支持语音唤醒、多轮语音交互。 2智能对话除了大模型
    发表于 06-18 17:33

    智能语音交互技术如何助力设备实现人机自然对话

    随着现代人工智能在各行业的普及,智能语音交互技术也越来越多的在日常工作、生活中应用,智能语音交互的出现不仅仅大量节省了人工的工作时间提高了工
    的头像 发表于 05-23 15:16 714次阅读
    智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b><b class='flag-5'>技术</b>如何助力<b class='flag-5'>设备</b>实现人机自然对话

    智能语音交互技术如何助力设备实现人机自然对话

    智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术,实现人与机器之间自然语言的交流和
    的头像 发表于 05-23 15:14 375次阅读

    WTK6900G语音识别芯片在车载语音交互氛围灯上的应用案例解析

    随着智能汽车的快速发展,车载语音交互技术逐渐成为提升驾驶体验的关键技术之一。传统的车载灯光控制系统往往依赖于手动操作,不仅操作繁琐,而且在驾驶过程中容易分散驾驶员的注意力。因此,开发一
    的头像 发表于 05-17 13:57 405次阅读

    离线自然说,无需记固定唤醒词也能语音控制设备

    电子发烧友网报道(文/李弯弯)离线语音识别是指不需要依赖网络,在本地设备实现语音识别的过程,通常以端侧AI语音芯片作为载体来进行数据的采集、
    的头像 发表于 04-29 09:12 4468次阅读
    离线自然说,无需记固定<b class='flag-5'>唤醒</b>词也能<b class='flag-5'>语音</b>控制<b class='flag-5'>设备</b>!

    设备更聪明 |离线自然说,开启智能语音交互新体验!

    离线语音识别是指不需要依赖网络,在本地设备实现语音识别的过程,通常以端侧AI语音芯片作为载体来进行数据的采集、计算和决策。但是语音芯片的存储
    的头像 发表于 01-10 08:15 1004次阅读
    让<b class='flag-5'>设备</b>更聪明 |离线自然说,开启智能<b class='flag-5'>语音</b><b class='flag-5'>交互</b>新体验!

    语音数据集:智能语音技术的燃料与推动力

    随着人工智能技术的不断进步,语音技术作为人机交互的重要方式,正在逐渐渗透到我们的日常生活中。而语音数据集作为智能
    的头像 发表于 12-29 11:11 406次阅读

    语音数据集:推动人工智能语音技术的关键要素

    随着人工智能技术的飞速发展,语音技术已成为人机交互领域的重要一环。语音数据集作为支撑语音
    的头像 发表于 12-29 11:00 631次阅读

    语音数据集:智能语音技术的基石与挑战

    随着人工智能技术的飞速发展,语音技术已成为人机交互领域的重要突破口。语音数据集作为支撑语音
    的头像 发表于 12-28 11:28 714次阅读

    科大讯飞语音控制模块怎么用

    科大讯飞语音控制模块是一种人机交互技术,它利用语音识别和语音合成技术,使用户可以通过
    的头像 发表于 12-25 13:58 1806次阅读