1 三星无声语音助手专利解密:可以完成精准语音识别任务-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

三星无声语音助手专利解密:可以完成精准语音识别任务

ss 来源:爱集微APP 作者:爱集微APP 2021-02-12 15:03 次阅读

【嘉德点评】三星发明的可以完成精准语音识别任务的语音识别助手,在交互时无需发出语音,仅通过用户少量选择操作就可以完成复杂的交互任务,因此,可以简便且准确地采用语音识别方式来实现交互任务。

集微网消息,在2019年,三星就曾预告过新的“人造人”NEON助手,并表示NEON可以像真正的人类一样进行对话,并有一定的感知能力。NEON的网站上宣传其外观和行为都像真实的人类,能够表现出情感和智慧,而据相关消息,三星最终将随三星Galaxy S21 Ultra独家发售这款数字助手。

数字助手首先也是一款手机助手软件,目前,智能手机能够提供各种类型的应用服务,其中就包括手机助手软件,用户可以通过语音、文字等方式与智能手机之间进行交互,智能手机通过该语音识别助手软件识别语音后,提供对应的应用服务。

智能手机识别语音的功能可以有三种方式:交互任务型、知识问答型及闲聊型。其中,交互任务型语音识别方式使得用户可以通过直接的语音输入,由智能手机识别该语音,完成与智能手机的应用服务之间的交互意图,而无需进行多次语音识别界面的操作。

但是,智能手机提供的交互任务型语音识别方式对用户来说,使用率并不高,这是因为用户在通过语音操控智能手机时,存在以下缺点:1)公众场合不适合使用语音,有隐私问题;2) 智能手机处于嘈杂的远程环境下,语音识别的效果不佳;3)因为用户发音不准确,形同意思的表述方式多样等因素,语音识别和语音理解的准确率还需要提高;4)有些用户不习惯使用智能手机提供的语音识别界面。

那么,智能手机该如何在这些条件下简便且准确地采用语音识别方式实现交互任务呢?为此,三星在2019年9月27日申请了一项名为“一种采用语音识别方式实现交互任务的方法及系统”的发明专利(申请号:201910921533.6),申请人为三星电子(中国)研发中心和三星电子株式会社。

根据该专利目前公开的资料,让我们一起来看看这项应用于智能设备的语音识别方法及系统吧。

如上图,为该专利中发明的采用语音识别方式实现交互任务的方法流程示意图,首先,系统会基于当前环境进行语音识别来得到文本以及语义信息,基于得到的文本以及语义信息,来确定对应的上下文信息,且划分不同的场景,基于不同的场景来在系统中匹配不同的语音技能推荐表。

这种利用语音技能推荐表的方式,可以更加准确的应对不同的场景,通过事先准备好丰富的语料库,就可以非常人性化的与用户进行对话以及完成相应的操作。而当要实现交互任务时,则会根据语音技能推荐表执行智能手机的交互任务。同时,由于是智能助手主动分析用户所处场景,并主动提供相关的操作服务,因此无需用户主动发起语音唤醒,而是由语音助手主动为用户提供相关服务,只需用户进行选择即可。

如上图,为这种采用语音识别方式实现交互任务的方法子流程图,当用户唤醒语音助手插件模块时,语音助手插件模块被触发,该模块通知语言输入信息采集模块启动信息采集,信息采集模块通过上下文感知模块获取到当前的环境信息,再向语音助手插件模块发送请求,来获取从用户语音识别得到的文本,以及做自然语言理解后的语义信息。

之后,语言输入信息采集模块将采集到的文本、语义信息及当前的环境信息传输给语言技能生成模块,由此来生成语言技能库,并通知语言技能推荐模块。

语言技能推荐模块在特定情况下可以启动,将大量不同的上下文划分到若干类场景中,对每个场景生成相应的语言技能推荐表。

如上图,为在手机上使用语言技能推荐表的展示图,该款语音助手插件模块为Bixby,当每次都调用Bixby时,都会显示出语言技能推荐表,并且场景不同,该语言技能推荐表中的推荐技能偶读不同。

例如,经过学习后,如果用户打开手机并且唤醒了Bixby,则就可以触发语言技能推荐表的展示,当用户选择某条推荐的语言技能时,将该语言技能推荐表中的文本用作用户语言输入识别的结果,以完成后续用户的指令。

以上就是三星发明的可以完成精准语音识别任务的静默式语音识别助手,其在实现交互任务时,基于当前环境下对语音识别得到文本以及语音信息,在交互时无需发出语音,仅通过用户少量选择操作就可以完成复杂的交互任务,因此可以简便且准确地采用语音识别方式来实现交互任务。

责任编辑:xj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 三星电子
    +关注

    关注

    34

    文章

    15859

    浏览量

    180979
  • 语音助手
    +关注

    关注

    7

    文章

    235

    浏览量

    26799
收藏 人收藏

    评论

    相关推荐

    语音识别与自然语言处理的关系

    在人工智能的快速发展中,语音识别和自然语言处理(NLP)成为了两个重要的技术支柱。语音识别技术使得机器能够理解人类的语音,而自然语言处理则让
    的头像 发表于 11-26 09:21 324次阅读

    语音识别技术的应用与发展

    语音识别技术的发展可以追溯到20世纪50年代,但直到近年来,随着计算能力的提升和机器学习技术的进步,这项技术才真正成熟并广泛应用于各个领域。语音识别
    的头像 发表于 11-26 09:20 388次阅读

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。以下是对ASR
    的头像 发表于 11-18 15:12 544次阅读

    WTK6900FC语音识别模块

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月25日 17:35:07

    唯创知音WT2605C用在离在线语音识别方案# #语音芯片 #语音识别 #唯创知音

    语音识别
    WT-深圳唯创知音电子有限公司
    发布于 :2024年09月12日 17:24:28

    三星Bixby语音助手即将进军家电产品,实现自然语言交互

     三星宣布,Bixby语音助手即将全面进驻BESPOKE AI系列家电,用户可通过自然语言对家电进行语音控制。Bixby作为三星智能手机、手
    的头像 发表于 08-26 17:20 751次阅读

    什么是离线语音识别芯片?与在线语音识别的区别

    离线语音识别芯片适用于智能家电等,特点为小词汇量、低成本、安全性高、响应快,无需联网。在线语音识别功能更广泛、识别准确率高,但依赖稳定网络。
    的头像 发表于 07-22 11:33 397次阅读

    ESP32-WROOM跑了官方的语音识别中的asr例程,但是切换到语音识别就会出错的原因?

    我是用的是ESP32-WROOM芯片,用的Vscode+IDF+ADF,我跑了一下官方的语音识别中的asr例程,但是我发现,语音唤醒可以,但是一旦切换到
    发表于 07-19 08:27

    三星即将发布Bixby升级版:基于大语言模型的创新飞跃

    在科技日新月异的今天,三星电子再次站在了智能语音助手技术的前沿。公司总裁兼移动体验业务负责人TM Roh近期宣布了一项激动人心的消息:三星今年将推出基于先进大语言模型(LLM)的Bix
    的头像 发表于 07-12 17:46 1374次阅读

    语音数据集:智能驾驶中车内语音识别技术的基石

    的发展趋势。 二、语音数据集在智能驾驶中的应用 训练与优化:高质量的语音数据集是训练和优化语音识别模型的基础。通过大量的语音数据,系统
    的头像 发表于 01-31 16:07 538次阅读

    智能语音助手在医疗行业的应用与挑战

    介绍语音数据集在医疗智能语音助手中的应用、面临的挑战以及未来的发展趋势。 二、语音数据集在医疗智能语音
    的头像 发表于 01-19 17:37 663次阅读

    智能语音助手在旅游行业的应用与挑战

    详细介绍语音数据集在旅游智能语音助手中的应用、面临的挑战以及未来的发展趋势。 二、语音数据集在旅游智能语音
    的头像 发表于 01-19 17:30 790次阅读

    智能语音助手在教育行业的应用与挑战

    介绍语音数据集在教育智能语音助手中的应用、面临的挑战以及未来的发展趋势。 二、语音数据集在教育智能语音
    的头像 发表于 01-19 17:21 845次阅读

    智能语音助手在医疗行业的应用与挑战

    介绍语音数据集在医疗智能语音助手中的应用、面临的挑战以及未来的发展趋势。 二、语音数据集在医疗智能语音
    的头像 发表于 01-18 16:41 519次阅读

    语音数据集在智能语音助手中的应用与挑战

    。本文将详细介绍语音数据集在智能语音助手中的应用、面临的挑战以及未来的发展趋势。 二、语音数据集在智能语音
    的头像 发表于 01-18 15:46 385次阅读