智能语音交互是怎么实现交互流程中的输入输出呢?-德赢Vwin官网网

小爱同学是小米公司于2017年7月26日发布的收款人工智能（AI）音箱的唤醒词及二次元人物形象。小爱同学一经推入市场便受万千宠爱，网络上关于小爱同学的使用体验各式各样，无不是在称赞，他们对小爱同学的功能、特点无不熟悉，但是你知道小爱同学是怎么工作的吗？

智能语音交互是人工智能的分支，相当于语音助手，属于一款智能型的手机应用，通过智能对话与即时问答的智能交互，实现帮助用户解决问题的功能。

说起智能语音助手大家首先想起的是哪些呢？

1. Siri

苹果iOS系统中的人工智能助手软件

2. Cortana

微软开发的全球第一款人工智能助手，中文名小娜，横跨手机与PC两大平台。

3. Alexa

亚马逊推出的语音助手，主要搭载在Amazon Fcho智能音箱上。

智能语音交互是怎么实现交互流程中的输入输出呢？

智能语音交互界面事实上包含了三个技术环节：

1. 语音识别（ASR）

将人类的语音中的词汇转换为计算机可读的输入，一般包括了信号处理，尽可能的降低环境噪声、信道、说话人等因素对特征造成的影响。用户根据系统设计的口令密码与系统进行沟通。

比如：小爱同学的操作执行，每次发出指令的模式必须是“小爱同学+工作任务”，小爱同学接收后在把语音转化成文字，再结合文字做出指令回复。

2. 语义处理（NLP）

自然语言的处理，就是把人的语言转化成机器能够理解的数字，分解开，并回复相应的语言。很多在购买智能音箱之后都会有觉得是“智障音箱”的主要原因就在这里，现在的技术条件下，只能做到固定的回答，无法像人类一样思考，再加上人类语言有大量的表达方式和歧义语句，理解错误的地方也非常多。语义处理的主要目的就是把人类语言与机器语言尽可能的相互接近，实现真正的用户正常对话。

3. 语音合成（TTS）

是通过机械的、电子的方法产生人造语音的技术，将计算机自己产生的、或外部输入的文字信息转变为乐意听得懂的、流利的汉语口语输出的技术，可以让机器人像人一样开口说话，小爱同学就是通过这项技术跟你交流的。

语音交互发展的优势

1. 解放双手、双眼、双腿，接触空间限制，远场可交互

2. 指向明确，语义直达目标，缩短使用路径

3. 自然简单人性化，学习门槛低

4. 可以一对一，也可以一对多

5. 对硬件的要求低

语音交互的劣势

1. 不适合用户选择多、流程长，需要大量辅助信息决策的交互任务

2. 远场语音交互对距离、噪音、混响、声源数量等有一定的要求

3. 不适用于公共场合，需要安静的尝试

4. 依赖嘴巴和耳朵，对语种、口音和发音有一定要求

5. 输出信息单一，表达能力有限

从技术和时间上来说，现在的智能语音交互系统还是存在一定缺陷和局限的，但是我们相信任何技术都是在实践中成长的，你们的小爱同学也会越来越惹人爱的。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30726

浏览量
268870
人工智能

人工智能

+关注

关注
1791

文章
47182

浏览量
238199
智能语音

智能语音

+关注

关注
10

文章
782

浏览量
48758

原文标题：智能语音交互：你知道小爱同学是怎么工作的吗？

文章出处：【微信号：dkiot888，微信公众号：鼎酷IOT部落】欢迎添加关注！文章转载请注明出处。

【实操文档】在智能硬件的大模型语音交互流程中接入RAG知识库

本帖最后由 jf_40317719 于 2024-9-29 17:13 编辑智能硬件的语音交互接入大模型后可以直接理解自然语言内容，但大模型作为一个语言模型，对专业领域知识的训练缺乏也是

发表于 09-29 17:12

车载导航人机语音交互系统的实现

利用小词汇量的关键词识别引擎实现大词汇量POI名称的识别，并且获得了满意的识别正确率，但是耗时较长。结语本文主要完成了车载导航人机语音交互系统的设计和实现，并在实验室环境

发表于 08-15 21:27

【Gokit 3试用体验】通过Lark 7618模组实现语音交互+语音交互UI设计理念

语言是人类交互最自然最舒适的方法，而今天，机智云Gokit 3上Lark7618智能语音识别模块提供了一个很好的外围音频实时采集电路，以及快速的音频合成输出系统，有这两样，加持Goki

发表于 08-28 13:46

智能音箱混战远场语音交互只是开始

　　导读：远场语音交互开始是智能音响，但是将来绝对不仅仅是智能音响，技术还会扩展到很多其他的产品。　　7月5日，阿里推出了自己的首款消费级AI产品天猫精灵X1，同日百度也宣布了Du

发表于 07-17 09:37

请问labview动态调用子vi的输入输出怎么和主程序交互

labview中动态调用子vi，子vi的输入输出怎么和主程序交互

发表于 01-16 20:17

车载导航人机语音交互系统的设计和实现

的设计中，根据人机交互的需求，设计语音导航系统的硬件框架如图 1所示。语音导航系统和用户之间的人机交互接口由触摸屏、按钮、话筒、显示屏和扩音

发表于 05-07 07:00

探析智能语音交互应用和技术

北京声加科技CEO邱锋海受邀以《声加万物、聆听未来：智能语音交互应用和技术》为题，分享了目前正在爆发的智能语音

发表于 11-23 09:54 •4810次阅读

什么是人机交互技术？

计算机输入、输出设备，以有效的方式实现人与计算机对话的技术。人机交互系统的主要组成 1、多模态输入/输

发表于 11-02 15:14 •1.9w次阅读

智能交互终端的功能智能交互终端怎么设置

智能交互终端是指能够通过人机交互的方式，实现信息互动、控制操作等功能的设备。具体包括以下几个方面的功能：　　1. 语音

发表于 04-16 11:53 •4367次阅读

什么是智能交互终端功能

家一起来看一下吧。智能交互系统智能交互系统是指通过计算机输入、输出设备，以有效的方式

发表于 06-15 14:04 •778次阅读

请问MCU是如何实现IO口的输入输出控制的？

GPIO（General Port Input&Output）通用输入输出接口，MCU各个管脚对外交互最根本的单位。

发表于 08-10 11:10 •3210次阅读

情感语音识别技术在人机交互中的应用与挑战

一、引言随着人工智能技术的不断发展，人机交互已经成为了研究的热点之一。情感语音识别技术作为人机交互中的重要组成部分，能够通过识别人的

发表于 11-09 15:27 •873次阅读

智能语音交互技术如何助力设备实现人机自然对话

智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术，实现人与机器之间自然语言的交流和

发表于 05-23 15:14 •375次阅读

基于智能语音交互的智能呼叫中心工作机制

作为实现智能呼叫中心的关键技术之一的智能语音交互技术，它通过集成自然语言处理（NLP）、语音识别

发表于 12-03 16:44 •270次阅读

搜索历史

智能语音交互是怎么实现交互流程中的输入输出呢?

评论

【实操文档】在智能硬件的大模型语音交互流程中接入RAG知识库

车载导航人机语音交互系统的实现

【Gokit 3试用体验】通过Lark 7618模组实现语音交互+语音交互UI设计理念

智能音箱混战远场语音交互只是开始

请问labview动态调用子vi的输入输出怎么和主程序交互

车载导航人机语音交互系统的设计和实现

树莓派语音交互如何实现开关灯？

探析智能语音交互应用和技术

什么是人机交互技术？

智能交互终端的功能智能交互终端怎么设置

什么是智能交互终端功能

请问MCU是如何实现IO口的输入输出控制的？

情感语音识别技术在人机交互中的应用与挑战

智能语音交互技术如何助力设备实现人机自然对话

基于智能语音交互的智能呼叫中心工作机制