语音交互设备中的ASR和TTS技术-德赢Vwin官网网

本期导读

-Hi Siri，今天天气怎么样？

-今天天气晴，18℃至27℃，空气质量指数36，优。

手机、手表、音箱等智能设备极大地便利了我们的生活，随着语音交互设备的发展，智能交互依然面临很多挑战。

我们每天要说成百上千句话，长短不一。即便是一些转瞬即逝的口头语，也可以成为传达自我意识的载体，向他人准确传达信息。可语言似乎是人类群体特有的专利，在过往的时间中，想借助语言与其他物种、物体建立清晰明确沟通关系的可能性无限趋近于零，直到智能语音技术的出现。

作为最早落地的人工智能技术之一，AI语音技术已经得到了长足的发展。如今，智能语音技术已经被广泛集成的就是家居产品之中。在即将到来的万物互联时代，以语音交互为主的智能设备无疑将极具竞争力与吸引力。仔细一想，一众充满科技感与未来感的智能设备，将天然具备人类最熟悉的“原始交互方式”，也颇有些化繁为简、返璞归真的意味。

语音交互设备的“助听器”——ASR

在复杂环境中，我们总是可以忽略或弱化无关噪声，集中注意力进行沟通，但语音交互设备在如此环境中只会无所适从，不免陷入“交互尚未开始，便已结束”的囧境。故此，设备拥有对各类“声学场景”的声源信号进行处理、优化功能的必要性不言而喻。而借助降噪NS、语音增强SE等技术，可以对声学场景中的非语音噪音信号进行抑制，从含有噪音的语音信号中提取纯净语音，提升语音识别效果，让语音交互设备可以分辨、倾听出目标声音，进而为后续的语音交互扫清障碍。

在语音识别技术（ASR）的加持下，语音交互设备能对声音信号进行特征提取，提取而出的“特征”会作为参数，为模型计算做准备。简单理解就是将语音信息数字化，再通过相应的模型对数字化信息进行计算。后续通过声学模型计算得出相应的音素（即把声音转成音素），其目的是根据音素来找到对应的汉字或者单词，最终转换成设备可以理解的文本。

语音交互设备的“声卡”——TTS

基于语音合成技术（TTS），语音交互设备可对文本逐句分析，进行词汇、语法的和语义的分析，以确定句子的低层结构和每个字的所对应的音素组成，包括文本的断句、字词切分、多音字处理以及数字处理等。

在内置芯片和神经网络技术的支持下，语音交互设备可把处理好的文本所对应的单字或短语从语音合成库中提取，使语言学描述转化成言语波形，即把文字智能地转化为自然语音流。至此，一次完整的语音交互便成功完成。当然，在特有的智能语音控制器作用下，文本输出的语音音律将会更加流畅，使得听者在听取信息时感觉自然、毫无机器语音输出的冷漠与生涩感。

写在最后

诚然，已普遍应用于智能家居设备中的语音交互技术仍面临诸多挑战，在设备唤醒率、识别率、误报率、环境降噪等方面仍有改进的空间。但毫无疑问，在未来语音作为人类最自然、最便捷的沟通方式，将会成为所有设备和产品至关重要的入口和人与机器之间的通信纽带，而强逻辑、无视觉或者弱视觉的智能语音技术也会找到更多用武之地。

原文标题：智能交互的尽头是聊天？

文章出处：【微信公众号：安富利】欢迎添加关注！文章转载请注明出处。

审核编辑：汤梓红

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

ASR

ASR

+关注

关注
2

文章
43

浏览量
18726
TTS

TTS

+关注

关注
0

文章
41

浏览量
10787
语音交互

语音交互

+关注

关注
3

文章
286

浏览量
28002

原文标题：智能交互的尽头是聊天？

文章出处：【微信号：AvnetAsia，微信公众号：安富利】欢迎添加关注！文章转载请注明出处。

基于智能语音交互的智能呼叫中心工作机制

作为实现智能呼叫中心的关键技术之一的智能语音交互技术，它通过集成自然语言处理（NLP）、语音识别（ASR

发表于 12-03 16:44 •270次阅读

ASR与传统语音识别的区别

ASR（Automatic Speech Recognition，自动语音识别）与传统语音识别在多个方面存在显著的区别。以下是对这两者的对比：一、技术基础

发表于 11-18 15:22 •437次阅读

ASR技术的未来发展趋势 ASR系统常见问题及解决方案

自动语音识别（Automatic Speech Recognition，简称ASR）技术是人工智能领域的一个重要分支，它使得机器能够理解和处理人类语言。随着技术的进步，

发表于 11-18 15:20 •642次阅读

ASR与自然语言处理的结合

ASR（Automatic Speech Recognition，自动语音识别）与自然语言处理（NLP）是人工智能领域的两个重要分支，它们在许多应用中紧密结合，共同构成了自然语言理解和生成的技

发表于 11-18 15:19 •388次阅读

ASR和机器学习的关系

语音识别技术的目标是将人类语音转换成可读的文本。这项技术在多个领域都有应用，包括语音助手、语音转

发表于 11-18 15:16 •299次阅读

ASR在智能家居中的应用

随着科技的飞速发展，人工智能技术（AI）已经渗透到我们生活的方方面面，其中自动语音识别（Automatic Speech Recognition，简称ASR）技术在智能家居领域的应用尤

发表于 11-18 15:15 •441次阅读

ASR语音识别技术应用

ASR（Automatic Speech Recognition）语音识别技术，是计算机科学与人工智能领域的重要突破，能将人类语音转换为文本，广泛应用于智能家居、医疗、交通等多个领域。

发表于 11-18 15:12 •544次阅读

语音提示器-WT3000A离在线TTS方案-打破语种限制/AI对话多功能支持

TTS（Text To Speech ）技术作为智能语音领域的重要组成部分，能够将文本信息转化为逼真的语音输出，为各类硬件设备提供便捷的

发表于 10-25 10:36 •218次阅读

语音提示器-WT3000A离在线TTS方案-打破语种限制/AI对话多功能支持

前言forewordTTS（TextToSpeech）技术作为智能语音领域的重要组成部分，能够将文本信息转化为逼真的语音输出，为各类硬件设备提供便捷的

发表于 10-25 08:11 •208次阅读

WT2605C TTS在线语音合成芯片：赋能多行业领域，引领产品智能化

在当今科技日新月异的时代，语音技术正逐步渗透到我们生活的方方面面，而TTS（Text-To-Speech，文本到语音）技术作为其中的重要一环

发表于 09-12 15:54 •296次阅读

整合离线语音识别ASR和TTS，内存映射时发生内存不足怎么解决？

整合TTS和ASR，发现识别模型和TTS字典映射冲突，应该是只有4M的数据空间可以映射导致的，换了16M模组也不行，应该不是flash的问题，测试找到返回错误0x101的位置是按页映射的函数里

发表于 06-28 07:34

智能语音交互技术如何助力设备实现人机自然对话

随着现代人工智能在各行业的普及，智能语音交互技术也越来越多的在日常工作、生活中应用，智能语音交互

发表于 05-23 15:16 •715次阅读

智能语音交互技术如何助力设备实现人机自然对话

智能语音交互技术是指通过语音识别、语音合成和自然语言理解等技术，实现人与机器之间自然语言的交流和

发表于 05-23 15:14 •376次阅读

WT3000T8-TTS语音合成芯片及应用场景介绍

TTS语音合成芯片是一种能够将文本信息转化为自然语音的专用芯片。它通过内置的语音合成算法和音频处理单元，实现了文本到语音的高效转换，为各种智

发表于 04-18 18:03 •875次阅读

玩转语音合成芯片（TTS芯片），看这一篇就够了

什么是语音合成芯片：语音合成芯片也称为TTS芯片，即文字转语音芯片，是一种能够将输入的文字信息转换为语音输出的芯片。通过

发表于 03-19 18:13 •1391次阅读