语音识别如何改善电信业客服体验-德赢Vwin官网网

近年来，电信业出现了大量 AI 驱动的技术，尤其是语音识别和翻译。多语种 AI 虚拟助手、数字人、聊天机器人、语音客服、音频转录等技术正在大幅改变电信业。企业正在呼叫中心部署 AI 以加快解决来电请求的速度，大幅提升客户体验、员工留存率和品牌声誉。

例如，自动语音识别（ASR），即语音转文本已被用于实时对话转录，这使企业能够迅速为客户确定资源或解决方案。语音 AI 还被用于分析情绪、识别分歧来源、提高合规性和坐席表现等。

本文将深入探讨语音识别在电信业的变革力量，并着重介绍 AT&T、T-Mobile 等行业领导者如何利用这些最先进的技术在其呼叫中心提供无与伦比的客户体验。

语音转文字对改善客户服务的影响

语音转文字技术的落地已为客服领域带来了巨大改变。通过实现呼叫路由、呼叫分类和语音认证等任务的自动化，企业可以大大缩短客户的等待时间并将其转接至最适合处理该请求的坐席。

语音识别还可以用于 AI 驱动的客户反馈分析，帮助改善客户满意度、产品和服务。凭借语音转文字赋能的 AI 应用，企业可以准确识别并及时满足客户需求。

AT&T 数据科学 AI 助理副总裁 Jeremy Fix 在GTC23 上概述了该公司使用 AI 改善呼叫中心体验的主要原因：

优化人员配置资源
提供个性化的客户体验
协作坐席提供可执行的洞察

资源优化

充足的人员配置是呼叫中心的关键组成部分之一，包括吸引和维系最好的人才。AT&T 通过 AI 预测呼叫中心坐席与来电数量的平衡情况，为坐席提供发挥其最佳水平所需的支持。

个性化

通过了解客户首次接通时的意图，AT&T 可以将来电者与之前解决过类似问题并且向客户适时提供相关方案的资深坐席相匹配。

语音客服

AT&T 结合呼叫转录以及自然语言处理（NLP）驱动的洞察引擎，为坐席及管理人员提供实时、可操作的洞察，帮助他们做出智能化的决策并提供高质量的客户服务（视频 1）。

视频 1. GTC23 上的 AT&T 洞察引擎演示

如何能做到实时的呢？在通话过程中，AT&T 的 NLP 引擎使用实时转录和文本挖掘技术识别讨论主题，然后推荐后续最佳行动、识别通话情绪、预测客户满意度，甚至评估坐席质量和合规性。

常见的语音转文本准确性问题

尽管语音 AI 可以帮助呼叫中心做出重大改进，但要成功落实语音转文本仍面临着一些挑战。T-Mobile 的首席机器学习工程师 Heather Nolis 在 GTC23 期间谈到了这些挑战：

语音歧义
不同的说话风格
嘈杂的环境
电话的局限性
特定领域的词汇

语音歧义

您有多少次在打电话时误解了别人的意思？比如是“上了一艘邮轮”还是“上了一艘油轮”？这种听起来相同，但含义不同的词语会造成语音歧义。如果语音转文字应用没有经过训练，无法按照上下文识别单词，就会导致转写错误。

视频 2. 语音歧义

不同的说话风格

每个人都会有不同的口音、方言和口腔生理结构，这意味着我们所说的每个词语听起来都会有所不同。对于全球运营的呼叫中心来说，必须在训练数据集中捕捉到这些微妙的差别，从而提高语音识别的准确性。

视频 3. 不同说话风格背后的原因包括生理结构差异和我们学习说话的方式

嘈杂的环境

呼叫中心坐席在与客户对话时可能受到背景噪声、同时说话的人、麦克风质量不佳，甚至手机信号不良等干扰，这些都会导致电话中的声音丢失。部署到呼叫中心的强大语音转文字应用必须能够承受这类环境。

视频 4. 噪声源包括背景噪声、同时说话的人和麦克风质量

电话的局限性

电话的局限性，包括无法记录 “S”、“F” 等某些声音会进一步阻碍语音转文字的准确性。例如，即便您在电话中听到 “free for all Friday” 这句话时实际上没有听到未被电话传送的 “f” 这个音，但您的大脑仍会将 “f” 这个音补进去。而在转录过程中，就得由语音转文本模型来填补缺失的声音。

特定领域的词汇

每一座为企业创建的呼叫中心都会遇到具有不同主题和词汇的企业场景。开箱即用的 ASR 解决方案一般未经过有效的定制化，因此在现实中很少有用。

T-Mobile 展示了他们应对语音识别问题的解决方案。该方案采用 NVIDIA Riva（一款用于构建和部署自定义语音应用的 GPU 加速 SDK）并使用 NVIDIA NeMo（对特定领域的数据进行微调）。T-Mobile 在不同口音、不同说话风格和嘈杂生产环境等干扰下，将语音识别准确率提高了 3 倍（图 1）。

图 1. T-Mobile ASR 准确率*：从位于云端到高度定制化的 Riva 语音转文本（*准确率[%]=100-WER）

实现最佳语音转文字结果的首要因素

从电信呼叫中心和紧急服务到视频会议和广播，企业在部署最先进的语音 AI 技术时必须考虑准确度、延迟、可扩展性、安全性、运营成本等诸多因素，以便在竞争中保持领先地位。

企业正在不断寻找将呼叫中心变成价值中心的新办法，而成本在这方面起到至关重要的作用。呼叫数量多的企业必须根据定价模式、总体运营成本（TCO）和隐藏成本评估厂商。

实现全方位的语言、口音和方言覆盖对所有语言的语音识别准确性都至关重要。值得高兴的是，语音AI在多语种准确性上已经取得了很大的进步。例如，Riva现在可以为英语、西班牙语、普通话、印地语、俄语、阿拉伯语、日语、韩语、德语、葡萄牙语、法语和意大利语提供全球领先的语音识别。

最后，语音 AI 模型必须实现低延迟才能为坐席和客户提供更好的实时体验。如果在坐席与客户对话的过程中，AI 无法足够快地向坐席提供有关后续行动的建议，那就会变得毫无用处。

T-Mobile 详细介绍了他们的语音转文本评估流程，展示了一项重要的发现—— Riva 语音识别在延迟、成本效益和准确性方面均优于当前的云供应商模型。

视频 5. T-Mobile 的语音转文本评估指标：延迟、成本效益和准确性

在 GTC23 专题讨论会“使用先进的语音 AI 技术引领潮流”上，Infosys、Quantiphi 和摩托罗拉分享了他们通过在电信解决方案中部署语音 AI 解决这些问题的经验。

要点总结

将语音和翻译 AI 集成到客服 AI 解决方案中正在给电信行业带来变革。通过使用客户会话的实时多语种转录，电信公司可以更好地对来电进行分类和转接，并向坐席提供有价值的洞察和个性化的建议。

拥抱这项技术的电信公司可凭借提供卓越的客户体验、在竞争中保持领先并满足客户不断变化的需求，从而获得在市场中的竞争优势。

点击“阅读原文”，或扫描下方海报二维码，观看 NVIDIA 创始人兼 CEO 黄仁勋在 COMPUTEX 2023 的主题演讲直播回放，主题演讲中文字幕版已上线，了解 AI、图形及其他领域的最新进展！

原文标题：语音识别如何改善电信业客服体验

文章出处：【微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英伟达

英伟达

+关注

关注
22

文章
3770

浏览量
90984

原文标题：语音识别如何改善电信业客服体验

文章出处：【微信号：NVIDIA_China，微信公众号：NVIDIA英伟达】欢迎添加关注！文章转载请注明出处。

语音识别与自然语言处理的关系

在人工智能的快速发展中，语音识别和自然语言处理（NLP）成为了两个重要的技术支柱。语音识别技术使得机器能够理解人类的语音，而自然语言处理则让

发表于 11-26 09:21 •325次阅读

语音识别技术的应用与发展

语音识别技术的发展可以追溯到20世纪50年代，但直到近年来，随着计算能力的提升和机器学习技术的进步，这项技术才真正成熟并广泛应用于各个领域。语音识别技术的应用不仅提高了工作效率，也极大

发表于 11-26 09:20 •389次阅读

ASR与传统语音识别的区别

ASR（Automatic Speech Recognition，自动语音识别）与传统语音识别在多个方面存在显著的区别。以下是对这两者的对比：一、技术基础 ASR ：基于深度学习算

发表于 11-18 15:22 •439次阅读

ASR语音识别技术应用

ASR（Automatic Speech Recognition）语音识别技术，是计算机科学与人工智能领域的重要突破，能将人类语音转换为文本，广泛应用于智能家居、医疗、交通等多个领域。以下是对ASR

发表于 11-18 15:12 •554次阅读

广和通具身智能机器人开发平台Fibot入选中国信通院“人工智能+电信业”赋智先锋案例

9月26日，在中国国际信息通信展（简称“PT展”）分论坛“信息通信行业智能化变革论坛”上，中国信通院与《通信产业网》联合公布了2024年“人工智能+电信业”领航先锋案例。广和通具身智能机器人开发平台

发表于 10-10 10:43 •272次阅读

广和通具身智能机器人开发平台Fibot入选中国信通院“人工智能+<b class='flag-5'>电信业</b>”赋智先锋案例

广和通具身智能机器人开发平台Fibot入选中国信通院“人工智能+电信业”赋智先锋案例

发表于 10-10 10:42 •333次阅读

广和通Fibot平台入选“人工智能+电信业”赋智先锋案例

近日，在中国国际信息通信展（PT展）的“信息通信行业智能化变革论坛”上，中国信通院与《通信产业网》携手揭晓了2024年“人工智能+电信业”领航先锋案例。经过严格评选，广和通具身智能机器人开发平台Fibot脱颖而出，成功入选“人工智能+电信业”赋智先锋案例，彰显了其在推动产

发表于 10-08 15:23 •432次阅读

物联网系统智能控制产品的语音识别方案_离线语音识别芯片分析

01 物联网系统中为什么要使用离线语音识别芯片物联网系统中使用离线语音识别芯片的原因主要基于以下几个方面： 1、实时性与可靠性实时性好：离线语音

发表于 09-26 17:56 •557次阅读

WTK6900FC语音识别模块

语音识别

WT-深圳唯创知音电子有限公司
发布于 :2024年09月25日 17:35:07

唯创知音WT2605C用在离在线语音识别方案# #语音芯片 #语音识别 #唯创知音

语音识别

WT-深圳唯创知音电子有限公司
发布于 :2024年09月12日 17:24:28

智能头盔语音识别声控芯片，AI离线语音识别ic方案，NRK3301

头盔是交通事故中保护电动车车主安全的最后一道屏障。为了增加骑行用户的安全保护，改善骑行用户的出行体验，让用户从被动使用头盔到主动佩戴头盔，头盔厂家与九芯电子合作，推出了语音智能头盔，它具备首家骑行

发表于 09-10 08:02 •342次阅读

什么是离线语音识别芯片？与在线语音识别的区别

离线语音识别芯片适用于智能家电等，特点为小词汇量、低成本、安全性高、响应快，无需联网。在线语音识别功能更广泛、识别准确率高，但依赖稳定网络。

发表于 07-22 11:33 •398次阅读

中软国际智能语音识别解决方案正式发布

当前，人工智能正以前所未有的速度渗透千行百业。其中，语音识别技术作为人机交互的重要入口，扮演着越来越重要的角色，并逐渐成为智能家居、智能客服、智能医疗等众多领域的关键技术支撑。

发表于 06-29 16:47 •924次阅读

中国电信发布首个支持30种方言混说语音大模型

中国电信人工智能研究院（TeleAI）近日发布了一项引领业界的语音识别技术——星辰超多方言语音识别大模型。这一模型突破性地支持30种方言的自

发表于 05-28 09:14 •570次阅读

语音数据集在智能客服系统中的应用与挑战

的效率和质量。本文将详细介绍语音数据集在智能客服系统中的应用、面临的挑战以及未来的发展趋势。二、语音数据集在智能客服系统中的应用语音

发表于 12-25 09:46 •471次阅读

搜索历史

语音识别如何改善电信业客服体验

评论

语音识别与自然语言处理的关系

语音识别技术的应用与发展

ASR与传统语音识别的区别

ASR语音识别技术应用

广和通具身智能机器人开发平台Fibot入选中国信通院“人工智能+电信业”赋智先锋案例

广和通具身智能机器人开发平台Fibot入选中国信通院“人工智能+电信业”赋智先锋案例

广和通Fibot平台入选“人工智能+电信业”赋智先锋案例

物联网系统智能控制产品的语音识别方案_离线语音识别芯片分析

WTK6900FC语音识别模块

唯创知音WT2605C用在离在线语音识别方案# #语音芯片 #语音识别 #唯创知音

智能头盔语音识别声控芯片，AI离线语音识别ic方案，NRK3301

什么是离线语音识别芯片？与在线语音识别的区别

中软国际智能语音识别解决方案正式发布

中国电信发布首个支持30种方言混说语音大模型

语音数据集在智能客服系统中的应用与挑战