1 浅析语音识别技术的发展历程-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

浅析语音识别技术的发展历程

汽车玩家 来源:旺龙ITLONG、eepw、个人图书 作者:旺龙ITLONG、eepw、个 2022-02-07 10:43 次阅读

语音识别,通常称为自动语音识别,主要是将人类语音中的词汇内容转换为计算机可读的输入,也有可能是按键、二进制编码或者字符序列。但是,我们一般理解的语音识别其实都是狭义的语音转文字的过程,简称语音转文本识别,主要是识别和确认发出语音的人而非其中所包含的内容。

语音识别的目的就是让机器听懂人类口述的语言,包括了两方面的含义:一是逐字逐句听懂而不是转化成书面的语言文字;二是对口述语言中所包含的命令或请求加以领会,做出正确回应,而不仅仅只是拘泥于所有词汇的正确转换。

语音识别系统根据对输入语音的限制分类,可以将识别系统分为三类:

①特定人语音识别系统,仅考虑对于专人的话音进行识别。

②非特定人语音系统,识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习。

③多人的识别系统,通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组人的语音进行训练。

根据从说话的方式考虑,也可以将识别系统分为三类:

①孤立词语音识别系统,孤立词识别系统要求输入每个词后要停顿。

②连接词语音识别系统,连接词输入系统要求对每个词都清楚发音,一些连音现象开始出现。

③连续语音识别系统,连续语音输入是自然流利的连续语音输入,大量连音和变音会出现。

在过去5-10年,随着技术快速迭代,语音识别市场在我国得到飞快发展,目前处于深度神经网络阶段。如今,语音识别主流厂商主要使用端到端的算法,在实验环境准确率可高达99%以上,为推动新基建发展,5G人工智能云计算等作为辅助核心基础设施的核心技术得到进一步加速发展,带动语音识别迎来迎来了更加广阔的发展空间,智能家居智能音箱智能车载和智能硬件等等都得到很好的广泛应用。

语音识别主要趋于远场化和融合化的方向发展,但在远场可靠性还有很多难点没有突破,比如多轮交互、多人噪杂等场景还有待突破,还有需求较为迫切的人声分离等技术。新的技术应该彻底解决这些问题,让机器听觉远超人类的感知能力。这不能仅仅只是算法的进步,需要整个产业链的共同技术升级,包括更为先进的传感器和算力更强的芯片

单从远场语音识别技术来看,仍然存在很多挑战,包括:

回声消除技术。由于喇叭非线性失真的存在,单纯依靠信号处理手段很难将回声消除干净,这也阻碍了语音交互系统的推广,现有的基于深度学习的回声消除技术都没有考虑相位信息,直接求取的是各个频带上的增益,能否利用深度学习将非线性失真进行拟合,同时结合信号处理手段可能是一个好的方向。

噪声下的语音识别仍有待突破。信号处理擅长处理线性问题,深度学习擅长处理非线性问题,而实际问题一定是线性和非线性的叠加,因此一定是两者融合才有可能更好地解决噪声下的语音识别问题。

语音识别的目的是让机器可以理解人类,因此转换成文字并不是最终的目的,如何将语音识别和语义理解结合起来可能是未来更为重要的一个方向。语音识别里的LSTM已经考虑了语音的历史时刻信息,但语义理解需要更多的历史信息才能有帮助,因此如何将更多上下文会话信息传递给语音识别引擎是一个难题。

让机器听懂人类语言,仅靠声音信息还不够,“声光电热力磁”这些物理传感手段,下一步必然都要融合在一起,只有这样机器才能感知世界的真实信息,这是机器能够学习人类知识的前提条件;而且,机器必然要超越人类的五官,能够看到人类看不到的世界,听到人类听不到的世界。

未来,相信在国家政策的强力扶持下,能够加速在垂直行业的渗透和布局,也相信在供应商和开发者共同努力下,语音识别技术能够更好地与其他语音交互技术及软件功能融合,为消费者提供更优质的体验。

文章整合自:旺龙ITLONG、eepw、个人图书馆

审核编辑:鄢孟繁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语音识别
    +关注

    关注

    38

    文章

    1739

    浏览量

    112632
  • 机器
    +关注

    关注

    0

    文章

    780

    浏览量

    40710
  • 二进制编码
    +关注

    关注

    0

    文章

    8

    浏览量

    3048
收藏 人收藏

    评论

    相关推荐

    语音识别技术在医疗领域的应用

    语音识别技术在医疗领域的应用已经越来越广泛,为医疗服务带来了诸多便利和效率提升。以下是对语音识别技术
    的头像 发表于 11-26 09:35 254次阅读

    语音识别与自然语言处理的关系

    在人工智能的快速发展中,语音识别和自然语言处理(NLP)成为了两个重要的技术支柱。语音识别
    的头像 发表于 11-26 09:21 324次阅读

    语音识别技术的应用与发展

    语音识别技术发展可以追溯到20世纪50年代,但直到近年来,随着计算能力的提升和机器学习技术的进步,这项
    的头像 发表于 11-26 09:20 388次阅读

    ASR语音识别技术应用

    ASR(Automatic Speech Recognition)语音识别技术,是计算机科学与人工智能领域的重要突破,能将人类语音转换为文本,广泛应用于智能家居、医疗、交通等多个领域。
    的头像 发表于 11-18 15:12 544次阅读

    直径测量工具的发展历程

    关键字:直径测量,工业直径测量设备,线性尺量器,光电测径仪, 直径测量工具的发展历程是一个悠久且不断创新的过程,它随着科学技术的进步而不断演变。以下是直径测量工具发展
    发表于 10-10 16:55

    NAND闪存的发展历程

    NAND闪存的发展历程是一段充满创新与突破的历程,它自诞生以来就不断推动着存储技术的进步。以下是对NAND闪存发展
    的头像 发表于 08-10 16:32 1248次阅读

    语音识别和自然语言处理的区别和联系

    Recognition) 1. 定义 语音识别,又称为自动语音识别(Automatic Speech Recognition, ASR),是指将人类的
    的头像 发表于 07-05 10:09 1689次阅读

    人工智能的语音识别技术详解

    随着科技的飞速发展,人工智能(AI)技术已经渗透到我们生活的方方面面,其中语音识别技术作为AI领域的重要分支,更是以其独特的魅力和广泛的应用
    的头像 发表于 07-01 11:39 1200次阅读

    语音识别技术历程及工作原理

    语音识别的本质是一种基于语音特征参数的模式识别,即通过学习,系统能够把输入的语音按一定模式进行分类,进而依据判定准则找出最佳匹配结果。
    的头像 发表于 03-22 16:58 3089次阅读
    <b class='flag-5'>语音</b><b class='flag-5'>识别</b>的<b class='flag-5'>技术</b><b class='flag-5'>历程</b>及工作原理

    车内语音识别技术在智能驾驶中的应用与前景

    一、引言 随着智能驾驶技术的快速发展,车内语音识别技术逐渐成为智能驾驶领域的研究热点。语音
    的头像 发表于 02-19 11:46 799次阅读

    车内语音识别技术:智能驾驶的核心要素

    一、引言 随着科技的飞速发展,智能驾驶已经成为未来出行的趋势。作为智能驾驶的关键技术之一,车内语音识别技术发挥着越来越重要的作用。它不仅提升
    的头像 发表于 02-19 11:42 753次阅读

    车内语音识别技术:智能驾驶的革新之源

    一、引言 随着科技的飞速发展,智能驾驶已经成为现代交通领域的热门话题。作为智能驾驶的关键技术之一,车内语音识别技术正在改变我们对驾驶的认知。
    的头像 发表于 02-19 10:10 439次阅读

    车内语音识别技术:重塑智能驾驶的未来

    一、引言 随着科技的飞速发展,智能驾驶已经成为未来交通的必然趋势。作为智能驾驶的关键技术之一,车内语音识别技术正逐渐成为研究的热点。它不仅提
    的头像 发表于 02-19 10:09 636次阅读

    语音数据集:智能驾驶中车内语音识别技术的基石

    一、引言 在智能驾驶中,车内语音识别技术发挥着越来越重要的作用。语音数据集作为这一技术的基石,其质量和规模对
    的头像 发表于 01-31 16:07 538次阅读

    语音数据集:智能语音技术的基石与挑战

    随着人工智能技术的飞速发展语音技术已成为人机交互领域的重要突破口。语音数据集作为支撑语音
    的头像 发表于 12-28 11:28 714次阅读