10 月 29 日,广州云从信息科技有限公司(以下简称云从科技)宣布在语音识别技术上取得重大突破,该技术在全球最大的开源语音识别数据集 Librispeech 上刷新了世界纪录,错词率(Worderrorrate,WER)降低至 2.97%,将Librispeech 的 WER 指标提升了 25%,超过微软、谷歌、IBM、阿里、百度及约翰霍普金斯大学等企业及高校。
据介绍,云从科技核心技术闭环包括人脸识别、智能感知与智能分析三个阶段,而语音识别技术是智能感知的重要部分,通过语音识别,机器可以像人类一样理解语言,进而展开处理并进行反馈。
云从科技此次推出的语音识别模型Pyramidal-FSMN 融合图像识别与语音识别的优势,将残差卷积网络和金字塔记忆模块的序列记忆网络相结合,能够同时有效的提取空间和时间上不同粒度的信息,相比目前业界使用最为广泛的 LSTM 模型,其训练速度更快、识别准确率更高。
此次突破是云从科技在今年4月刷新“跨镜追踪技术(ReID)”三项世界纪录后取得的又一重大成果。今年4月,云从科技跨镜追踪技术(ReID)技术在 Market-1501,DukeMTMC-reID,CUHK03 三个数据集刷新了世界纪录,其中最高在 Market-1501 上的首位命中率(Rank-1Accuracy)达到96.6%,让跨镜追踪技术(ReID)技术在准确率上首次达到商用水平。
- 语音识别
+关注
关注
38文章
1684浏览量
112129 - 云从科技
+关注
关注
1文章
66浏览量
9608
原文标题:云从科技取得语音识别技术新突破
文章出处:【微信号:robotmagazine,微信公众号:机器人技术与应用】欢迎添加关注!文章转载请注明出处。
发布评论请先登录
相关推荐
评论