随着AI语音技术的不断发展,如今,定制化语音的功能来到了最复杂的AI场景——对话式AI设备。趋势的持续演变意味着,AI语音正逐步迈进“定制化”时代。
在定制化的浪潮下,众多企业纷纷布局。其中,思必驰以人工智能模型的小数据或零数据迁移,以及全链路软硬件系统模块的自动柔性组合输出为主要目标,自主研发了语音识别语言模型自适应技术、个性化语音合成复刻技术、知识问答及对话管理领域迁移技术、标注训练一体化模型自学习工具、本地唤醒识别自助定制系统、端云解耦的柔性对话系统组合更新框架等多项基础技术和工具,高筑定制化基础。
此外,为进一步夯实定制化能力,在上述基础上,思必驰打通“云+芯”的一体化解决方案和完整的开发者服务,推出了 DUI 平台,可进行从唤醒、识别到语义理解和对话逻辑的全链路技术定制,自动化、智能化程度高,开发者与用户可自主定制,是目前国内主流的可定制对话平台之一,具备快速规模化、快速私有化部署、知识图谱迁移等能力,仅根据不同入口稍作修改即可定制为成熟产品。
尤其通过建立低代码或无代码的业务和产品开发环境,思必驰为不精通技术的产品开发人员,实现无需技术人员重度参与的产品和方案的快速开发,达到深度场景化赋能产业的目标。
具体来看,思必驰的定制开发能力主要包括两大方面:软件及算法定制开发服务、软硬一体化定制开发服务,具体情况如下:
1)软件及算法定制开发服务
思必驰以全链路智能语音语言技术为核心,以DUI平台为工具,从语音语言单点技术、语音语言模型到内容资源、AI技能、交互界面和部署模式均可支持深度定制,为客户提供从本地端设备到云端服务、从识别到合成、从语义领域到对话逻辑、从技术模块到内容资源的全方位按需定制服务。
在某汽车项目中,思必驰为其提供声音复刻技术。车主朗读一小段固定文本后,经过很短时间的训练,即可合成一个自己音色的机器合成音,支持任意文本的语音生成,直接可替换汽车自带的机器播报声音,增加语音交互的趣味性。
在某教育平板项目中,思必驰根据客户需求,对软件产品包进行个性化定制,集成以下功能:基于单麦拾音,但针对儿童发音语言特点定制识别模型,支持自由打断的认知智能交互,集合儿童领域中的音乐、天气、古诗、国学、翻译等第三方资源和垂直领域语义理解,打造专属的AI技能,且问答知识库可定制。
2)软硬一体化定制开发服务
思必驰专注智能语音语言技术已十余年,业务长期聚焦于软硬一体化的语音语言交互产品,能够面向客户非标准化的定制需求,提供软硬件结合的智能设备交付。公司根据客户需求和应用场景情况,考虑性能、预算、体验等综合因素,通过技术及应用研发、模组及整机整合制造,为客户提供一站式的软硬一体化产品服务,包括AI操作系统、核心组件及物联网智能硬件终端。
思必驰的软硬一体化定制开发服务,具备AI技术能力和行业应用场景经验、软硬一体化的对话系统设计能力、软硬件适配整体优化、应用持续扩展服务能力等优势。
在上汽通用五菱的项目中,思必驰基于智能收放机整机产品方案,并结合五菱汽车的具体情况和客户的需求,进行定制化开发,最终向五菱交付集合操作系统、核心AI组件及智能收放机硬件的软硬一体化综合服务。
一直以来,AI语音定制的工程化与商业应用,始终被报以高度期待。思必驰近年来深度聚焦定制化领域,因地制宜打造出一系列产品,并成功相继落地,赋能了千行百业。值得注意的是,在下一阶段,生活场景定制或将成为重头戏,思必驰等AI企业应提前做好相应布局。
审核编辑:汤梓红
-
AI
+关注
关注
87文章
30726浏览量
268870 -
语音技术
+关注
关注
2文章
226浏览量
21271 -
思必驰
+关注
关注
4文章
284浏览量
14282
发布评论请先 登录
相关推荐
评论