AI可能很快就会成为盟友,以消除语音助手的唤醒词。卡内基梅隆大学的研究人员开发了一种机器学习模型,该模型可以估计语音的发出方向,无需特殊的短语或手势即可表明您的意图。该方法依赖于声音在房间周围反弹时的固有特性。
系统认识到,第一个,最响亮和最清晰的声音始终是直接针对给定对象的声音。其他任何事情都倾向于安静,延迟和闷闷不乐。该模型还知道,人类的语音频率会根据您所面对的方向而变化。较低的频率倾向于全向。
研究人员补充说,这种方法基于软件“轻巧”,不需要将音频数据发送到云。
尽管团队已经公开发布了代码和数据来帮助其他人继续工作,但是您可能还需要一段时间才能看到使用的技术。至少很容易看出这可能导致什么。您可以告诉智能扬声器播放音乐,而无需使用唤醒词或引起大量其他连接设备的骚扰。它可能需要您的身体状态,而无需使用注视检测相机,从而有助于保护隐私。换句话说,它将更接近“星际迷航”中语音助手的愿景,后者始终会在您与他们交谈时知道。
责任编辑:lq
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网
网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
代码
+关注
关注
30文章
4779浏览量
68516 -
机器学习
+关注
关注
66文章
8406浏览量
132553 -
语音助手
+关注
关注
7文章
235浏览量
26799
发布评论请先 登录
相关推荐
研究人员利用激光束开创量子计算新局面
演示设备 威特沃特斯兰德大学(Wits)的物理学家利用激光束和日常显示技术开发出了一种创新的计算系统,标志着在寻求更强大的量子计算解决方案方面取得了重大飞跃。 该大学结构光实验室的
NaVILA:加州大学与英伟达联合发布新型视觉语言模型
日前,加州大学的研究人员携手英伟达,共同推出了一款创新的视觉语言模型——NaVILA。该模型在机器
一种信息引导的量化后LLM微调新算法IR-QLoRA
进行量化+LoRA的路线为例,有研究表明,现有方法会导致量化的LLM严重退化,甚至无法从LoRA微调中受益。 为了解决这一问题,来自苏黎世联邦理工学院、北京航空航天大学和字节跳动的研究人员
研究人员提出一种电磁微镜驱动系统
领域。MEMS微镜作为一种微光机电系统(MOEMS),已广泛应用于医疗、汽车、消费和军事电子等众多领域。当前,业界对具有广阔前景的小型激光雷达的需求不断增长。之前,已有研究开发了大量使用电热、静电、压电和电磁驱动的微镜。其
一种利用光电容积描记(PPG)信号和深度学习模型对高血压分类的新方法
了深度神经网络在计算机视觉任务中的有效性,并为开发更强大、更复杂的神经网络架构铺平了道路。
ResNet-50是一种深度神经网络架构,由研究人员Kaiming He、XiangyuZhang
发表于 05-11 20:01
一种可实现稳定压力传感的新型可拉伸电子皮肤
现有的电子皮肤会随材料拉伸而降低传感精度。美国得克萨斯大学奥斯汀分校研究人员开发出一种新型可拉伸电子皮肤,解决了这项新兴技术的一个主要难题。
研究人员利用定制光控制二维材料的量子特性
的发展铺平了道路。 由美国能源部SLAC国家加速器实验室和斯坦福大学研究人员领导的研究小组将这种方法应用于一种名为六方氮化硼(hBN)的材料,这种材料由单层原子以蜂窝状排列而成,其特性
研究人员开发出新型AI辅助发音系统,让人没有声带也能说话
德赢Vwin官网
网报道(文/李弯弯)近日,加州大学洛杉矶分校生物工程系助理教授陈俊及其团队,开发了一种可以在机器学习辅助下将喉部肌肉运动转化为语音
研究人员开发出一种新型太赫兹成像系统
系统使用的辐射探测器。 由加州大学洛杉矶分校Samueli工程学院电气和计算机工程教授Mona Jarrahi和Aydogan Ozcan领导的研究团队发明了一种新的太赫兹焦平面阵列来解决这个问题。 带PSR的等离子体光电导TH
【飞腾派4G版免费试用】仙女姐姐的嵌入式实验室之五~LLaMA.cpp及3B“小模型”OpenBuddy-StableLM-3B
训练是MetaAI研究人员认为的一种降低模型使用成本的方式。为了更好的效果,即便是LLaMA最小的70亿参数的版本,其训练使用的tokens数量也有1万亿个(1 trillion tokens)
但是
发表于 12-22 10:18
评论