1 AI精确复制声音, 真假“比尔·盖茨”难辨-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI精确复制声音, 真假“比尔·盖茨”难辨

Gv1N_smartman16 来源:yxw 2019-06-15 10:44 次阅读

近日, 脸书的研究人员成功克隆了微软总裁比尔·盖茨的声音。

脸书人工智能研究中心的肖恩·瓦斯奎兹(Sean Vasquez)和迈克·刘易斯(Mike Lewis)于本周表示,他们已经努力模仿人类语言有一段时间了。然而,模仿人类语言显然是件难事,当人们听到斯蒂芬·霍金所使用的那套最著名的说话机器发声时,会发现它听起来仍然很不像人类。

但是现在,研究员们似乎已经取得了进展。如果你听了盖茨的克隆所发出的声音,我想你是会同意的。因为它听起来很像比尔·盖茨,你甚至很难分辨出它和他真实声音的区别。

研究人员展示了他们的研究。在这里,机器模仿着盖茨的腔调发声,“请给你珍爱的朋友发一封充满爱意的短信。”其中最不可思议的是,这台机器在说“珍爱(cherish)”时,准确无误地捕捉到盖茨不断上升的语调变化的。

这项技术被称为MelNet,可以用来复制人类的语调。到目前为止,盖茨和其他许多人的声音都被它完美地再现了。瓦斯奎兹和刘易斯说,克隆的音频取自各类Ted演讲。

两位研究人员还表示,直到最近,文本到语音转换软件还不能很好地工作的原因是它使用了波形图记录声音。这些图显示了声音在几秒钟内的音阶变化。如果你听到过盖茨说“珍爱”这个词,就知道他的语气是变化剧烈的。在试图模仿一个人的时候,深度学习机器必须预测到所有这些细微的变化,这很不容易。

瓦斯奎兹和刘易斯说,他们通过使用一种叫做光谱图的东西来训练机器,成功地克隆了声音。

研究人员说:“光谱图的时间轴比波形图的时间轴紧凑几个数量级,这意味着在波形中跨越数万个时间步长的依赖关系在光谱图中只跨越数百个时间步长。这使得我们的光谱图模型能够在数秒内记录各种语音和音乐样本,并保持它们一致性。”

不过,他们也经历了一些挫折。研究小组表示,对他们来说,几乎完美地复制一个句子并不难,难的是复制那些在长达几十秒或几分钟的时间里,显示了情绪变化的复杂语调”。尽管如此,当涉及到人机交互时,研究小组说,在只涉及简短对话的情境中,这项技术可能会带来革命性的变化。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268886
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132558
  • 智能语音
    +关注

    关注

    10

    文章

    782

    浏览量

    48758

原文标题:AI精确复制声音, 真假“比尔·盖茨”难辨

文章出处:【微信号:smartman163,微信公众号:网易智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    PW系列工控电脑复制机:效率与精度双重提升

    进一步提升了数据复制的准确性。PW系列复制机是企业在数据复制与管理中的理想选择,帮助企业在处理复杂数据时变得更加高效和精确
    的头像 发表于 11-20 16:20 129次阅读
    PW系列工控电脑<b class='flag-5'>复制</b>机:效率与精度双重提升

    配置MySQL主从复制和读写分离

    配置MySQL主从复制和读写分离
    的头像 发表于 10-23 11:44 407次阅读
    配置MySQL主从<b class='flag-5'>复制</b>和读写分离

    友思特“未来视界”趣味实验室 第2讲:中草药的高光谱成像

    “未来视界”趣味实验室第2讲:珍贵中草药真假难辨,用高光谱成像系统就能一眼鉴别?友思特实验室邀您一同探究!
    的头像 发表于 09-26 13:32 201次阅读
    友思特“未来视界”趣味实验室 第2讲:中草药的高光谱成像

    如何搭建一个电流镜电路,用于复制SiPM的电流?

    范围大约为4mA~400mA。 如上图所示,这是一个SiPM的读出的ASIC电路结构。图中电流镜能够对SiPM的电流进行复制,并且可以按照一定比例缩小;我只需要进行精确复制,请问Ti有合适的器件吗?
    发表于 08-02 07:38

    三星电容代理商怎么辨别真假呢?

    三星电容代理商 所代理产品辨别真假的方式有两种,一种是先辨别 三星电容代理商 的真假,另一种就是根据三星电容的产品防伪标志来进行辨别真假。今天针对这两种方式给大家详细的分享一下如何去针对这两种方式
    的头像 发表于 07-25 15:37 363次阅读

    如何实现Python复制文件操作

    Python 中有许多“开盖即食”的模块(比如 os,subprocess 和 shutil)以支持文件 I/O 操作。在这篇文章中,你将会看到一些用 Python 实现文件复制的特殊方法。下面我们开始学习这九种不同的方法来实现 Python 复制文件操作。
    的头像 发表于 07-18 14:53 411次阅读

    国科微AI首席科学家邢国良:打造全系边端AI芯片,赋能下一代自动驾驶

    发展机遇,特别是车载平台与基础设施的互联和协同将会大大提升自动驾驶的性能和安全性。当前,国科微全系边端AI芯片正在持续赋能车路协同,助力下一代自动驾驶技术加速落地。 在商业技术领域,据著名的比尔盖茨法则,人们往往高估技
    的头像 发表于 07-09 11:35 520次阅读
    国科微<b class='flag-5'>AI</b>首席科学家邢国良:打造全系边端<b class='flag-5'>AI</b>芯片,赋能下一代自动驾驶

    如何利用生成式人工智能进行精确编码

    随着技术的飞速发展,生成式人工智能(Generative AI)在软件开发领域的应用日益广泛。生成式AI以其强大的学习和创造能力,为精确编码提供了前所未有的可能性。本文将深入探讨如何利用生成式人工智能进行
    的头像 发表于 07-05 17:51 630次阅读

    比尔·盖茨展望AI:耳机与智能眼镜引领人机交互新纪元

    在科技日新月异的今天,每一次技术的飞跃都预示着生活方式的深刻变革。7月4日,微软公司的联合创始人比尔·盖茨,这位科技界的传奇人物,在《下一个伟大的构想》播客节目中,以其独到的视角和前瞻性的思考,为
    的头像 发表于 07-04 16:34 937次阅读

    比尔·盖茨展望AI未来:从AI顾问到深度智能体的演变

    在科技日新月异的今天,人工智能(AI)作为引领未来变革的关键力量,其发展前景始终牵动着全球科技界与公众的神经。近日,微软创始人比尔·盖茨在知名播客节目《Next Big Idea Club》上,就
    的头像 发表于 07-03 16:10 411次阅读

    声音测量的定义和典型应用

    一、什么是声音测量?声音测量是声学测量的一种。声学测量是研究声学测量技术的科学,包括测量方法和测量仪器。基本的声学测量包括声强测量、声质点速度测量、波长测量、加速度测量、传声器和水听器绝对校准、通信
    的头像 发表于 06-29 08:31 1480次阅读
    <b class='flag-5'>声音</b>测量的定义和典型应用

    比尔·盖茨斥资数十亿美元,启动未来核电站项目

    在全球能源需求日益增长,而环保呼声日益高涨的当下,比尔·盖茨的又一重要战略布局备受瞩目。6月17日,据外媒报道,微软创始人比尔·盖茨在公开场合宣布,他准备在美国怀俄明州投入数十亿美元,
    的头像 发表于 06-17 16:08 474次阅读

    比尔·盖茨在微软仍掌握关键影响力

    据悉,盖茨曾在2017年组织高层会晤,参与者包括时任CEO萨蒂亚·纳德拉及多位高管。会上,盖茨提出了“AI代理人”的概念,认为它们将超越Siri和Alexa,成为强大的个人助手,引领新世界秩序。这一观点促使微软与OpenAI建立
    的头像 发表于 04-30 11:13 653次阅读

    labview声音采集与处理

    LabVIEW是一种用于数据采集与处理的编程语言和开发环境。它具有强大的声音采集和处理功能,可以帮助用户实现声音信号的采集、分析和处理。本文将详细介绍LabVIEW在声音采集与处理方面的应用。 首先
    的头像 发表于 01-04 10:48 2352次阅读

    ad复制元件怎么保持编号不变

    复制AD(AutoCAD)元件时,如果要保持编号不变,可以按照以下步骤进行操作: 创建一个元件库:首先,你需要创建一个元件库,将你要复制的原始元件添加到库中。你可以使用AD软件的“设计中心”或“内容
    的头像 发表于 12-27 17:07 7213次阅读