1 Stability AI推出Stable audio的文本到音频生成人工智能平台-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Stability AI推出Stable audio的文本到音频生成人工智能平台

IEEE电气电子工程师 来源:IEEE电气电子工程师 2023-09-20 10:20 次阅读

Stability AI是一家主要以人工智能生成的视觉效果而闻名的公司,它推出了一个名为Stable audio的文本到音频生成人工智能平台。

Stable Audio使用扩散模型,与该公司更受欢迎的图像平台Stable diffusion的AI模型相同,但使用音频而非图像进行训练。用户可以使用它为任何项目生成歌曲或背景音频。

音频扩散模型倾向于生成固定长度的音频,这对音乐制作来说很糟糕,因为歌曲的长度可能不同。Stability AI的新平台允许用户发出不同长度的声音,要求公司对音乐进行训练,并在歌曲的开始和结束时间周围添加文本元数据。

同时,它可以实现实时的音频生成,无需等待长时间的渲染过程。Stability AI 宣称,Stable Audio 模型可以在一秒内渲染出 95 秒的立体声音频,并且只需要一个 NVIDIA A100 GPU

并且,Stable Audio是一个开源的项目,任何人都可以免费使用和修改。Stability AI 希望通过开源的方式促进 AI 领域的创新和发展,并让更多人享受到 AI 技术带来的便利和乐趣。

该公司在一份声明中表示:“Stable Audio代表了Stability AI生成音频研究实验室Harmonai的尖端音频生成研究。我们会继续改进我们的模型架构、数据集和训练程序,以提高输出质量、可控性、推理速度和输出长度。”

文本到音频的生成并不是什么新鲜事,因为生成人工智能领域的其他大牌一直在玩弄这个概念。Meta于8月发布了AudioCraft,这是一套生成的人工智能模型,有助于根据提示创建听起来自然的ERM、声音和音乐。到目前为止,它只提供给研究人员和一些音频专业人士。谷歌的MusicLM也可以让人们产生声音,但只对研究人员开放。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 音频
    +关注

    关注

    29

    文章

    2868

    浏览量

    81490
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268871
  • 人工智能
    +关注

    关注

    1791

    文章

    47183

    浏览量

    238206
  • 模型
    +关注

    关注

    1

    文章

    3226

    浏览量

    48806
  • 数据集
    +关注

    关注

    4

    文章

    1208

    浏览量

    24688

原文标题:Stability AI发布AI音频平台Stable Audio

文章出处:【微信号:IEEE_China,微信公众号:IEEE电气电子工程师】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    生成AI工具作用

    生成AI工具是指那些能够自动生成文本、图像、音频、视频等多种类型数据的人工智能技术。在此,petacloud.
    的头像 发表于 10-28 11:19 223次阅读

    AI for Science:人工智能驱动科学创新》第6章人AI与能源科学读后感

    幸得一好书,特此来分享。感谢平台,感谢作者。受益匪浅。 在阅读《AI for Science:人工智能驱动科学创新》的第6章后,我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应
    发表于 10-14 09:27

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    很幸运社区给我一个阅读此书的机会,感谢平台。 《AI for Science:人工智能驱动科学创新》第4章关于AI与生命科学的部分,为我们揭示了人工
    发表于 10-14 09:21

    AI for Science:人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

    周末收到一本新书,非常高兴,也非常感谢平台提供阅读机会。 这是一本挺好的书,包装精美,内容详实,干活满满。 《AI for Science:人工智能驱动科学创新》这本书的第一章,作为整个著作的开篇
    发表于 10-14 09:12

    人工智能ai4s试读申请

    目前人工智能在绘画对话等大模型领域应用广阔,ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题,本书对ai4s基本原理和原则,方法进行描诉,有利于总结经验,拟
    发表于 09-09 15:36

    名单公布!【书籍评测活动NO.44】AI for Science:人工智能驱动科学创新

    、污染治理、碳减排三个方面介绍了人工智能为环境科学引入的新价值和新机遇。 第8章探讨了AI for Science在快速发展过程中面临的机遇和挑战,并对“平台科研”模式进行了展望。 申请时间
    发表于 09-09 13:54

    Whatsapp正在开发一种新的生成人工智能功能

    据悉,Whatsapp正在开发一种新的生成人工智能功能,该功能应允许用户制作自己的个性化头像,用于任何想象中的场景。WABetaInfo在新的Android版WhatsApp测试版2.24.14.7
    的头像 发表于 07-14 17:50 988次阅读

    Google开发专为视频生成配乐的人工智能技术

    近日,科技巨头Google旗下的人工智能研究实验室DeepMind宣布了一项引人注目的技术突破——V2A技术(Video to Audio),这是一项专为视频生成配乐的人工智能技术。这
    的头像 发表于 06-20 11:03 503次阅读

    Stability AI发布Stable Code Instruct 3B大语言模型,可编译多种编程语言

    据报道,Stability AI公司近期推出了适配程序员使用的Stable Code Instruct 3B大语言模型,此款模型的显著特点是能够实现编程语言间的自如切换。
    的头像 发表于 03-27 10:04 482次阅读

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,该模型以其独特的功能吸引了众多关注。此模型具备从单张图像中生成
    的头像 发表于 03-22 10:30 830次阅读

    OpenAI首席技术官穆拉蒂:Sora今年发布,音频生成功能将提升场景呈现

    穆拉提还提到,Sora将覆盖音频生成领域,以增强应用效果;考虑人工智能生成内容有时不够精确,OpenAI拟允许用户自主修改、创建视听内容。
    的头像 发表于 03-14 14:17 452次阅读

    OpenAI新年开出王炸,视频生成模型Sora问世

    近日,OpenAI在AI生成视频领域取得重大突破,发布了全新的生成人工智能模型“Sora”。该模型在视频生成方面展现出了惊人的能力,通过
    的头像 发表于 02-20 11:46 795次阅读

    Stability AI试图通过新的图像生成人工智能模型保持领先地位

    Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大,而
    的头像 发表于 02-19 16:03 934次阅读
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>试图通过新的图像<b class='flag-5'>生成人工智能</b>模型保持领先地位

    OpenAI发布文生视频模型Sora,引领AI频生成新纪元

    人工智能(AI)领域掀起新一轮革命浪潮的,正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型,以其“逼真”和“富有想象力”的视频生成能力,彻底颠覆了传统视
    的头像 发表于 02-19 11:03 938次阅读

    谷歌发布Lumiere人工智能文本频生成

    随着近年来AI应用的不断普及和改进,自动文本创作系统如ChatGPT已经被广泛接受,成为聊天窗口中的常客。类似地,文本图画生成工具让人们得
    的头像 发表于 01-31 16:45 846次阅读