Stability AI推出Stable audio的文本到音频生成人工智能平台-德赢Vwin官网网

Stability AI是一家主要以人工智能生成的视觉效果而闻名的公司，它推出了一个名为Stable audio的文本到音频生成人工智能平台。

Stable Audio使用扩散模型，与该公司更受欢迎的图像平台Stable diffusion的AI模型相同，但使用音频而非图像进行训练。用户可以使用它为任何项目生成歌曲或背景音频。

音频扩散模型倾向于生成固定长度的音频，这对音乐制作来说很糟糕，因为歌曲的长度可能不同。Stability AI的新平台允许用户发出不同长度的声音，要求公司对音乐进行训练，并在歌曲的开始和结束时间周围添加文本元数据。

同时，它可以实现实时的音频生成，无需等待长时间的渲染过程。Stability AI 宣称，Stable Audio 模型可以在一秒内渲染出 95 秒的立体声音频，并且只需要一个 NVIDIA A100 GPU。

并且，Stable Audio是一个开源的项目，任何人都可以免费使用和修改。Stability AI 希望通过开源的方式促进 AI 领域的创新和发展，并让更多人享受到 AI 技术带来的便利和乐趣。

该公司在一份声明中表示：“Stable Audio代表了Stability AI生成音频研究实验室Harmonai的尖端音频生成研究。我们会继续改进我们的模型架构、数据集和训练程序，以提高输出质量、可控性、推理速度和输出长度。”

文本到音频的生成并不是什么新鲜事，因为生成人工智能领域的其他大牌一直在玩弄这个概念。Meta于8月发布了AudioCraft，这是一套生成的人工智能模型，有助于根据提示创建听起来自然的ERM、声音和音乐。到目前为止，它只提供给研究人员和一些音频专业人士。谷歌的MusicLM也可以让人们产生声音，但只对研究人员开放。

审核编辑：彭菁

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

音频

音频

+关注

关注
29

文章
2868

浏览量
81490
AI

AI

+关注

关注
87

文章
30728

浏览量
268871
人工智能

人工智能

+关注

关注
1791

文章
47183

浏览量
238206
模型

模型

+关注

关注
1

文章
3226

浏览量
48806
数据集

数据集

+关注

关注
4

文章
1208

浏览量
24688

原文标题：Stability AI发布AI音频平台Stable Audio

文章出处：【微信号：IEEE_China，微信公众号：IEEE电气电子工程师】欢迎添加关注！文章转载请注明出处。

生成式AI工具作用

生成式AI工具是指那些能够自动生成文本、图像、音频、视频等多种类型数据的人工智能技术。在此，petacloud.

发表于 10-28 11:19 •223次阅读

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

幸得一好书，特此来分享。感谢平台，感谢作者。受益匪浅。在阅读《AI for Science：人工智能驱动科学创新》的第6章后，我深刻感受到人工智能在能源科学领域中的巨大潜力和广泛应

发表于 10-14 09:27

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

很幸运社区给我一个阅读此书的机会，感谢平台。《AI for Science：人工智能驱动科学创新》第4章关于AI与生命科学的部分，为我们揭示了人工

发表于 10-14 09:21

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

周末收到一本新书，非常高兴，也非常感谢平台提供阅读机会。这是一本挺好的书，包装精美，内容详实，干活满满。《AI for Science：人工智能驱动科学创新》这本书的第一章，作为整个著作的开篇

发表于 10-14 09:12

人工智能ai4s试读申请

目前人工智能在绘画对话等大模型领域应用广阔，ai4s也是方兴未艾。但是如何有效利用ai4s工具助力科研是个需要研究的课题，本书对ai4s基本原理和原则，方法进行描诉，有利于总结经验，拟

发表于 09-09 15:36

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

、污染治理、碳减排三个方面介绍了人工智能为环境科学引入的新价值和新机遇。第8章探讨了AI for Science在快速发展过程中面临的机遇和挑战，并对“平台科研”模式进行了展望。申请时间

发表于 09-09 13:54

Whatsapp正在开发一种新的生成人工智能功能

据悉，Whatsapp正在开发一种新的生成人工智能功能，该功能应允许用户制作自己的个性化头像，用于任何想象中的场景。WABetaInfo在新的Android版WhatsApp测试版2.24.14.7

发表于 07-14 17:50 •988次阅读

Google开发专为视频生成配乐的人工智能技术

近日，科技巨头Google旗下的人工智能研究实验室DeepMind宣布了一项引人注目的技术突破——V2A技术（Video to Audio），这是一项专为视频生成配乐的人工智能技术。这

发表于 06-20 11:03 •503次阅读

Stability AI发布Stable Code Instruct 3B大语言模型，可编译多种编程语言

据报道，Stability AI公司近期推出了适配程序员使用的Stable Code Instruct 3B大语言模型，此款模型的显著特点是能够实现编程语言间的自如切换。

发表于 03-27 10:04 •482次阅读

Stability AI推出全新Stable Video 3D模型

近日，Stability AI 推出了全新的 Stable Video 3D 模型，该模型以其独特的功能吸引了众多关注。此模型具备从单张图像中生成

发表于 03-22 10:30 •830次阅读

OpenAI首席技术官穆拉蒂：Sora今年发布，音频生成功能将提升场景呈现

穆拉提还提到，Sora将覆盖音频生成领域，以增强应用效果；考虑到人工智能生成内容有时不够精确，OpenAI拟允许用户自主修改、创建视听内容。

发表于 03-14 14:17 •452次阅读

OpenAI新年开出王炸，视频生成模型Sora问世

近日，OpenAI在AI生成视频领域取得重大突破，发布了全新的生成式人工智能模型“Sora”。该模型在视频生成方面展现出了惊人的能力，通过

发表于 02-20 11:46 •795次阅读

Stability AI试图通过新的图像生成人工智能模型保持领先地位

Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大，而

发表于 02-19 16:03 •934次阅读

OpenAI发布文生视频模型Sora，引领AI视频生成新纪元

在人工智能(AI)领域掀起新一轮革命浪潮的，正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型，以其“逼真”和“富有想象力”的视频生成能力，彻底颠覆了传统视

发表于 02-19 11:03 •938次阅读

谷歌发布Lumiere人工智能文本视频生成器

随着近年来AI应用的不断普及和改进，自动文本创作系统如ChatGPT已经被广泛接受，成为聊天窗口中的常客。类似地，文本到图画生成工具让人们得

发表于 01-31 16:45 •846次阅读

搜索历史

Stability AI推出Stable audio的文本到音频生成人工智能平台

评论

生成式AI工具作用

《AI for Science：人工智能驱动科学创新》第6章人AI与能源科学读后感

AI for Science：人工智能驱动科学创新》第4章-AI与生命科学读后感

《AI for Science：人工智能驱动科学创新》第一章人工智能驱动的科学创新学习心得

人工智能ai4s试读申请

名单公布！【书籍评测活动NO.44】AI for Science：人工智能驱动科学创新

Whatsapp正在开发一种新的生成人工智能功能

Google开发专为视频生成配乐的人工智能技术

Stability AI发布Stable Code Instruct 3B大语言模型，可编译多种编程语言

Stability AI推出全新Stable Video 3D模型

OpenAI首席技术官穆拉蒂：Sora今年发布，音频生成功能将提升场景呈现

OpenAI新年开出王炸，视频生成模型Sora问世

Stability AI试图通过新的图像生成人工智能模型保持领先地位

OpenAI发布文生视频模型Sora，引领AI视频生成新纪元

谷歌发布Lumiere人工智能文本视频生成器