Stability AI推出迄今为止更小、更高效的1.6B语言模型-德赢Vwin官网网

Stability AI推出迄今为止更小、更高效的1.6B语言模型

Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B。以英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据为基础进行了训练，体积小、速度快，降低了硬件门槛；并提供了完全透明的训练细节，旨在让开发人员和模型创建者能够快速进行实验和迭代。

Stable LM 是一种文本内容生成 LLM，Stability AI 于 2023 年 4 月首次推出了 30 亿和 70 亿参数模型。新的 StableLM 模型实际上是 Stability AI 在 2024 年发布的第二个模型，此前该公司在早些时候还发布了一个 Stable Code 3B。

Stability AI 声称，Stable LM 2 1.6B 在大多数基准测试中均优于其他参数低于 20 亿个的小语言模型，如微软的 Phi-1.5 (1.3B) 和 Phi-2 (2.7B)、TinyLlama 1.1B 或 Falcon 1B。

不过他们也警告称，由于小型、低容量语言模型的特性，Stable LM 2 1.6B 可能会出现高幻觉率、潜在的有毒语言等类似的常见问题。“我们要求社区在构建应用程序时牢记这一点，并采取适当措施确保以负责任的方式进行开发。”

Stable LM 2 1.6B 目前可在商业和非商业领域使用，只要拥有 Stability AI 会员资格，即可在 Hugging Face 上测试该模型。

审核编辑：刘清

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

语言模型

语言模型

+关注

关注
0

文章
520

浏览量
10268
LLM

LLM

+关注

关注
0

文章
286

浏览量
327

原文标题：Stability AI推出更小、更高效的1.6B语言模型

文章出处：【微信号：OSC开源社区，微信公众号：OSC开源社区】欢迎添加关注！文章转载请注明出处。

AI大语言模型开发步骤

开发一个高效、准确的大语言模型是一个复杂且多阶段的过程，涉及数据收集与预处理、模型架构设计、训练与优化、评估与调试等多个环节。接下来，AI部

发表于 12-19 11:29 •40次阅读

大语言模型开发语言是什么

在人工智能领域，大语言模型（Large Language Models, LLMs）背后，离不开高效的开发语言和工具的支持。下面，AI部落小

发表于 12-04 11:44 •94次阅读

IBM发布Granite 3.0 AI模型家族

IBM在近日举行的年度TechXchange大会上，正式推出了其迄今为止最先进的AI模型家族——Granite 3.0。这一系列的发布标志着IBM在人工智能技术领域的又一次重大突破。

发表于 10-23 17:09 •433次阅读

英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

速度比原70B大模型提升2.2倍，具备更准确和更高效的运算效率；能够大幅降低运行成本。通过NAS技术微调；大幅降低了内存消耗、计算复杂性；Llama-3.1-Nemotron-51

发表于 09-26 17:30 •604次阅读

Meta Llama 3.1系列模型可在Google Cloud上使用

我们很高兴宣布，Llama 3.1 系列模型已添加到 Vertex AI Model Garden，这包括全新的 405B，即 Meta 迄今为止功能最强大、用途最广泛的

发表于 08-02 15:42 •376次阅读

Mistral AI与NVIDIA推出全新语言模型Mistral NeMo 12B

Mistral AI 和 NVIDIA 于近日共同发布了一款全新的领先语言模型Mistral NeMo 12B。开发者可以轻松定制和部署该模型

发表于 07-27 11:04 •654次阅读

安霸生成式AI芯片解决方案助力本地处理大型语言模型

随着 AI 技术的不断进步，十年前还只能在书本和科幻电影中看到的功能，如今随处可见。然而，迄今为止，对性能有着高要求的最新生成式 AI 技术应用通常只能运行在云端。

发表于 06-26 11:32 •706次阅读

【大语言模型：原理与工程实践】揭开大语言模型的面纱

了探索更大、更高效模型架构和训练方法的空间。在实际应用中，大语言模型的缩放定律推动了自然语言处理等领域的发展，提升了应用效果和用户体验。此外

发表于 05-04 23:55

Stability AI发布Stable Code Instruct 3B大语言模型，可编译多种编程语言

据报道，Stability AI公司近期推出了适配程序员使用的Stable Code Instruct 3B大语言

发表于 03-27 10:04 •481次阅读

搭载星火认知大模型的AI鼠标：一键呼出AI助手，办公更高效

搭载星火认知大模型的AI鼠标：一键呼出AI助手，办公更高效 在这个AI时代，如果你想在激烈竞争的职场中不被淘汰，讯飞

发表于 03-25 11:52 •483次阅读

Stability AI推出全新Stable Video 3D模型

近日，Stability AI 推出了全新的 Stable Video 3D 模型，该模型以其独特的功能吸引了众多关注。此

发表于 03-22 10:30 •830次阅读

Stability AI与Morph AI共同推出一体化AI视频创作工具

近日，业界领先的AI技术公司Stability AI与中国AI创业公司Morph AI达成重要合作。双方宣布共同

发表于 03-05 10:44 •874次阅读

蚂蚁集团推出20亿参数多模态遥感基础模型SkySense

近日，蚂蚁集团联合武汉大学宣布成功研发出20亿参数多模态遥感基础模型SkySense。这一创新模型由蚂蚁集团的AI创新研发部门NextEvo与武汉大学共同完成，是迄今为止国际上参数规模

发表于 03-04 11:22 •812次阅读

Stability AI试图通过新的图像生成人工智能模型保持领先地位

Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大，而Stable Diffusion是许多其他文本到图像生成

发表于 02-19 16:03 •934次阅读

Stability AI推出商业版会员计划对AI模型的商业使用收费

该公司在一篇博客文章中表示：“随着我们公司的不断成熟和规模化，Stability AI会员将在助力我们未来的核心模型研发方面发挥关键作用。” The Verge联系了Stability

发表于 12-26 16:48 •882次阅读

搜索历史

Stability AI推出迄今为止更小、更高效的1.6B语言模型

评论

AI大语言模型开发步骤

大语言模型开发语言是什么

IBM发布Granite 3.0 AI模型家族

英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

Meta Llama 3.1系列模型可在Google Cloud上使用

Mistral AI与NVIDIA推出全新语言模型Mistral NeMo 12B

安霸生成式AI芯片解决方案助力本地处理大型语言模型

【大语言模型：原理与工程实践】揭开大语言模型的面纱

Stability AI发布Stable Code Instruct 3B大语言模型，可编译多种编程语言

搭载星火认知大模型的AI鼠标：一键呼出AI助手，办公更高效

Stability AI推出全新Stable Video 3D模型

Stability AI与Morph AI共同推出一体化AI视频创作工具

蚂蚁集团推出20亿参数多模态遥感基础模型SkySense

Stability AI试图通过新的图像生成人工智能模型保持领先地位

Stability AI推出商业版会员计划对AI模型的商业使用收费