1 Stability AI推出迄今为止更小、更高效的1.6B语言模型-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Stability AI推出迄今为止更小、更高效的1.6B语言模型

OSC开源社区 来源:OSC开源社区 2024-01-23 10:11 次阅读

Stability AI 宣布推出迄今为止最强大的小语言模型之一 Stable LM 2 1.6B。以英语、西班牙语、德语、意大利语、法语、葡萄牙语和荷兰语的多语言数据为基础进行了训练,体积小、速度快,降低了硬件门槛;并提供了完全透明的训练细节,旨在让开发人员和模型创建者能够快速进行实验和迭代。

Stable LM 是一种文本内容生成 LLM,Stability AI 于 2023 年 4 月首次推出了 30 亿和 70 亿参数模型。新的 StableLM 模型实际上是 Stability AI 在 2024 年发布的第二个模型,此前该公司在早些时候还发布了一个 Stable Code 3B。

Stability AI 声称,Stable LM 2 1.6B 在大多数基准测试中均优于其他参数低于 20 亿个的小语言模型,如微软的 Phi-1.5 (1.3B) 和 Phi-2 (2.7B)、TinyLlama 1.1B 或 Falcon 1B。

6999b044-b913-11ee-8b88-92fbcf53809c.png69b6cbac-b913-11ee-8b88-92fbcf53809c.png69e0a7ec-b913-11ee-8b88-92fbcf53809c.png69f47498-b913-11ee-8b88-92fbcf53809c.png

不过他们也警告称,由于小型、低容量语言模型的特性,Stable LM 2 1.6B 可能会出现高幻觉率、潜在的有毒语言等类似的常见问题。“我们要求社区在构建应用程序时牢记这一点,并采取适当措施确保以负责任的方式进行开发。”

Stable LM 2 1.6B 目前可在商业和非商业领域使用,只要拥有 Stability AI 会员资格,即可在 Hugging Face 上测试该模型。





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 语言模型
    +关注

    关注

    0

    文章

    520

    浏览量

    10268
  • LLM
    LLM
    +关注

    关注

    0

    文章

    286

    浏览量

    327

原文标题:Stability AI推出更小、更高效的1.6B语言模型

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI语言模型开发步骤

    开发一个高效、准确的大语言模型是一个复杂且多阶段的过程,涉及数据收集与预处理、模型架构设计、训练与优化、评估与调试等多个环节。接下来,AI
    的头像 发表于 12-19 11:29 40次阅读

    语言模型开发语言是什么

    在人工智能领域,大语言模型(Large Language Models, LLMs)背后,离不开高效的开发语言和工具的支持。下面,AI部落小
    的头像 发表于 12-04 11:44 94次阅读

    IBM发布Granite 3.0 AI模型家族

    IBM在近日举行的年度TechXchange大会上,正式推出了其迄今为止最先进的AI模型家族——Granite 3.0。这一系列的发布标志着IBM在人工智能技术领域的又一次重大突破。
    的头像 发表于 10-23 17:09 433次阅读

    英伟达发布AI模型 Llama-3.1-Nemotron-51B AI模型

    速度比原70B模型提升2.2倍,具备更准确和更高效的运算效率;能够大幅降低运行成本。       通过NAS技术微调;大幅降低了内存消耗、计算复杂性;Llama-3.1-Nemotron-51
    的头像 发表于 09-26 17:30 604次阅读

    Meta Llama 3.1系列模型可在Google Cloud上使用

    我们很高兴宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,这包括全新的 405B,即 Meta 迄今为止功能最强大、用途最广泛的
    的头像 发表于 08-02 15:42 376次阅读

    Mistral AI与NVIDIA推出全新语言模型Mistral NeMo 12B

    Mistral AI 和 NVIDIA 于近日共同发布了一款全新的领先语言模型Mistral NeMo 12B。开发者可以轻松定制和部署该模型
    的头像 发表于 07-27 11:04 654次阅读

    安霸生成式AI芯片解决方案助力本地处理大型语言模型

    随着 AI 技术的不断进步,十年前还只能在书本和科幻电影中看到的功能,如今随处可见。然而,迄今为止,对性能有着高要求的最新生成式 AI 技术应用通常只能运行在云端。
    的头像 发表于 06-26 11:32 706次阅读

    【大语言模型:原理与工程实践】揭开大语言模型的面纱

    了探索更大、更高效模型架构和训练方法的空间。在实际应用中,大语言模型的缩放定律推动了自然语言处理等领域的发展,提升了应用效果和用户体验。此外
    发表于 05-04 23:55

    Stability AI发布Stable Code Instruct 3B语言模型,可编译多种编程语言

    据报道,Stability AI公司近期推出了适配程序员使用的Stable Code Instruct 3B语言
    的头像 发表于 03-27 10:04 481次阅读

    搭载星火认知大模型AI鼠标:一键呼出AI助手,办公更高效

    搭载星火认知大模型AI鼠标:一键呼出AI助手,办公更高效 在这个AI时代,如果你想在激烈竞争的职场中不被淘汰,讯飞
    的头像 发表于 03-25 11:52 483次阅读
    搭载星火认知大<b class='flag-5'>模型</b>的<b class='flag-5'>AI</b>鼠标:一键呼出<b class='flag-5'>AI</b>助手,办公<b class='flag-5'>更高效</b>

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,该模型以其独特的功能吸引了众多关注。此
    的头像 发表于 03-22 10:30 830次阅读

    Stability AI与Morph AI共同推出一体化AI视频创作工具

    近日,业界领先的AI技术公司Stability AI与中国AI创业公司Morph AI达成重要合作。双方宣布共同
    的头像 发表于 03-05 10:44 874次阅读

    蚂蚁集团推出20亿参数多模态遥感基础模型SkySense

    近日,蚂蚁集团联合武汉大学宣布成功研发出20亿参数多模态遥感基础模型SkySense。这一创新模型由蚂蚁集团的AI创新研发部门NextEvo与武汉大学共同完成,是迄今为止国际上参数规模
    的头像 发表于 03-04 11:22 812次阅读

    Stability AI试图通过新的图像生成人工智能模型保持领先地位

    Stability AI的最新图像生成模型Stable Cascade承诺比其业界领先的前身Stable Diffusion更快、更强大,而Stable Diffusion是许多其他文本到图像生成
    的头像 发表于 02-19 16:03 934次阅读
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>试图通过新的图像生成人工智能<b class='flag-5'>模型</b>保持领先地位

    Stability AI推出商业版会员计划 对AI模型的商业使用收费

    该公司在一篇博客文章中表示:“随着我们公司的不断成熟和规模化,Stability AI会员将在助力我们未来的核心模型研发方面发挥关键作用。” The Verge联系了Stability
    的头像 发表于 12-26 16:48 882次阅读