0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高分工作!Uni3D:3D基础大模型,刷新多个SOTA!

CVer 来源:CVer 2024-01-30 15:56 次阅读

我们近期的工作:3D视觉大模型Uni3D在ICLR 2024的评审中获得了688分,被选为Spotlight Presentation

02be4964-b8ed-11ee-8b88-92fbcf53809c.jpg

在本文中,我们第一次将3D基础模型成功scale up到了十亿(1B)级别参数量,并使用一个模型在诸多3D下游应用中取得SoTA结果。代码和各个scale的模型(从6M-1B)均已开源,欢迎大家关注和使用:

论文:https://https://arxiv.org/pdf/2310.06773

代码:https://https://github.com/baaivision/Uni3D

02cb5d02-b8ed-11ee-8b88-92fbcf53809c.jpg

我们主要探索了3D视觉中scale up模型参数量和统一模型架构的可能性。在NLP / 2D vision领域,scale up大模型(GPT-4,SAM,EVA等)已经取得了很impressive的结果,但是在3D视觉中模型的scale up始终没有成功。我们旨在将NLP/2D中scale up的成功复现到3D表征模型上。

02d03426-b8ed-11ee-8b88-92fbcf53809c.jpg

在这项工作中,我们提出了一个3D基础大模型Uni3D,直接将3D backbone统一为ViT(Vision Transformer),以此利用丰富和强大的2D预训练大模型作为初始化。Uni3D使用CLIP模型中的文本/图像表征作为训练目标,通过学习三个模态的表征对齐(点云-图像-文本)实现3D点云对图像和文本的感知。同时,通过使用ViT中成功的scale up策略,我们将Uni3D逐步 scale up,训练了从Tiny到giant的5个不同scale的Uni3D模型,成功地将Uni3D扩展到10亿级别参数。

02df8750-b8ed-11ee-8b88-92fbcf53809c.jpg

Uni3D模型不同scale下的参数量和zero-shot分类结果

Uni3D在多个3D任务上达到SoTA,如:zero-shot classification, few-shot classification,open-world understanding, open-world part segmentation.

02f5e8f6-b8ed-11ee-8b88-92fbcf53809c.jpg

Zero-shot classification

030673b0-b8ed-11ee-8b88-92fbcf53809c.jpg

Real-world zero-shot recognition

由于学到了强大的多模态表征能力,Uni3D还能够做一些有意思的应用,如point cloud painting(点云绘画),text/image-based 3D shape retrieval(基于图像/文本的3D模型检索),point cloud captioning(点云描述):

030d818c-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud painting

03126e90-b8ed-11ee-8b88-92fbcf53809c.jpg

Image-based 3D shape retrieval

032b3eca-b8ed-11ee-8b88-92fbcf53809c.jpg

Text-based 3D shape retrieval

03421aaa-b8ed-11ee-8b88-92fbcf53809c.jpg

Point cloud captioning.

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D视觉
    +关注

    关注

    4

    文章

    420

    浏览量

    27396
  • 大模型
    +关注

    关注

    2

    文章

    2066

    浏览量

    1803

原文标题:ICLR 2024 | 高分工作!Uni3D:3D基础大模型,刷新多个SOTA!

文章出处:【微信号:CVer,微信公众号:CVer】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    安宝特产品 安宝特3DAnalyzer:智能的3DCAD高级分析工具

    安宝特 3DAnalyzer包含多种实用的 3DCAD高级分析工具,包括自动比对 模型、碰撞检测、间隙检查、壁厚检查,以及拔模和底切分析,能够有效提升 3DCAD
    的头像 发表于08-07 10:13 159次阅读
    安宝特产品  安宝特<b class='flag-5'>3D</b> Analyzer:智能的<b class='flag-5'>3D</b> CAD高级分析工具

    欢创播报 腾讯元宝首发3D生成应用

    App。 腾讯元宝APP发布时,就围绕 工作效率场景、日常生活等场景提供了丰富的应用,并有创建个人智能体等个性化体验,“ 3D角色梦工厂”则将大 模型生成技术和 3D应用结合,进一步创新了元宝
    的头像 发表于07-18 11:39 585次阅读
    欢创播报 腾讯元宝首发<b class='flag-5'>3D</b>生成应用

    裸眼3D笔记本电脑——先进的光场裸眼3D技术

    随着科技的不断进步,裸眼 3D技术已经不再是科幻电影中的幻想。如今,英伦科技裸眼 3D笔记本电脑将这一前沿科技带到了我们的日常生活中。无论你是专业的 3D 模型设计师,还是希望在视频播放和
    的头像 发表于07-16 10:04 156次阅读

    ad19中3d模型不显示?

    封装库导入 3d 模型不显示,但导入 3d 模型后的封装库生成pcb文件时显示 3d 模型,这是什么原因导致
    发表于04-24 13:41

    包含具有多种类型信息的3D模型

    Desktop是一个 3D建模CAD程序,用于多种绘图和设计,涵盖建筑、土木和机械工程,以及室内设计、产品设计、景观建筑甚至游戏开发。它通常用于创建和编辑 3D 模型,同时提供与BIM 工作
    发表于03-28 17:18

    Stability AI推出全新Stable Video3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,该 模型以其独特的功能吸引了众多关注。此 模型具备从单张图像中生成多视图
    的头像 发表于03-22 10:30 606次阅读

    探索ICLR‘24 Spotlight中的首个十亿级别3D通用大模型

    Uni3D在少样本点云部件分割任务上也展示出了卓越的性能。下表结果显示,在各种实验条件下, Uni3D的性能都明显优于Point-BERT等基线方法。
    的头像 发表于01-25 10:10 349次阅读
    探索ICLR‘24 Spotlight中的首个十亿级别<b class='flag-5'>3D</b>通用大<b class='flag-5'>模型</b>

    3D人体生成模型HumanGaussian实现原理

    3D生成领域,根据文本提示创建高质量的 3D人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程,如 3D人体 模型回归、绑定、
    的头像 发表于12-20 16:37 1186次阅读
    <b class='flag-5'>3D</b>人体生成<b class='flag-5'>模型</b>HumanGaussian实现原理

    CASAIM沙盘模型3D打印的优势和应用

    随着 3D打印技术的不断发展,沙盘 模型 3D打印已经成为建筑行业中的一项创新应用。这种技术能够将设计师的创意以实体形式呈现,为建筑项目的沟通和展示提供了更加直观和便捷的方式。本文将介绍CASAIM沙盘
    的头像 发表于12-19 16:44 367次阅读
    CASAIM沙盘<b class='flag-5'>模型</b><b class='flag-5'>3D</b>打印的优势和应用

    提供3D打印材料与解决方案,助力3D打印产业发展

    提供 3D打印材料与解决方案,助力 3D打印产业发展
    的头像 发表于12-12 11:12 330次阅读

    3D封装与3D集成有何区别?

    3D封装与 3D集成有何区别?
    的头像 发表于12-05 15:19 690次阅读
    <b class='flag-5'>3D</b> 封装与 <b class='flag-5'>3D</b> 集成有何区别?

    当芯片变身3D系统,3D异构集成面临哪些挑战

    当芯片变身 3D系统, 3D异构集成面临哪些挑战
    的头像 发表于11-24 17:51 539次阅读
    当芯片变身 <b class='flag-5'>3D</b>系统,<b class='flag-5'>3D</b>异构集成面临哪些挑战

    PADS VX2.7 下载安装及3D模型导入的注意事项

    ://mentor.mr-wu.cn/ 安装方式按照安装包内的指导完成即可。 破解注意事项:1.用最新版馒头破解 2.必须关闭杀毒软件,否则破解后不可用! 二: 3D 模型导入 1.从 3D 模型
    发表于11-22 17:54

    HT for Web (Hightopo) 使用心得(4)-3D场景 Graph3dView 与 Obj模型

    这里我们通过代码建立一个 3D场景并添加一个 Obj 模型来介绍一下 HT for Web 在 3D场景和 模型加载方面的使用。
    的头像 发表于11-20 11:05 540次阅读
    HT for Web (Hightopo) 使用心得(4)- <b class='flag-5'>3D</b> 场景 Graph<b class='flag-5'>3</b>dView 与 Obj <b class='flag-5'>模型</b>

    88个电子元器件3D模型合集

    整合88个国外网站下载的电子元器件 3D 模型,省去逐一下载的麻烦。
    发表于09-25 07:47