高分工作！Uni3D：3D基础大模型，刷新多个SOTA！-德赢Vwin官网网

我们近期的工作：3D视觉大模型Uni3D在ICLR 2024的评审中获得了688分，被选为Spotlight Presentation

在本文中，我们第一次将3D基础模型成功scale up到了十亿(1B)级别参数量，并使用一个模型在诸多3D下游应用中取得SoTA结果。代码和各个scale的模型（从6M-1B）均已开源，欢迎大家关注和使用：

论文：https://https://arxiv.org/pdf/2310.06773

代码：https://https://github.com/baaivision/Uni3D

我们主要探索了3D视觉中scale up模型参数量和统一模型架构的可能性。在NLP / 2D vision领域，scale up大模型（GPT-4，SAM，EVA等）已经取得了很impressive的结果，但是在3D视觉中模型的scale up始终没有成功。我们旨在将NLP/2D中scale up的成功复现到3D表征模型上。

在这项工作中，我们提出了一个3D基础大模型Uni3D，直接将3D backbone统一为ViT（Vision Transformer），以此利用丰富和强大的2D预训练大模型作为初始化。Uni3D使用CLIP模型中的文本/图像表征作为训练目标，通过学习三个模态的表征对齐（点云-图像-文本）实现3D点云对图像和文本的感知。同时，通过使用ViT中成功的scale up策略，我们将Uni3D逐步 scale up，训练了从Tiny到giant的5个不同scale的Uni3D模型，成功地将Uni3D扩展到10亿级别参数。

Uni3D模型不同scale下的参数量和zero-shot分类结果

Uni3D在多个3D任务上达到SoTA，如：zero-shot classification, few-shot classification，open-world understanding, open-world part segmentation.

Zero-shot classification

Real-world zero-shot recognition

由于学到了强大的多模态表征能力，Uni3D还能够做一些有意思的应用，如point cloud painting（点云绘画），text/image-based 3D shape retrieval（基于图像/文本的3D模型检索），point cloud captioning（点云描述）：

Point cloud painting

Image-based 3D shape retrieval

Text-based 3D shape retrieval

Point cloud captioning.

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

3D视觉

3D视觉

+关注

关注
4

文章
420

浏览量
27396
大模型

大模型

+关注

关注
2

文章
2066

浏览量
1803

原文标题：ICLR 2024 | 高分工作！Uni3D：3D基础大模型，刷新多个SOTA！

文章出处：【微信号：CVer，微信公众号：CVer】欢迎添加关注！文章转载请注明出处。

安宝特产品安宝特3DAnalyzer：智能的3DCAD高级分析工具

安宝特 3DAnalyzer包含多种实用的 3DCAD高级分析工具，包括自动比对模型、碰撞检测、间隙检查、壁厚检查，以及拔模和底切分析，能够有效提升 3DCAD

发表于08-07 10:13 • 159次阅读

安宝特产品安宝特<b class='flag-5'>3D</b> Analyzer：智能的<b class='flag-5'>3D</b> CAD高级分析工具

欢创播报腾讯元宝首发3D生成应用

App。腾讯元宝APP发布时，就围绕工作效率场景、日常生活等场景提供了丰富的应用，并有创建个人智能体等个性化体验，“ 3D角色梦工厂”则将大模型生成技术和 3D应用结合，进一步创新了元宝

发表于07-18 11:39 • 585次阅读

裸眼3D笔记本电脑——先进的光场裸眼3D技术

随着科技的不断进步，裸眼 3D技术已经不再是科幻电影中的幻想。如今，英伦科技裸眼 3D笔记本电脑将这一前沿科技带到了我们的日常生活中。无论你是专业的 3D 模型设计师，还是希望在视频播放和

发表于07-16 10:04 • 156次阅读

ad19中3d模型不显示？

封装库导入 3d 模型不显示，但导入 3d 模型后的封装库生成pcb文件时显示 3d 模型，这是什么原因导致

发表于04-24 13:41

包含具有多种类型信息的3D模型

Desktop是一个 3D建模CAD程序，用于多种绘图和设计，涵盖建筑、土木和机械工程，以及室内设计、产品设计、景观建筑甚至游戏开发。它通常用于创建和编辑 3D 模型，同时提供与BIM 工作

发表于03-28 17:18

Stability AI推出全新Stable Video3D模型

近日，Stability AI 推出了全新的 Stable Video 3D 模型，该模型以其独特的功能吸引了众多关注。此模型具备从单张图像中生成多视图

发表于03-22 10:30 • 606次阅读

探索ICLR‘24 Spotlight中的首个十亿级别3D通用大模型

Uni3D在少样本点云部件分割任务上也展示出了卓越的性能。下表结果显示，在各种实验条件下， Uni3D的性能都明显优于Point-BERT等基线方法。

发表于01-25 10:10 • 349次阅读

探索ICLR‘24 Spotlight中的首个十亿级别<b class='flag-5'>3D</b>通用大<b class='flag-5'>模型</b>

3D人体生成模型HumanGaussian实现原理

在 3D生成领域，根据文本提示创建高质量的 3D人体外观和几何形状对虚拟试穿、沉浸式远程呈现等应用有深远的意义。传统方法需要经历一系列人工制作的过程，如 3D人体模型回归、绑定、

发表于12-20 16:37 • 1186次阅读

<b class='flag-5'>3D</b>人体生成<b class='flag-5'>模型</b>HumanGaussian实现原理

CASAIM沙盘模型3D打印的优势和应用

随着 3D打印技术的不断发展，沙盘模型 3D打印已经成为建筑行业中的一项创新应用。这种技术能够将设计师的创意以实体形式呈现，为建筑项目的沟通和展示提供了更加直观和便捷的方式。本文将介绍CASAIM沙盘

发表于12-19 16:44 • 367次阅读

CASAIM沙盘<b class='flag-5'>模型</b><b class='flag-5'>3D</b>打印的优势和应用

提供3D打印材料与解决方案，助力3D打印产业发展

提供 3D打印材料与解决方案，助力 3D打印产业发展

发表于12-12 11:12 • 330次阅读

3D封装与3D集成有何区别？

3D封装与 3D集成有何区别？

发表于12-05 15:19 • 690次阅读

<b class='flag-5'>3D</b> 封装与 <b class='flag-5'>3D</b> 集成有何区别？

当芯片变身3D系统，3D异构集成面临哪些挑战

当芯片变身 3D系统， 3D异构集成面临哪些挑战

发表于11-24 17:51 • 539次阅读

当芯片变身 <b class='flag-5'>3D</b>系统，<b class='flag-5'>3D</b>异构集成面临哪些挑战

PADS VX2.7 下载安装及3D模型导入的注意事项

://mentor.mr-wu.cn/ 安装方式按照安装包内的指导完成即可。破解注意事项：1.用最新版馒头破解 2.必须关闭杀毒软件，否则破解后不可用！二： 3D 模型导入 1.从 3D 模型

发表于11-22 17:54

HT for Web (Hightopo) 使用心得（4）-3D场景 Graph3dView 与 Obj模型

这里我们通过代码建立一个 3D场景并添加一个 Obj 模型来介绍一下 HT for Web 在 3D场景和模型加载方面的使用。

发表于11-20 11:05 • 540次阅读

88个电子元器件3D模型合集

整合88个国外网站下载的电子元器件 3D 模型，省去逐一下载的麻烦。

发表于09-25 07:47

搜索历史

高分工作！Uni3D：3D基础大模型，刷新多个SOTA！

评论