1 Google DeepMind发布Genie 2:打造交互式3D虚拟世界-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google DeepMind发布Genie 2:打造交互式3D虚拟世界

科技绿洲 来源:网络整理 作者:网络整理 2024-12-05 14:16 次阅读

在OpenAI宣布即将发布新模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基础世界模型——Genie 2。这款模型能够生成各种可控制动作、可玩的3D环境,为用户带来全新的交互式体验。

据了解,Genie 2是一个自回归潜在扩散模型,它基于大型视频数据集进行训练。通过自动编码器,视频中的潜在帧被传递到大型Transformer动力学模型中。该模型采用与大语言模型类似的因果掩码进行训练,从而实现了对3D环境的精准生成和控制。

令人惊叹的是,用户只需给Genie 2一张提示图像,并输入相应的文本提示,它就能生成一个对应的交互式虚拟世界。在这个由AI生成的3D游戏世界里,无论是人类还是AI agent,都可以通过键盘和鼠标进行探索和互动,享受前所未有的游戏体验。

Genie 2的发布标志着Google DeepMind在AI生成3D环境技术方面取得了重大突破。未来,这一技术有望在游戏开发、虚拟现实、增强现实等领域得到广泛应用,为用户带来更加丰富、多样的交互体验。同时,这也为AI技术的发展注入了新的活力,推动了AI技术在各个领域的创新和应用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 3D
    3D
    +关注

    关注

    9

    文章

    2875

    浏览量

    107472
  • Google
    +关注

    关注

    5

    文章

    1762

    浏览量

    57503
  • 虚拟世界
    +关注

    关注

    0

    文章

    81

    浏览量

    5801
  • genie
    +关注

    关注

    0

    文章

    7

    浏览量

    4282
收藏 人收藏

    评论

    相关推荐

    发掘3D文件格式的无限潜力:打造沉浸虚拟世界

    在当今数字化时代,3D技术的应用范围日益广泛,涵盖电影后期制作、产品原型设计、虚拟现实(VR)、增强现实(AR)、游戏等众多领域。而3D文件格式作为3D技术的核心组成部分,对于实现
    的头像 发表于 09-26 18:14 1505次阅读
    发掘<b class='flag-5'>3D</b>文件格式的无限潜力:<b class='flag-5'>打造</b>沉浸<b class='flag-5'>式</b><b class='flag-5'>虚拟</b><b class='flag-5'>世界</b>

    奥比中光3D相机打造高质量、低成本的3D动作捕捉与3D动画内容生成方案

      在过去几十年里,动作捕捉(MoCap)技术经历了显著的发展,广泛被应用于电影、游戏、虚拟现实、医疗等多个领域。近期,奥比中光合作客户Moverse使用Orbbec Femto系列3D相机,打造
    的头像 发表于 06-25 16:37 1066次阅读

    英伦科技的15.6寸2D-3D可切换光场裸眼3D显示屏有哪些特点?

    随着科技的快速发展,人类对于视觉体验的追求也在不断攀升。从平面的2D图像到立体的3D影像,我们一直在探索如何让虚拟世界更加逼真。如今,英伦科技凭借其创新实力,推出了一款革命性的显示设备
    的头像 发表于 05-28 11:17 356次阅读
    英伦科技的15.6寸<b class='flag-5'>2D-3D</b>可切换光场裸眼<b class='flag-5'>3D</b>显示屏有哪些特点?

    VR虚拟空间中的3D 技术

    随着科技的飞速发展,虚拟空间已成为元宇宙的重要呈现方式。从游戏到工业设计,从电子商务到文旅体验,3D相关技术在虚拟空间中发挥着举足轻重的作用,决定着用户们能否真正能体会到VR的沉浸
    的头像 发表于 04-29 09:36 1530次阅读
    VR<b class='flag-5'>虚拟</b>空间中的<b class='flag-5'>3D</b> 技术

    怪兽智能数字人,实时交互数字人直播系统,3D超写实虚拟形象直播

    怪兽智能数字人,实时交互数字人直播系统,3D超写实虚拟形象直播 随着科技的不断进步,虚拟现实技术已经逐渐进入人们的日常生活。而在这个数字化时代,人们对于直播内容的需求也越来越高。与此同
    的头像 发表于 03-05 09:08 631次阅读

    谷歌发布全新AI基础世界模型Genie

    谷歌近日宣布推出其最新研发的AI基础世界模型——Genie。这款模型拥有惊人的110亿参数,其独特之处在于,仅需一张图片,便能生成一个充满活力和交互性的虚拟
    的头像 发表于 03-04 14:02 748次阅读

    谷歌发布全新AI模型Genie

    谷歌近日发布了其全新的AI模型Genie,这一模型彻底改变了我们与数字世界的互动方式。Genie不仅可以接收文本提示、草图或想法,还能将这些创意迅速转化为一个可互动和玩耍的
    的头像 发表于 02-28 18:25 1680次阅读

    谷歌发布AI基础世界模型Genie

    谷歌近日宣布了其生成AI的全新里程碑——全新AI基础世界模型Genie。这一创新技术允许用户通过单张图像提示,生成一个可玩的、交互式虚拟
    的头像 发表于 02-28 17:41 818次阅读

    谷歌DeepMind重磅发布了基础世界模型:Genie(精灵)

    大家都喜欢玩游戏吧?因为游戏最大的吸引力是让我们逃避现实、幻想一个远离我们眼前现实的世界,掌控这个虚拟的现实世界。现在,我们可以想象一下,如果我们有能力创造自己的世界,那该多好了。
    的头像 发表于 02-28 10:45 896次阅读
    谷歌<b class='flag-5'>DeepMind</b>重磅<b class='flag-5'>发布</b>了基础<b class='flag-5'>世界</b>模型:<b class='flag-5'>Genie</b>(精灵)

    谷歌发布新型AI模型Genie

    近日,谷歌推出了一款革命性的AI模型——Genie。这款模型能够将简单的文本提示、草图或初步想法迅速转化为一个可以互动和游戏的虚拟世界。这一突破性的技术无疑将改变人们创建和体验虚拟
    的头像 发表于 02-28 10:05 739次阅读

    谷歌公布基础模型Genie,主攻2D平台类游戏及机器人应用

    DeepMind指出,Genie有能力根据最新的文生图大模型生成初始帧,再借助Genie的能力赋予这些图像更深层次的含义。Genie作为一个包含110亿参数的基础
    的头像 发表于 02-28 10:02 491次阅读

    谷歌DeepMind推新AI模型Genie,能生成2D游戏平台

    据报道,谷歌公司的DeepMind团队近期发布了AI模型Genie,此模型拥有多达110亿个参数,能够依据用户提供的图片及提示词创建出相当完整的2D游戏场景。
    的头像 发表于 02-27 14:53 772次阅读

    虚拟世界3D 声音

    Create 可以扩展到战略位置的更多扬声器、高音扬声器和低音扬声器,让听众沉浸在 2D 中 和有限的 3D 音频( 图 3 )。直接在顶部或底部的东西可能有些 通过信号处理近似,但除非确认扬声器高于
    的头像 发表于 01-17 18:12 531次阅读
    <b class='flag-5'>虚拟</b><b class='flag-5'>世界</b>的 <b class='flag-5'>3D</b> 声音

    标注神器!AAAI&apos;24最新:第一个交互式3D目标检测器!

    考虑到3D点云的稀疏性质,iDet3D设计了负点击模拟 (NCS),通过减少误报预测来提高准确性。还结合了两种点击传播技术来充分利用用户交互:(1) 密集点击引导 (DCG),用于在整个网络中保留用户提供的信息;(
    的头像 发表于 01-16 16:08 539次阅读
    标注神器!AAAI&apos;24最新:第一个<b class='flag-5'>交互式</b><b class='flag-5'>3D</b>目标检测器!

    一文了解3D视觉和2D视觉的区别

    3D视觉与2D视觉最明显的区别在于立体感。2D视觉只有两个维度,即宽度和高度;而3D视觉则具有额外的深度维度。通过模拟真实世界中的第三个维
    的头像 发表于 12-25 11:15 3011次阅读