在OpenAI宣布即将发布新模型和新功能后,Google DeepMind也不甘落后,于近日推出了大型基础世界模型——Genie 2。这款模型能够生成各种可控制动作、可玩的3D环境,为用户带来全新的交互式体验。
据了解,Genie 2是一个自回归潜在扩散模型,它基于大型视频数据集进行训练。通过自动编码器,视频中的潜在帧被传递到大型Transformer动力学模型中。该模型采用与大语言模型类似的因果掩码进行训练,从而实现了对3D环境的精准生成和控制。
令人惊叹的是,用户只需给Genie 2一张提示图像,并输入相应的文本提示,它就能生成一个对应的交互式虚拟世界。在这个由AI生成的3D游戏世界里,无论是人类还是AI agent,都可以通过键盘和鼠标进行探索和互动,享受前所未有的游戏体验。
Genie 2的发布标志着Google DeepMind在AI生成3D环境技术方面取得了重大突破。未来,这一技术有望在游戏开发、虚拟现实、增强现实等领域得到广泛应用,为用户带来更加丰富、多样的交互体验。同时,这也为AI技术的发展注入了新的活力,推动了AI技术在各个领域的创新和应用。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网
网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
相关推荐
在当今数字化时代,3D技术的应用范围日益广泛,涵盖电影后期制作、产品原型设计、虚拟现实(VR)、增强现实(AR)、游戏等众多领域。而3D文件格式作为3D技术的核心组成部分,对于实现
发表于 09-26 18:14
•1505次阅读
在过去几十年里,动作捕捉(MoCap)技术经历了显著的发展,广泛被应用于电影、游戏、虚拟现实、医疗等多个领域。近期,奥比中光合作客户Moverse使用Orbbec Femto系列3D相机,打造
发表于 06-25 16:37
•1066次阅读
随着科技的快速发展,人类对于视觉体验的追求也在不断攀升。从平面的2D图像到立体的3D影像,我们一直在探索如何让虚拟世界更加逼真。如今,英伦科技凭借其创新实力,推出了一款革命性的显示设备
发表于 05-28 11:17
•356次阅读
随着科技的飞速发展,虚拟空间已成为元宇宙的重要呈现方式。从游戏到工业设计,从电子商务到文旅体验,3D相关技术在虚拟空间中发挥着举足轻重的作用,决定着用户们能否真正能体会到VR的沉浸式体
发表于 04-29 09:36
•1530次阅读
怪兽智能数字人,实时交互数字人直播系统,3D超写实虚拟形象直播 随着科技的不断进步,虚拟现实技术已经逐渐进入人们的日常生活。而在这个数字化时代,人们对于直播内容的需求也越来越高。与此同
发表于 03-05 09:08
•631次阅读
谷歌近日宣布推出其最新研发的AI基础世界模型——Genie。这款模型拥有惊人的110亿参数,其独特之处在于,仅需一张图片,便能生成一个充满活力和交互性的虚拟
发表于 03-04 14:02
•748次阅读
谷歌近日发布了其全新的AI模型Genie,这一模型彻底改变了我们与数字世界的互动方式。Genie不仅可以接收文本提示、草图或想法,还能将这些创意迅速转化为一个可互动和玩耍的
发表于 02-28 18:25
•1680次阅读
谷歌近日宣布了其生成式AI的全新里程碑——全新AI基础世界模型Genie。这一创新技术允许用户通过单张图像提示,生成一个可玩的、交互式的虚拟
发表于 02-28 17:41
•818次阅读
大家都喜欢玩游戏吧?因为游戏最大的吸引力是让我们逃避现实、幻想一个远离我们眼前现实的世界,掌控这个虚拟的现实世界。现在,我们可以想象一下,如果我们有能力创造自己的世界,那该多好了。
发表于 02-28 10:45
•896次阅读
近日,谷歌推出了一款革命性的AI模型——Genie。这款模型能够将简单的文本提示、草图或初步想法迅速转化为一个可以互动和游戏的虚拟世界。这一突破性的技术无疑将改变人们创建和体验虚拟
发表于 02-28 10:05
•739次阅读
DeepMind指出,Genie有能力根据最新的文生图大模型生成初始帧,再借助Genie的能力赋予这些图像更深层次的含义。Genie作为一个包含110亿参数的基础
发表于 02-28 10:02
•491次阅读
据报道,谷歌公司的DeepMind团队近期发布了AI模型Genie,此模型拥有多达110亿个参数,能够依据用户提供的图片及提示词创建出相当完整的2D游戏场景。
发表于 02-27 14:53
•772次阅读
Create 可以扩展到战略位置的更多扬声器、高音扬声器和低音扬声器,让听众沉浸在 2D 中 和有限的 3D 音频( 图 3 )。直接在顶部或底部的东西可能有些 通过信号处理近似,但除非确认扬声器高于
发表于 01-17 18:12
•531次阅读
考虑到3D点云的稀疏性质,iDet3D设计了负点击模拟 (NCS),通过减少误报预测来提高准确性。还结合了两种点击传播技术来充分利用用户交互:(1) 密集点击引导 (DCG),用于在整个网络中保留用户提供的信息;(
发表于 01-16 16:08
•539次阅读
,3D视觉与2D视觉最明显的区别在于立体感。2D视觉只有两个维度,即宽度和高度;而3D视觉则具有额外的深度维度。通过模拟真实世界中的第三个维
发表于 12-25 11:15
•3011次阅读
评论