成都汇阳投资关于Sora 正式上线，多模态模型的里程碑-德赢Vwin官网网

事件

12月10日,OpenAl正式上线Sora,并向包括美国在内的多数国家用户开放,用户可在OpenAI官网上体验Sora。同时,Sora被包含在ChatGPTPlus和ChatGPTPro的会员订阅方案中,用户无需额外付费。其中,订阅Plus方案的用户可使用Sora生成最多50个分辨率达720p、时长为5秒的高级视频而Pro方案能生成最多500个分辨率达1080p、时长为20秒的高级视频,并且提供去水印功能。

新Sora视频再创作能力大幅提升

相较于OpenAI2月份发布的版本,此次上线的新Sora新增Storyboard、Remix、Re-cut等功能,视频再创作能力大幅提升,并且优化了视频生成速度及生成方式。新Sora的新功能包括1)Storyboard:类似于电影里的分镜,即用户只需借助文字设计几段视频帧或直接上传图片作为静态视频帧,并在视频帧之间预留一些时间供Sora发挥,Sora便能自动把这些视频帧串联起来形成一段完整的视频:2)Remix:通过不同的文字描述对视频中的元素进行替换、删除或重构,比如可以把图书馆变成宇宙飞船:3)Re-cut:智能识别并剪切出视频中的最佳帧,并将其导入Storyboard中,拓展该视频帧:4)Loop:用于创建无限循环的视频:5)Blend:将两个视频无合并为一个视频:6)Stylepresets:为视频预设风格,比如黑白电影、纸片人等。此外,借助SoraTurbo,新Sora的视频生成速度显著提升,同时,新Sora将视频生成方式扩展为文/文+图/文+视频生成视频。

国内企业开始加速研发并选代AI视频生成产品

今年以来,国内企业开始加速研发并选代AI视频生成产品,产品能力不断提升,应用场景持续拓宽。1)今年6月,快手AI团队发布可灵AI视频生成大模型,可生成长达2分钟、分辨率达1080p的视频,可灵AI主要功能包括文生视频、图生视频、视频续写等;2)今年7月,智谱AI上线视频生成产品智谱清影,并在11月进行全新升级,支持生成时长为10秒的4K超高清视频,除常规的文生视频和图生视频功能外,智谱清影引入CogSound模型,可以对为生成的视频添加背景音乐:3)今年8月,字节推出即梦AI一站式创作平台,随后在11月宣布即梦AI两大视频模型S2.0Pro和P2.0Pro正式全量上线,其中,S2.0Pro在图生视频场景具有较高的首一致性,能够保持视频与用户输入图像的色彩、风格等保持一致,P2.0Pro具有极高提示词遵循能力,能够在一句提示词内实现多个镜头切换及多镜头组合,同时保持视频内形象主体、风格和氛围的一致性。此外,Minimax、阿里云等初创企业及大模型厂商也在布局AI视频生成赛道,整体来看,视频生成工具今年以来,国内企业开始加速研发并选代AI视频生成产品,产品能力不断提升,应用场景持续拓宽。1)今年6月,快手AI团队发布可灵AI视频生成大模型,可生成长达2分钟、分辨率达1080p的视频,可灵AI主要功能包括文生视频、图生视频、视频续写等;2)今年7月,智谱AI上线视频生成产品智谱清影,并在11月进行全新升级,支持生成时长为10秒的4K超高清视频,除常规的文生视频和图生视频功能外,智谱清影引入CogSound模型,可以对为生成的视频添加背景音乐:3)今年8月,字节推出即梦AI一站式创作平台,随后在11月宣布即梦AI两大视频模型S2.0Pro和P2.0Pro正式全量上线,其中,S2.0Pro在图生视频场景具有较高的首一致性,能够保持视频与用户输入图像的色彩、风格等保持一致,P2.0Pro具有极高提示词遵循能力,能够在一句提示词内实现多个镜头切换及多镜头组合,同时保持视频内形象主体、风格和氛围的一致性。此外,Minimax、阿里云等初创企业及大模型厂商也在布局AI视频生成赛道,整体来看,视频生成工具的能力不断提升,未来有望渗透更多应用场景。

相关公司

三六零(601360):目前360搜索是中国搜索引擎的Top2,市场份额为35%,公司的人工智能研究院从2020年开始一直在包括类ChatGPT技术在内的AIGC技术上有持续性的投入,但截至目前仅作为内部业务自用的生产力工具使用,且投资规模及技术水平与当前的ChatGPT3相比还有较大差距,各项技术指标只能做到略强于ChatGPT2。由于训练数据源及应用方向的原因,在中文环境下的实际效果强于ChatGPT2。360在数据资源端有丰富的多模态大数据积累和相关语料、尤其是中文语料,相较于国外同行落后的是预训练大模型和有效的多模态数据清洗与融合技术。公司有充足的资金储备可用于购买大规模算力,在继续深入自行研发的同时,不排除寻找强有力的合作伙伴,以开放的心态搭建多方共享平台、补足短板,快速缩小差距。公司也计划尽快推出类ChatGPT技术的demo版产品。

中科曙光(603019):伴随宁夏“算力交易平台”的上线,“东数西算”工程迎来重要里程碑。2月24日,由宁夏回族自治区联合中科曙光、中国电信宁夏公司、北京国际大数据交易所等打造的国内首个一体化算力交易调度平台——东数西算一体化算力服务平台正式上线。该平台上线后将整合宁夏地区零散算力资源,解决算力输出、应用、交易等难题,赋能宁夏“六新六特”等产业数字转型升级。

参考资料:20241212-山西证券-计算机行业点评:Sora正式上线,多模态模型的里程碑

免责声明:以上信息出自汇阳研究部,内容不做具体操作指导,客户亦不应将其作为投资决策的唯一参考因素。据此买入,责任自负,股市有风险,投资需谨慎。

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

模型

模型

+关注

关注
1

文章
3226

浏览量
48804
Sora

Sora

+关注

关注
0

文章
81

浏览量
195

商汤日日新多模态大模型权威评测第一

刚刚，商汤科技日日新SenseNova多模态大模型，在权威综合评测权威平台OpenCompass的多模态评测中取得榜单第一。

发表于 12-20 10:39 •109次阅读

利用OpenVINO部署Qwen2多模态模型

多模态大模型的核心思想是将不同媒体数据（如文本、图像、音频和视频等）进行融合，通过学习不同模态之间的关联，实现更加智能化的信息处理。简单来说，多

发表于 10-18 09:39 •411次阅读

亚马逊云科技上线Meta Llama 3.2模型

亚马逊云科技近日宣布，Meta公司的新一代模型Llama 3.2已在其平台上正式上线。该模型包括Meta首款多模态

发表于 10-11 18:08 •443次阅读

特斯拉里程碑达成:第1亿颗4680电池震撼问世

特斯拉的4680电池技术再次跨越重要里程碑，公司于9月15日欣然宣布，其第1亿颗创新性的4680电池已成功下线，这一成就标志着特斯拉在电池制造领域的飞速进展。特斯拉首席执行官埃隆·马斯克通过社交媒体向辛勤工作的电池团队致以热烈祝贺，彰显了公司对这一里程碑事件的自豪与重视。

发表于 09-18 15:30 •1226次阅读

人大系初创公司智子引擎发布全新多模态大模型Awaker 1.0

人大系初创公司智子引擎近日震撼发布了新一代多模态大模型Awaker 1.0，这一里程碑式的成果标志着公司在通用人工智能（AGI）领域取得了重要突破。与前代ChatImg序列

发表于 05-06 09:59 •596次阅读

汤姆猫加速布局AI应用，接入OpenAI Sora模型，探索生成视频素材之道

汤姆猫称，Sora是人工智能不断演进的里程碑之作。类似Sora的各类AI工具能够助其以更高效率、更低成本创建丰富多样且用户体验佳的AI应用产品和服务。

发表于 03-04 13:46 •691次阅读

sora模型中国可以使用吗 sora模型是哪个公司

。 Sora是一种扩散模型，具备从噪声中生成完整视频的能力，它生成的视频一开始看起来像静态噪音，通过多个步骤逐渐去除噪声后，视频也从最初的随机像素转化为清晰的图像场景，其能够一次生成多帧预测，确保画面主体在暂时离开视野时仍保持

发表于 02-22 16:52 •3266次阅读

sora模型怎么使用 sora模型对现实的影响

美国当地时间2024年2月15日，OpenAI正式发布文生视频模型Sora ，并发布了48个文生视频案例和技术报告，正式入局视频生成领域。Sora能够根据提示词生成60s的连贯视频，“碾压”了

发表于 02-22 16:42 •1167次阅读

Sora爆红，多模态大模型是下一发展阶段

“大语言模型为 AI 产业带来新的生机，然而语言模型的应用场景有限。要全面打开生成式 AI 的想象力，还是要依托多模态大模型。”IDC 中国

发表于 02-20 16:13 •437次阅读

成都汇阳投资关于Sora 横空出世，AI 产业链风云再起！

【Sora 在视频生成和模拟能力实现重大突破】 2 月16 日，OpenAI 发布最新文生视频大模型 Sora ，并在官网发布由其生成的 48 个视频样例。目前，Sora 仍处于测试

发表于 02-20 09:43 •836次阅读

奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相

奥特曼发布王炸模型Sora OpenAI首个文生视频模型Sora正式亮相 2月16日凌晨OpenAI的首个文生视频模型

发表于 02-18 17:41 •979次阅读

OpenAI推出新款大模型Sora，引领多模态AI新潮流

全球人工智能领域的佼佼者OpenAI近日发布了一款名为Sora的短视频生成模型，该模型能够根据文字指令即时生成高质量短视频，引起了业界的广泛关注。

发表于 02-18 10:16 •1335次阅读

机器人基于开源的多模态语言视觉大模型

ByteDance Research 基于开源的多模态语言视觉大模型 OpenFlamingo 开发了开源、易用的 RoboFlamingo 机器人操作模型，只用单机就可以训练。

发表于 01-19 11:43 •406次阅读

百度地图宣布城市车道级导航取得里程碑突破

近日，百度地图宣布其城市车道级导航取得里程碑突破，已率先覆盖全国超100城普通道路。

发表于 01-09 17:28 •1195次阅读

从Google多模态大模型看后续大模型应该具备哪些能力

前段时间Google推出Gemini多模态大模型，展示了不凡的对话能力和多模态能力，其表现究竟如何呢？

发表于 12-28 11:19 •1247次阅读