Sora之后，视频生成模型的中国牌局-德赢Vwin官网网

Sora，自2月16日OpenAI发布后一直被吐槽是“技术期货”，终于在12月10日，正式版Sora露面了，可以生成最高 1080p 分辨率、最长 20 秒的视频。

OpenAI CEO奥特曼称，Sora正式版是视频生成领域的GPT-1时刻。

但国内AI企业，并没有像跟进GPT时期一样，在视频生成领域也与OpenAI保持同步，而是呈现出更复杂的态度。

有人选择跟进，比如Sora问世之后，互联网公司如阿里、字节跳动、快手、腾讯等，AI公司如智谱AI、MiniMax、爱诗科技、生数科技等，都陆续发布了视频生成模型，不少都表示达到或超越了预览版Sora。

也有人选择不跟进，包括互联网公司中的百度，李彦宏曾明确表示，“无论Sora多么火爆百度都不去做”。AI公司如百川智能，也明确表示不会做类Sora模型，月之暗面、商汤科技、零一万物虽然都有文生视频模型，但都不作为重点。

视频生成赛道，不再延续GPT时代的发展模式，即OpenAI打出一张王牌，国内科技企业抢着要跟。Sora之后，国内AI牌局开始有了自己的节奏，也呈现出更为复杂的局势。

有能力做通用基础大模型的国内科技公司，在技术路线、商业前景等判断上，开始出现明显分野。我们就从国内企业跟进Sora的选择与否，聊聊视频生成的中国牌局。

首先我们要明确一下，国内对标Sora模型的科技公司，到底在做什么？

简单来说，Sora视频生成模型的核心技术路线是Diffusion+Transformer相结合，通过文本（自然语言）、图片、视频作为提示词prompts进行视频生成。

对标Sora的模型，至少要具备几个特点：

1.通用性，不针对某一类风格、行业、角色等，任意内容的视频都可以生成。

2.高质量，画质精度高（达到1080p）、视频时间长（最长达一分钟）、画面一致性强（理解物理规律）。

面对Sora，国内科技企业不像ChatGPT推出时那样毫无准备。但到底跟or不跟，却不再像ChatGPT那样高度一致，而是分化成了三类：

第一类，明确跟进。

互联网公司阵营中，以视频为核心业务的字节跳动、快手等，以及综合科技公司腾讯，数字基建成熟，技术人才资源充沛，内部有视频产品基因，几乎第一时间选择了跟进。字节跳动推出了即梦Dreamnia，快手也发布了可灵大模型。腾讯以混元大模型作为核心，发布并开源了混元多模态生成模型，被认为是腾讯版Sora。

大模型初创企业中，智谱AI的行动最为敏捷，今年7月发布了AI视频生成工具清影，支持用户通过文本/图片，生成10秒、4K、60帧视频。MiniMax的海螺AI也在十月增加了视频生成能力，支持文本提示词生成6秒视频片段。

第二类，坚决不跟。

与第一类企业的态度截然相反，互联网公司和大模型创企中也有坚决不跟Sora的。比如Sora问世之后，百川智能的王小川就表示，团队有人提出要做Sora，但他明确表态称不会跟进这个方向。

同样想法的还有百度李彦宏，尽管百度已经在视频生成领域取得了一定的成果，但他不做Sora的态度也非常坚决，原因是Sora的商业化可能要五年甚至十年，目前百度更聚焦在大语言模型、多模态大模型，没有类Sora的产品化尝试。

第三类，浅尝辄止。

除此之外，还有大量国内企业对于Sora，出于FOMO“恐惧错过”心理有所布局，但并不重点投入，处于一种浅尝辄止的状态。

比如阿里系中的阿里妈妈团队发布了tomoVideo，试水电商营销的视频生成场景；“大模型六小虎”中，月之暗面也推出了视频生成模型，但仍聚焦在kimi产品上；零一万物入局B端业务，而视频生成模型面向的影视制作行业正处于调整期，类Sora产品也很难成为核心增长点。

总结一下，如果说全球大模型是一场“斗地主”，那么游戏规则不再是OpenAI打出一张王炸，国内科技公司纷纷跟上，而是各自按照自己手里的牌面、业务重要性和优先级，来确定Sora的出牌策略。

为什么到了Sora，大模型行业的游戏规则就变了？

国内科技企业的表现说明，对于Sora存在非共识，整体还是比较混乱、规则模糊的阶段。迷雾中的领域，游戏规则自然只能自行探索。

如今视频生成领域的现状，笼罩着三重迷雾。

技术迷雾：OpenAl认为Sora是世界vwin 器、通往AGl的一条有前途的途径，这一技术路线目前存在不少争议。

比如李飞飞、lecun等人认为，Sora不能实现AGI。李飞飞提出，Sora仍是二维图像，只有三维空间智能才能实现AGI。Sora预览版展示的“日本女性走过霓虹闪烁东京街头”的生成视频，就无法把摄像机放在女子背后，说明Sora并没有真的理解三维世界。学术大神Lecun也点名不看好Sora，说它根本不是真正的世界模型，并且仍会面临GPT4的巨大瓶颈。

确实，即使是正式版Sora，生成的手部细节不准确，动态过程中的一致性等问题，依然存在。

而国内公司坚定不跟进Sora的原因之一，也是对这一技术路线保留意见。比如百川智能的王小川就认为，Sora只是阶段性产物，技术高度、突破性以及应用价值均不及GPT。总之，实现AGI、模拟物理世界的技术路线的开放性，决定了Sora并非唯一解。

商业迷雾：视频生成模型的商用前景、投资回报比，在短期内都不明朗，成为劝退国内企业的另一重阻碍。

预览版和正式版Sora，都延续了OpenAI的“暴力美学”，OpenAI 研究科学家 Noam Brown 表示，Sora是scale力量最直观的展示，也就是通过堆算力、对数据、对参数量的方式，来尝试让大模型涌现出理解物理世界的能力。这种方法成本高、资源投入大。是否跟进Sora，就取决于各家对模型的商用预期和投资回报比。

如果视频生成模型面向ToB收费，通过API或SaaS服务，都需要基础模型厂商投入大量人力去优化业务流程、开发交互页面，而影视行业正处于调整周期，AI影视制作业务的增长有限。这就在无形中增加了AI企业的机会成本，因为同样的人力、物力、算力，投入到金融AI、教育AI、大型政企等领域，显然收效更大。所以，百度、零一万物等公司，都将视频生成领域作为边缘业务，并不重点投入。

而ToC场景中，一方面个人付费意愿不高，视频生成并不是大众日常使用的高频场景，而且生成成本和订阅费一般都比文本模型高，加上Sora模型都没能解决幻觉、一致性难题，未必能创造实际价值，所以C端付费规模十分有限。另一方面，模型完全免费，把视频生成模型产品作为企业的流量入口，这一商业模式只适合将视频作为核心业务的企业。

比如快手、字节跳动，本身就有核心的视频业务，可以快速实现模型的规模化。面向C端用户或B端生产力工具，这类企业能够快速将视频生成能力与现有产品进行集成与整合，模型研发的边际成本是会随着规模商用而下降的。

整体来看，对国内绝大多数基础模厂，视频生成领域都是一个相对边缘、投资回报比不高的业务。

第三重迷雾，就是市场格局的竞争迷雾。

虽然视频生成模型现在商业前景不明，但有没有可能以后会爆发，企业悄悄投入然后惊艳所有人？这种押注边缘赛道“捡大漏”的商业神话，在大模型身上恐怕很难发生。

当前，大模型的产品化、商业化前景普遍比较模糊，通用模型厂商都需要尽快从一大堆不甚明朗的产品中，选出一个更高成功概率和更大市场潜力的选项，重点投入。而在所有产品中，视频生成模型是一个尤为沉重且具有挑战性的项目。这种情况下，肯定要优先考虑成功率更高的产品，降低视频生成模型的业务优先级。

换一个角度，即便企业将视频生成模型的优先级放到最高，恐怕也很难建立起竞争优势。因为当前大模型的市场竞争情况跟GPT时期不太一样，如今各家在基础训练设施、核心架构设计与技术储备等方面都有了一定积累，复现Sora并上线类Sora应用的技术壁垒，其实没有ChatGPT时期那么难了。这也意味着，即使企业先发布了视频生成模型，也未必能长期保持竞争优势和市场垄断地位，这种竞争态势也削弱了Sora的商业想象空间。

技术迷雾、商业迷雾、竞争迷雾，仍然笼罩在视频生成领域，导致Sora这一场牌局有着太多的不确定，和太多可能。哪种理解是对的，哪条路线是最终赢家，目前都言之过早，各家只能按照自己的游戏规则玩下去。

大模型技术必须继续发展下去，但从Sora开始，国内科技企业不再紧跟着OpenAI亦步亦趋，开始有了自己的节奏感。

具体表现在，对于Sora这样一鸣惊人的新东西，国内企业在大模型产品化、商业化上都有了自己的理解与思考，开始自己定义玩法，跟进Sora展现的是实力，不跟进Sora展现的是心态与战略定力。

此外，不一味跟进产品，但OpenAI的叙事能力仍然值得学习。

无论是2月用Sora抢走谷歌风头，还是近期Sora正式上线，OpenAI总能一次次带动节奏、设置议题、吸引关注，这对于资本密集型AI企业是非常重要的能力。

可以不跟进Sora，但不能遗漏关键技术。

以百度为例，虽然没有推出Sora产品的计划，但自身也没有缺席关键技术，比如自研了多模态可控生图技术，能够在保持实体特征不变的情况下，实现图像的高泛化生成，而可控性的提升，恰恰是视频生成下一阶段核心中的核心。此外，百度也没有完全无视视频生成领域，目前投资了视频生成初创公司生数科技、AI视频短剧公司井英科技等。

聚焦主赛道，以自身核心业务、商业优先级等多元因素来确定追赶Sora的轻重缓急。大模型的牌局，国内企业正在找到自己的节奏感。

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表德赢Vwin官网网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

AI

AI

+关注

关注
87

文章
30725

浏览量
268869
Sora

Sora

+关注

关注
0

文章
81

浏览量
195

OpenAI暂不推出Sora视频生成模型API

OpenAI近日宣布，目前暂无推出其视频生成模型Sora的应用程序接口(API)的计划。Sora模型能够基于文本和图像

发表于 12-20 14:23 •62次阅读

OpenAI推出AI视频生成模型Sora

近日，备受期待的OpenAI再次推出了其创新之作——AI视频生成模型Sora。这一新品的发布，无疑为AI技术注入了新的活力。据悉，Sora与OpenAI旗下的AI工具DALL-E有着

发表于 12-12 09:40 •165次阅读

OpenAI开放Sora视频生成模型

OpenAI近日宣布，其倾力打造的人工智能视频生成系统Sora已正式向美国及其他市场的ChatGPT Plus订阅用户开放。自去年首次公开预览以来，Sora历经约10个月的精心研发与优化，现已全面

发表于 12-10 11:16 •301次阅读

Sora还在PPT阶段，“中国版Sora”已经开放使用了！

德赢Vwin官网网报道（文/梁浩斌）今年春节期间，OpenAI的AI文字生成视频模型Sora惊艳全世界，极高的视频生成效果、长达60秒的

发表于 06-17 09:07 •3397次阅读

新火种AI|围攻光明顶：Sora效应下的AI视频生成竞赛

Sora的出现，让AI视频生成领域真正“活”了起来

发表于 03-16 11:12 •634次阅读

除了刷屏的Sora，国内外还有哪些AI视频生成工具

。Sora的发布也让AI生成视频有了突破性进展。过去一年多，全球科技公司都在发布各种大模型，然而AI生成内容更多集中在文本和图片方面，

发表于 02-26 08:42 •4339次阅读

除了刷屏的<b class='flag-5'>Sora</b>，国内外还有哪些AI<b class='flag-5'>视频生成</b>工具

sora模型怎么使用 sora模型对现实的影响

美国当地时间2024年2月15日，OpenAI正式发布文生视频模型Sora ，并发布了48个文生视频案例和技术报告，正式入局视频生成领域

发表于 02-22 16:42 •1167次阅读

OpenAI文生视频模型Sora要点分析

近日，美国人工智能公司OpenAI发布了首个视频生成模型Sora。不同于此前许多AI大模型文生图或视频时，会出现人物形象前后不一致等问题

发表于 02-22 16:37 •1066次阅读

OpenAI文生<b class='flag-5'>视频</b><b class='flag-5'>模型</b><b class='flag-5'>Sora</b>要点分析

OpenAI 在 AI 生成视频领域扔出一枚“王炸”，视频生成模型“Sora”

ABSTRACT摘要2月16日凌晨，也就是中国大年初七，OpenAI在AI生成视频领域扔出一枚“王炸”，宣布推出全新的生成式人工智能模型“

发表于 02-22 08:25 •384次阅读

OpenAI 在 AI <b class='flag-5'>生成</b><b class='flag-5'>视频</b>领域扔出一枚“王炸”，<b class='flag-5'>视频生成</b><b class='flag-5'>模型</b>“<b class='flag-5'>Sora</b>”

openai发布首个视频生成模型sora

美国当地时间2024年2月15日，OpenAI正式发布文生视频模型Sora ，并发布了48个文生视频案例和技术报告，正式入局视频生成领域

发表于 02-21 16:45 •1255次阅读

马斯克称特斯拉视频生成技术超过Sora

特斯拉CEO埃隆·马斯克在社交媒体平台上发表言论，声称特斯拉所掌握的视频生成技术超越了OpenAI最新发布的Sora模型。马斯克自信地表示，特斯拉在这一领域的技术实力堪称全球顶尖，甚至超越了OpenAI这一人工智能领域的佼佼者。

发表于 02-20 14:16 •609次阅读

OpenAI发布Sora模型，瞬间生成高清大片

近日，人工智能领域的领军企业OpenAI发布了一款名为“Sora”的视频生成AI模型，再次展示了其在AI技术领域的创新实力。Sora以其出色的视频生

发表于 02-20 13:33 •806次阅读

OpenAI新年开出王炸，视频生成模型Sora问世

近日，OpenAI在AI生成视频领域取得重大突破，发布了全新的生成式人工智能模型“Sora”。该模型

发表于 02-20 11:46 •795次阅读

OpenAI发布文生视频模型Sora，引领AI视频生成新纪元

在人工智能(AI)领域掀起新一轮革命浪潮的，正是OpenAI最新推出的文生视频大模型——Sora。这款被业界广泛赞誉的模型，以其“逼真”和“富有想象力”的

发表于 02-19 11:03 •938次阅读

OpenAI发布首个视频生成模型Sora

OpenAI近日宣布推出其全新的文本到视频生成模型——Sora。这一突破性的技术将视频创作带入了一个全新的纪元，为用户提供了前所未有的创作可能性。

发表于 02-18 10:07 •1053次阅读

搜索历史

Sora之后，视频生成模型的中国牌局

评论