0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心
发布

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型,站在“向下竞底”和“向上定价”的分岔路口

脑极体 来源: 脑极体 作者: 脑极体 2024-05-21 17:04 次阅读

2024年以来,大模型的价格出现了显著的下降趋势,并且是全球性的。

海外AI巨头,OpenAI和谷歌都在五月的新品发布会上,下调了模型调用价格。

OpenAI的GPT-4o支持免费试用,调用API的价格也比GPT-4-turbo降低了一半,为5 美元/百万tokens。谷歌的当家王牌Gemini大模型系列,Gemini 1.5 Flash 的价格为0.35美元/百万tokens,比GPT-4o 便宜得多。

wKgaomZMY7iAD5qNAABN7OFT82M279.jpg

同样的“价格战”,也在国内开打。

5月13日智谱AI上线了新的价格体系,入门级产品GLM-3 Turbo模型,调用价格从5 元/百万tokens,降至1元/百万tokens。紧随其后的字节跳动,正式发布豆包大模型家族,其中的豆包通用模型Pro 32k模型,定价为0.0008元/千tokens。

当一串代表价格的数字,成为各家发布会上最显眼的一页、最广为传播的信息,其他厂商为了不失去曝光度,不流失现有用户,当然也要有所表示,被动跟进,加入“价格战”。

就在今天,5月21日,阿里云也抛出重磅炸弹,宣布通义千问主力模型Qwen-Long,API输入价格降至0.0005元/千tokens。

大模型价格正在竞底,但究其本质,向下竞底是不具备“向上定价”的条件。将“降价”而非“卖贵”作为核心竞争力的大模型,是走不长远的。

降价的本质,是无法“向上定价”

大模型百万tokens价格一再跳水,OpenAI说是为了“造福世界”,谷歌说是为了扩大AI用户,国产大模型厂商也纷纷表示要让利个人和企业开发者

那为什么ChatGPT、Gemini刚问世的时候,就敢于强势向开发者收钱呢?那时怎么不践行“造福世界”的初心呢?

我们越过那些官方的宣传辞藻,来看几组行业数据,就会发现:降价是一种必然。

第一,模型能力正在趋同,OpenAI/谷歌也没有护城河。

数据显示,自GPT-4发布以来,多个模型在GPT-4水平性能上的巨大收敛,然而并没有明显领先的模型。

就是大家都在向GPT-4看齐,但谁都没有突出优势。能力趋同的前提下,不得不放弃收费,靠降价/免费来争夺用户,保住地盘。

wKgZomZMY7iAb5cvAACWY1Bq360468.jpg

第二,大模型的边际收益正在持续走低。

Gary Marcus 博士在“Evidence that LLMs are reaching a point of diminishing returns — and what that might mean”《LLMs正达到收益递减的证据——及其可能意味着什么》一文中提到,从GPT-2到GPT-4甚至GPT-4 Turbo的性能变化,已经出现了性能递减的迹象。

在收益递减的背景下,意味着处理相同的任务,开发者的实际成本是在上升的。在AI创新商业化前景还不明朗的市场环境下,为了保住现有用户,大模型厂商必须给出有吸引力的对策。包括提供更小的模型,比如谷歌推出的Gemini 1.5 Flash,通过“蒸馏”实现了与Gemini 1.5 Pro性能接近、成本更低。另一个手段就是直接降价。

综上,大模型降价的本质,是因同质化竞争+投入产出比降低,而无法卖贵、不敢卖贵的必然选择。

向下竞底的前途,是没有前途

论迹不论心,只要大模型厂商的降价行动,能够切实惠及企业和开发者,当然是受市场欢迎的。

问题就在这里,企业和开发者能从中获得多大收益呢?

有人说,降低成本能推动大模型的“价值创造”,是错误的因果归因。大模型的“价值创造”,是以大模型本身为锚点,而非价格。

最直接的例子,ChatGPT问世即付费,当时很多从业者都很开心,认为市场终于重返工程师主导的文化,技术为王,代码竞争,“没有那些精心设计的流量游戏或者运营技巧,没人会动砍一刀送1000个token的心思”。说明明码标价、为好东西付费的模式,才是开发者心中的良性商业模式。

差的商业模式是什么?是模型能力不行,企业和个人开发者投入了大量时间、精力,结果无法建立竞争力,无法从应用创新中获得商业回报。

有一个SaaS开发者直言:“我们折腾了一年(做基于LLM的产品),也有不少用户提出了付费需求,但我们感觉做不到SLA,全部婉拒了。”所谓SLA,是指一定开销下,服务商与用户之间的一种协定,来保障服务的性能和可靠性。

开发者和ISV服务商,如果被低价吸引,但底座模型的能力却不行,不能解决用户的问题,赚不到钱,还投入了大量研发资金和工程团队,那最后实际的沉没成本,可比调用省下的仨瓜俩枣大多了。

正如微软所强调的那样,大模型“仍将是解决众多复杂任务的黄金标准”。所以,良性的商业模式,是大模型能力持续提升,商业化版本上同时兼顾普惠。

以下图来说,逐步进入到低价高质的绿色区域,也是“最具吸引力象限”。

wKgZomZMY7mAdwgGAABP_9NdIFo423.jpg

从图中不难看到,GPT-4o是目前质量最高、价格相对降低的位置。

而放眼国内的厂商,模型能力如果达不到OpenAI的水平,一味拼价格并不是一个好策略。

可以推演一下,打价格战,会发生三种情况:

最乐观、最好的结果,是大模型厂商靠低价吸引用户,用户数量和使用量的规模化增加,能够低效甚至超过降价的亏损,实现盈利。而即使是最好的情况,大模型企业也会在短期内,利润受到挤压,财务表现可能会受到来自资本市场或投资人的压力。

至少目前来看,可能性很小。降价或许能够吸引不少用户尝鲜、试用,但最终模型能力才是沉淀下来的主因,留存率并不一定理想。

用户增长不确定,大模型投资成本却在节节攀升,意味着大模型厂商的风险敞口不断扩大,由此带来打价格战的一种最坏情况:国内大模型厂商被迫跟进价格战,不断压缩本就不大的盈利空间。

Anthropic的CEO曾向媒体透露,目前正在训练的模型成本已接近10亿美元,到2025年和2026年,将飙升至50亿或100亿美元。

这意味着,一旦大模型企业为了“价格战”,现金流会持续承压,缺乏充足的资金投入到招募AI人才、升级基础设施、部署数据中心、升级网络等投资中去,模型进化与迭代也会受到影响,从而让国产基座模型进入发展瓶颈期,与世界一流水平的差距越拉越大。

需要注意的是,社会各界用户早已在各个模型厂商的宣传布道中,拔高了对大模型的期望值。一味推广低质低价的使用体验,让人们对AI失去信心,觉得大模型不够万能、啥都干不好,对这一轮大模型主导的AI热潮,将是极大的负面影响。

当然,也不必过于焦虑。最坏情况和最好情况一样,发生的概率不大。现实中最有可能的,是大模型行业在最佳和最坏情况之间震荡。

一部分模型性能领先、商业模式向好、客情关系良好、现金流相对充裕的厂商,能够在跟进降价的同时,保持对底层创新的持续投资,但长期可以摊薄研发成本,靠规模增长来实现收入上涨。而注定也有一部分企业会在价格战与现金流压力下,被震荡出局。

一个AI公司创始人就表示:其实挺期待AGI到来的,虽然能秒灭我们这种小团队,但至少大家都解脱了。

说到底,一味打价格战,AI巨头有没有前途,不一定,但创新型小公司,一定危险。

降价的前提,是有“向上定价”的实力

有必要叠个甲,我们不反对大模型降价,鼓励大模型厂商为个人和企业开发者减轻负担。

只不过,当舆论各方都关注“低价”的时候,当一场大模型发布会的亮点是百万token价格小数点后有几位,当大模型的商业模式从技术为王,变成“羊毛出在猪身上”、把用户当成流量商品……有必要再重申一下:新技术,是大模型产业的“震中”。

高科技领域,新技术层出不穷。企业要在一波又一波技术浪潮中,同时扮演“颠覆者”和“防御者”。拿大模型来说,厂商必须有至少两个梯队来参与竞争。

一个梯队负责进攻,孵化全新的模型和产品,追逐技术上的颠覆式创新;另一个梯队负责防御,通过低价、生态等守住现有业务和用户,抵御对手的袭击。

而当前,大模型厂商的更优先事务,不是“向下降价”,而是塑造“向上定价”的可能性。

将自家大模型矩阵中的某一些特定模型,做一个极致低价,是很容易操作和吸引眼球的。能把大模型卖出去,向上定价,向价格段的上游迁移,才是AI实力的体现,才能让企业保有更长的生命力。

举个例子,GPT-4o虽然免费,但免费版本只提供有限的次数,而天花板级别的语音交互能力又带来了极强的付费潜力。此外,GPT-5也早就被曝已经做出来了,只是OpenAI没决定好何时推向市场。谷歌也采用类似的策略,更低价格、更低成本的模型,与高性能的付费模型,以及庞大的软硬件生态来让AI落地,共同构成商业版图。

当前国产大模型亟待完成的,是能力突破的技术进击

从我们了解的大模型使用情况来看,企业和个人开发者最在意的商业化问题,仍然要靠模型本身的进化来解决,比如说:

目前阶段,很多任务场景,大模型连兜底的效果都还没有搞定,距离SLA级别的收费标准差距很大,无法达到商用;

精调虽然可以满足一部分场景,但难以泛化。有些场景的大模型精调效果,还不如用传统的小模型。这不是大模型“够不够便宜”的问题,是“为什么要用”的问题;

最终用户愿意付费的AI应用,必须真正做到降本增效,学习成本高一点都不会用。这就需要服务商和开发者详细地拆解任务流程,不忽视任何微小的业务细节,量身定制,降低整个开发过程的周期和难度,或许比降价更有吸引力。

其实,大模型质价比的“最具吸引力象限”,已经说明了,质量做高的前提下,实现价格更优,才是大模型商业化的可持续之路。

向下竞底只是权宜之计,能够“向上定价”的大模型才有未来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Gemini
    +关注

    关注

    0

    文章

    48

    浏览量

    7533
  • AI
    AI
    +关注

    关注

    87

    文章

    28462

    浏览量

    265734
  • OpenAI
    +关注

    关注

    9

    文章

    961

    浏览量

    6200
  • ChatGPT
    +关注

    关注

    28

    文章

    1513

    浏览量

    6489
  • 大模型
    +关注

    关注

    2

    文章

    2053

    浏览量

    1781
收藏 人收藏

    评论

    相关推荐

    PGA280噪很大是为什么?

    我用PGA280+AD7765进行信号采集。 发现只有AD7765输入端短接,噪 很低。但是PGA280+AD7765一起测试,输入端短接的时候噪 很高,请问是为什么啊。 下面是原理图。
    发表于08-09 07:27

    示波器如何测量噪?示波器测量噪的步骤

    噪,也称为背景噪声,是指在没有输入信号时示波器屏幕上显示的随机波动。测量 噪对于评估示波器的性能和确定测量系统的噪声水平非常重要。
    的头像 发表于05-30 16:38 688次阅读

    具有向下/向上模式控制的同步向上/向下计数器CD54HC190 CD74HC190 CD54HC191 CD74HC191 CD54HCT191 CD74HCT191数据表

    德赢Vwin官网 网站提供《具有 向下/ 向上模式控制的同步 向上/ 向下计数器CD54HC190 CD74HC190 CD54HC191 CD74HC191 CD54HCT191 CD74HCT19
    发表于05-20 10:52 0次下载
    具有<b class='flag-5'>向下</b>/<b class='flag-5'>向上</b>模式控制的同步<b class='flag-5'>向上</b>/<b class='flag-5'>向下</b>计数器CD54HC190 CD74HC190 CD54HC191 CD74HC191 CD54HCT191 CD74HCT191数据表

    具有向下/向上模式控制的同步向上/向下计数器数据表

    德赢Vwin官网 网站提供《具有 向下/ 向上模式控制的同步 向上/ 向下计数器数据表.pdf》资料免费下载
    发表于05-14 09:41 0次下载
    具有<b class='flag-5'>向下</b>/<b class='flag-5'>向上</b>模式控制的同步<b class='flag-5'>向上</b>/<b class='flag-5'>向下</b>计数器数据表

    雷神发布两款电显示器:银翼双模OLED与新款银翼

    近日,雷神公司宣布推出两款全新显示器——银翼双模OLED电 显示器及新款银翼电 显示器, 定价分别为人民币9,999元和1,699元。
    的头像 发表于05-10 14:56 417次阅读

    Vim跳转技巧

    相对跳转用于在当前行的基础上 向上向下跳转一定的行数。可以在命令模式下输入:num命令,其中num可以是正数、负数。例如,要 向上跳转5行,可以在命令模式下输入:+5,然后按下回车键即可。同样,要
    的头像 发表于01-18 16:30 873次阅读

    请问ADC芯片如何降低噪?

    为什么经过ADC采样后,我用matlab仿真后, 噪在-100左右,而ADC芯片资料上都在-120左右,请问如何降低ADC的 噪?
    发表于12-12 06:56

    AD9694噪很高是什么原因造成的?

    为了更好的摸底使用AD9694,根据ad9694-500ebz制作了一个小DEMO板,但是自己做的这个板子数据采集回来 噪在-98dbc左右(不加模拟时钟,空采),同样情况下我用ADI
    发表于12-04 06:11

    道路通行效率提升解决方案,助力太仓路口数智升级

    · 路畅行安,行稳致远! 路口,是道路交汇处,也是科技交叉地。 一个城市的文明, 站在 路口就能一目了然。 路口的安全、文明、有序, 是每座城日夜闪耀的名片。 在这里, 当科技密度与未来
    的头像 发表于11-30 16:55 353次阅读
    道路通行效率提升解决方案,助力太仓<b class='flag-5'>路口</b>数智升级

    一般汽车应用中的噪主要产生源是什么?降低这些噪有啥方法?

    用于汽车音频系统设计,经常会出现噪 太大,产生人耳在安静的环境下就能感受到的杂声,能不能以反倾销 1401为例帮分析下我们一般汽车应用中这种噪 主要产生源?降低这些噪 有啥一般有效的方法?例如结合吉玛斯图软件算法的一些建议啥的。
    发表于11-29 07:51

    ad8376将噪抬高如何解决?

    ad8376将 噪抬高!如何解决!
    发表于11-27 08:00

    顺网灵悉携手AI电官晓,启动“电国庆答题季”点燃电热潮

    近日,顺网科技(300113.SZ)开放了一款名为“顺网灵悉SAGA”AI应用的限量邀测,迅速引起行业和用户的广泛关注。9月26日,AI数字人晓 正式以电 官的身份上线顺网灵悉平台,与电 爱好者们
    的头像 发表于09-27 11:36 745次阅读

    基于单片机的十字路口交通灯控制器设计

    单片机的十字 路口交通灯控制器的设计
    发表于09-20 08:25

    磁元件企业如何应对新能源“未有之大变局”?

      向左还是向右? 站在新能源产业的十字 路口,磁元件企业未来的发展方向究竟在哪?
    的头像 发表于09-13 11:11 641次阅读

    低功耗系列芯片STM32L15x通用定时器TIM介绍

    更新指预装载寄存器中的数值装载入影子寄存器 根据是否使能了自动装载功能(ARPE位)更新发生在 立即 每个更新事件(UEV) 更新事件的产生 当计数器 向上向下溢出 由软件置位TIMx_EGR寄存器
    发表于09-12 07:55