1 中国AI长卷(二):框架立基-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

中国AI长卷(二):框架立基

脑极体 来源:脑极体 作者:脑极体 2024-07-24 12:27 次阅读

wKgZomaggqGAXl82AAn1I2EY3Dw007.jpg

2021年正值科技摩擦之际,我采访到一位工业机械公司的技术负责人,向他问到:“制造领域有没有一些“卡脖子”的情况?”

他提到,“工业智能制造的核心要素,可以归纳为“三软三硬”。三软主要是指大数据、人工智能和工业软件,三硬主要是指核心装备、制造工具和材料。卡脖子这个问题,在各行各业各个领域都普遍存在”。

“反倒是深度学习框架,现在的情况还好,没有卡脖子。TensorFlow是开源框架,虽然也是国外的,但目前还没有封闭,不过也不排除它后期还会封闭。这也是为什么我们公司选择国产深度学习框架,一是使用门槛更低,二是防患于未然。客观地说,国产框架离TensorFlow还有一定的差距,但这个差距在肉眼可见地缩小。”

从传统的深度学习模型时代,到方兴未艾的大模型时代,都离不开AI框架的平台化支撑,其重要性不亚于芯片但和芯片不同的是,与大模型发展相适配的国产AI框架,基本实现了自保。

这是基础技术领域一个非常大的进步,也是中国为什么没有错过这一轮大模型AI热潮的原因之一。

2021-2024的短短数年,从机器学习到大模型,新旧技术“沧海桑田”,科技行业风云变幻,但AI框架之于产业的重要性,却从未改变。

如果说,从信息化、数字化到智能化的漫长进程,就像鱼类走向陆地的进化变迁,那么AI框架,就处于算力层与应用层的中间地带,犹如海洋与陆地之间的那道“海岸”,支撑着各行各业与智能浪潮的交融。

那么,究竟什么是大模型所需要的AI框架?AI框架是如何满足产业链需求的?国产AI框架与海外框架的差距或差异又在哪里?

本文就让我们深入AI产业链的中枢地带,沿着AI框架的“海岸”一探究竟。

wKgZomaggqOAQjwZAAJe04YhDfQ616.jpg

鱼要经由海岸,进化成两栖动物,适应陆地,才能具备在新环境的生存能力,拓宽种群的边界。同理,AI模型从训练到推理的全流程落地,开发者也需要一种基础设施作为助力,这就是AI框架

一个底层AI框架,至少具备几个特质:

1.通用性。AI框架作为基础设施,广泛覆盖各类模型,同时简化了AI开发过程,对多种算法进行模块化封装,让开发者不需要“重复造轮子”,可以快速搭建AI模型。比如对多元异构计算硬件的适配兼容,支持大分发多类型任务调度的分布式能力,核心算子库等,是开发各类算法模型都需要的,都要在框架层去解决。

2.全流程。AI框架集成了模型开发所需要的工具,为开发人员提供全流程的开发环境。具体来说,训练、调优、测试和部署的一整个标准化流程中,所需要的相应组件,都能够在一个平台获得,进行全流程的项目提升,高效满足各类场景的定制化建构需求。

3.生态化。从产业链全局来看,AI框架下接芯片,上承应用,是芯片厂商、应用开发者、软件服务商等多个行业主体都汇聚的中枢地带,形成了非常关键的AI生态系统。拥有一个集聚产业链的自研AI框架,就如同拥有了一条生态丰富、自主可靠的海岸线,是一企乃至一国守住AI疆域的关键。

因此,当ChatGPT代表的大模型爆火之后,焦虑无处不在,“我们没有大语言模型怎么办?”“高端算力卡被禁了怎么办?”“基础软件卡脖子怎么办?”但同样至关重要的底层AI框架,却没有出现“什么时候才能有自己的框架”的焦虑。

试想一下,如果国计民生重点行业的大模型,建立在海外企业的框架上,开源许可证的断供风险、数据安全风险可想而知。幸好,国产AI框架,早就做好了准备。

目前,国际有两大主流AI框架TensorFlow(谷歌)、PyTorch(Meta),而中国自研的AI框架,按照其厂商可以分为三类:

一是以百度为代表的AI头部科技企业推出的,如飞桨paddlepaddle,基于先进模型和产业生态积累,布局AI框架,建立智能业务的体系化优势。

中国软件产业40年功勋人物、“国家卓越工程师”称号、百度CTO的王海峰,曾回忆文心一言的开发过程:2023年要在算力需求爆发、供应紧缺的条件下,快速跟上ChatGPT的趋势,正是基于百度的深度学习框架飞桨paddlepaddle,下游跟主流的芯片厂商做了适配,任何好的算力,我们都能用得起来,很快完成了大模型训练。

二是以华为云为代表的AI云服务厂商推出的,如昇思mindspore,通过AI框架,在云基础设施和行业云用户之间搭建起桥梁,提供完整的云端大模型服务。

去年大模型的百花齐放,就是很多ToB企业和软件公司,利用华为云上的AI框架昇思mindspore,以及盘古大模型、昇腾AI云服务等,支持国内各类开发者、服务商等结合行业应用场景,做出原创模型,支撑了国内多个领域训练并首发大模型,加速了大模型走向产业化的进程。

三是垂类AI服务商、研究者推出的深度学习框架,具备某些独特的技术特性或应用场景,比如旷视科技(Megvii)在计算机视觉领域的专长,使其MegEngine框架在图像处理任务上表现突出;清华大学计算机系推出的Jittor,特别适合于研究和教育领域,便于快速实验和算法原型开发;腾讯优图的NCNN框架专为移动端和嵌入式设备优化,适合资源受限的环境或边缘计算;一流科技的Oneflow,也是业内完整的深度学习框架类产品

不同于英伟达基于芯片构建的软件生态体系,国产AI芯片厂商受限于产品规模,自研软件配套的应用范围比较有限,有待发育,就不详述了。

综上,面对大模型掀起的这一轮AI浪潮,海外框架平台生态蓬勃,起到了一个“海阔凭鱼跃”的作用。国产AI框架也没有缺席,为各行各业探索大模型,奠定了基础,汇聚了力量。

wKgZomaggqeAHqWzAAIp3MtAFP0636.jpg

AI框架之所以没有缺席,是中国产学界人士“板凳甘坐十年冷”,一点一滴地构筑而成的。这个过程,遵循了技术领域的“双漏斗”规律,是一个从扩散到收敛,从收敛到扩散的过程,其间经由开发者不断选择和淘汰,最终演化成了今日格局。

第一阶段:早期时期的扩散漏斗(Diversity Phase)

新技术出现的初期,由于技术尚未成熟,新的想法和产品层出不穷,市场和用户对于哪种技术会最终胜出存在很大的不确定性,因此会出现多样化的技术流派。

PC操作系统、移动互联网OS都经历过百花齐放、多家争鸣的阶段,AI框架也不例外。深度学习大行其道的时候,数据、算法和算力激增,工程复杂度提高,开发者非常需要减少“重复造轮子”,直接调用某些模型或工具,这时候各大厂商都开始将自研算法和工具封装为软件框架,供开发者使用,涌现出了Theano、Caffe(伯克利大学)、Torch、DistBelief(谷歌,TensorFlow前身)等多款框架。

同一时期,国内还没有互联网企业或科技公司做框架,部分高校在学术科研角度做了一些零散的工作。构建完整的深度学习框架,是2013年百度开始。因为很早就关注到深度学习技术,百度更早遇到了深度学习应用上的一些挑战,比如所有的算法从头写,开发效率低,经常出错;每个深度学习开发团队写的程序差异很大,模块无法复用,兼容性也不高,急需一个统一框架。于是2013年,百度开始在框架上投入。据了解,当时百度内部也是框架百花齐放,开发了多个深度学习框架,解决不同业务的不同问题。

值得注意的是,早在此时起,国内外的框架就已经显露出差异化的特质。以Caffe、Torch为代表的海外框架,更偏向于学术、工程师使用;以百度为代表的国內框架,从产业土壤上生长出来,一开始就很注重实用性、功能性、分布式训练、硬件优化等产业特性。

第二阶段:竞争时期的收敛漏斗(Consolidation Phase)

随着时间的推移,更主要是AI巨头如谷歌、Facebook、百度的优势框架相继开源,其他框架逐渐被淘汰、合并,多样化的框架格局开始向几家主导“收敛”。

2015年开始,谷歌大脑宣布TensorFlow开源,2016年百度飞桨宣布开源,2017年Meta人工智能研究院(FAIR)宣布PyTorch开源。开发者逐渐集中到几个主导者生态中。

曾经的热点框架如Theano、CNTK(微软)、Keras、Caffe2都相继停止维护,或被主流框架收编,百度内部也开始将多款框架收敛为paddlepaddle,并正式对外开源。

这一阶段,海内外并不“同此凉热”。

一方面,PyTorch凭借极强的学术灵活性、易用性,迅速崛起,已经发布很快成为爆款,成为围剿谷歌“框架霸权”(TensorFlow不兼容其他开发框架)的生力军。

另一方面,当时国内很多企业的AI意识还没有觉醒,以计算机视觉为代表的深度学习技术,很难满足产业落地的精度需求。因此,当海外AI巨头围绕框架“火星四溅”的时候,中国的深度学习框架依然是“冷板凳”,企业中只有百度一家在坚持做。

如果说,当时海外框架是因竞争而主动收敛,那国内框架就是因为遇冷而被动孤守。

第三阶段:摩擦时期的再生漏斗(Renewal Phase)

当主导框架不再适应时代需求,就会出现新的创新浪潮,导致技术的多样性再次增加。“TensorFlow、PyTorch两分天下”的局面被改变,国产AI框架的创新再生大爆发,是在2019-2020左右,中美科技摩擦逐渐增多,需求侧和供给侧都发生了诸多变化。

从供给侧来看,海外框架爆出安全漏洞,而AI又涉及国计民生核心领域,供应链风险不得不重点考虑,自主可靠的国产框架成为必需,供给增多。这一阶段,国产AI框架进入加速发展期,除了飞桨PaddlePaddle,华为、阿里巴巴、腾讯、旷视科技等产业界,以及清华萨血等学术界,也都相继推出了自研框架,丰富了国产框架的活力。

从需求侧来看,随着AI渗透率提升,中国各行各业的开发者需要中文框架,更贴合中国市场的工具与数据集,更符合中国开发者需求的社区生态,更能满足中国产业需求的AI平台。

有开发者曾提到过,偏底层的TensorFlow,没有为开发者考虑到大量细碎问题;习惯了邮件沟通的海外平台社区,无法满足中文开发者实时交流、社群互动的本土化开发需求;需求分散、场景多样的国内中小企业,很少有技术人员,TensorFlow、PyTorch纯开源框架不能提供成熟低门槛的解决方案,这种模式无法支撑AI广泛落地。

当前阶段:大模型时期的再收敛漏斗

AI框架从深度学习到大模型阶段,从扩散到收敛再到扩散,技术革新与格局嬗变的背后,一条主线从未改变,那就是从学术到产业化,变得越来越易用、实用。对开发者和产业更友好,更具应用优势的框架,生态的吸引力更强,框架的生命力也就更长,最终从群雄逐鹿的赛场中厮杀出来,成为主导。

目前,源于中国产业实践的国产AI框架,也逐步收敛到更懂产业应用场景、更具技术先进性和生态规模优势的飞桨与昇思。

具体表现在,飞桨和文心一言,昇思与盘古大模型,与产业结合的广度和深度,已经超越了其他国产框架的生态规模。

同时,形成了全链路、低门槛的大模型服务能力,提供从算力、模型到应用、商业层的多元多层支持,凝聚更加广泛的开发者。

产业链角色的多样性与开放性也格外显著,与模厂、硬件厂商、应用开发者、软件企业、ISV服务商等行业伙伴,都建立起了较好的相互赋能关系,构建起智能服务的产品结构体系。

进入大模型时代的新阶段,AI基础设施的重要性,也被拔高到了前所未有的高度。

正如基础通用模型不可能人人都做,如果企业和科研机构无差别入场做基础模型,会造成算力人力的极大浪费,也会让使用者的精力分散在各种模型的试错上,无法快速凝聚到技术更强的模型上,框架也是类似的逻辑。

一个底层框架的技术优势、工具完整度、生态规模,需要长期积累、聚沙成塔,而基础软件又格外需要生态的发展和汇集。逐步收敛到飞桨、昇思等更具潜力和繁荣的产业化框架上,构筑AI战略底座,将是大势所趋。

如前所说,AI框架是技术浪潮与产业大陆的连接地带,只有在一次次潮起潮落后,仍然坚守下来的平台,才能成为中国AI产业链的坚定守护者。

wKgaomaggqqAGdNkAAJlqwD8CPM633.jpg

经由时间和市场的洗练,国产框架与海外框架的特性差异,也变得越来越清晰。而这,可以作为一个侧影,让我们看到中国AI的差异化亮点。

还记得ChatGPT横空出世之后,大家总能听到这样的言论,“中美AI差距有十年”“OpenAI一心底层创新,中国AI还没长大就得出去赚钱”“百模大战是同质化的浪费资源”……

从AI框架可以看到,更强的产业化能力,本就是中国AI的底色,也是亮色。

基础能力上,以飞桨、昇思为代表的AI框架,在产业AI方面的实践更多、积累最早,理解也最为深刻,因此可以很好地支持AI模型开发与部署,让产业迅速、更大规模应用这些新技术。

举个例子,面向科研、强调学术研究灵活性的PyTorch,对产业应用的推理部署需求,做得是比较薄弱的,而国产框架为大模型到产业铺设了一条高效通道。

飞桨很快上线了对大模型开发的功能支持,提供了一系列模型封装能力,加速大模型的产业化落地。昇思MindSpore提供了一整套高效、易用的大模型使能套件,形成了端到端的使能大模型开发能力。

通过AI框架,开发者与行业少走弯路,不重复造轮子,快速高效地把大模型用起来,这是中国的基座通用大模型快速跟进、行业大模型爆发的前提。

产品体系上,源于产业需求的国产AI框架,能力布局更加全面、细致,可以更好地满足产业落地AI大模型的实际需求。

纯开源的海外模型,常常会强调自己的技术有多厉害,有多强,对开发者就主打一个“野蛮生长”,这与其数字化水平、数字人才等都有直接关系。

然而中国企业的小、分散、需求长尾,决定了AI框架作为产业基础设施,是不能轻易“放养”的。

比如硬件适配,海外以英伟达为主导的硬件市场,也不像中国面临多元异构算力问题的巨大挑战。作为国产AI框架,必须进行软硬件结合的深度融合优化,做特别多的工程开发工作,来降低开发者的硬件适配成本。

再比如模型库。模型库不是深度学习框架核心的组成部分,底层框架厂商投入精力去打造更细分的模型,看起来好像是把精力分散到了外围一些无关紧要的东西上,而不是底层核心技术。但从产业应用的角度来看,中国存在大量企业,没有专门的研发人员能够使用核心框架,从头完成一个模型的自研工作,AI也没有办法落在产业需求中。

利用框架平台的AI解决方案、模型和开发套件,进行微调改写,就能得到一个贴合场景的定制化模型,这更符合中国的产业实际。

源于产业、面向产业、托举产业,以国产AI框架为基,如同隐藏在漫长时光深处的“海岸”,在技术潮水涌动之际,才能看出战略价值,支撑住中国产学政各界对大模型技术的期待。

处于产业链中枢地带的AI框架,以稳定的底座、全产业链的贯通、较低的门槛,吸引了大量行业和从业者在这里栖身,适应并探索AI新技术;

在这里“进化”,从非数字原生组织,生长出数字化、智能化的能力;

在这里“融合”,多种产业角色在这里交流、融合、创新,汇聚起丰富的AI生态。

最终,经由AI框架的“海岸”,开发者和行业一步步向AI时代迁徙,开启产业智能进化的新篇章。

wKgaomaggqyAKLodAAG8LSJq7Dc698.jpg

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    30728

    浏览量

    268886
  • 人工智能
    +关注

    关注

    1791

    文章

    47183

    浏览量

    238245
收藏 人收藏

    评论

    相关推荐

    华为推动中国人工智能框架生态高速发展

    近日,昇思人工智能框架峰会在北京中关村国际创新中心召开,本次大会以“创新源动力,框架新选择”为主题,由昇思MindSpore开源社区、中国人工智能学会及AITISA联合主办,旨在汇聚AI
    的头像 发表于 12-17 11:06 212次阅读

    大语言模型开发框架是什么

    大语言模型开发框架是指用于训练、推理和部署大型语言模型的软件工具和库。下面,AI部落小编为您介绍大语言模型开发框架
    的头像 发表于 12-06 10:28 115次阅读

    中国科大实现耦合高度可调的维硅量子点阵列

    图(左)硅量子点维阵列器件核心区的电子显微镜伪色图;(右)任意调控量子点间最近邻和次近邻耦合,从而构造出不同的耦合结构。 我校郭光灿院士团队在硅量子点阵列的维扩展及其耦合可调性
    的头像 发表于 12-03 06:24 126次阅读
    <b class='flag-5'>中国</b>科大实现耦合高度可调的<b class='flag-5'>二</b>维硅<b class='flag-5'>基</b>量子点阵列

    AI for Science:人工智能驱动科学创新》第AI for Science的技术支撑学习心得

    非常高兴本周末收到一本新书,也非常感谢平台提供阅读机会。 这是一本挺好的书,包装精美,内容详实,干活满满。 关于《AI for Science:人工智能驱动科学创新》第章“AI
    发表于 10-14 09:16

    RISC-V如何支持不同的AI和机器学习框架和库?

    RISC-V如何支持不同的AI和机器学习框架和库?还请坛友们多多指教一下。
    发表于 10-10 22:24

    中国AI长卷(三):算法生根

    只要根深蒂固,任尔东西南北风
    的头像 发表于 08-06 09:27 2679次阅读
    <b class='flag-5'>中国</b><b class='flag-5'>AI</b><b class='flag-5'>长卷</b>(三):算法生根

    中国AI长卷(一):大国重算

    AI为沃土,智算是长城
    的头像 发表于 07-23 10:51 1290次阅读
    <b class='flag-5'>中国</b><b class='flag-5'>AI</b><b class='flag-5'>长卷</b>(一):大国重算

    ai大模型和ai框架的关系是什么

    AI大模型和AI框架是人工智能领域中两个重要的概念,它们之间的关系密切且复杂。 AI大模型的定义和特点 AI大模型是指具有大量参数的深度学习
    的头像 发表于 07-16 10:07 4w次阅读

    AI大模型与AI框架的关系

    在探讨AI大模型与AI框架的关系时,我们首先需要明确两者的基本概念及其在人工智能领域中的角色。AI大模型通常指的是具有极大规模、高度复杂性和强大能力的人工智能系统,它们能够处理复杂的任
    的头像 发表于 07-15 11:42 1060次阅读

    CubeIDE生成的代码框架会卡在MX_X_CUBE_AI_Process()函数中是怎么回事?

    当我将网络模型部署到STM32F407VGT6中时,CubeIDE生成的代码框架会卡在MX_X_CUBE_AI_Process()函数中是怎么回事?CUbeAI库的版本是9.0。期待您的回复,谢谢
    发表于 05-30 06:11

    讯精密荣登《财富》中国ESG影响力榜单

    《财富》中国ESG影响力榜揭晓,讯精密荣登榜单
    的头像 发表于 05-14 14:35 392次阅读
    <b class='flag-5'>立</b>讯精密荣登《财富》<b class='flag-5'>中国</b>ESG影响力榜单

    奥托夫与航盛电子在北京签订战略合作框架协议、联合研发协议

    2024年4月26日,奥托中国与深圳航盛电子在北京签订战略合作框架协议、联合研发协议,标志着奥托夫在自动驾驶领域迈出了坚实的一步。
    的头像 发表于 04-28 11:03 968次阅读
    奥托<b class='flag-5'>立</b>夫与航盛电子在北京签订战略合作<b class='flag-5'>框架</b>协议、联合研发协议

    旷视科技与上海家化正式签署《AI科技创新合作框架协议》

    3月18日,在2024年上海家化“致美·致时代”年度发布会上,上海家化联合股份有限公司与北京旷视科技有限公司正式签署《AI科技创新合作框架协议》,双方将在AI赋能美业领域进一步展开深度合作,以
    的头像 发表于 03-20 10:21 578次阅读

    与Dynamis签署供应框架协议,推动巴西绿色能源转型

    2024年ATP智利公开赛期间,隆与巴西太阳能产品分销商Dynamis签订160MW供应框架协议,共同推动巴西绿色能源转型。
    的头像 发表于 03-15 11:22 385次阅读

    AI推理框架软件ONNX Runtime正式支持龙架构

    近日,知名AI推理框架开源社区ONNX Runtime正式发布支持龙架构的版本1.17.0。
    的头像 发表于 03-12 12:23 570次阅读
    <b class='flag-5'>AI</b>推理<b class='flag-5'>框架</b>软件ONNX Runtime正式支持龙架构