1 AIGC繁花,绽放在精耕的算力土壤之上-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AIGC繁花,绽放在精耕的算力土壤之上

脑极体 来源:脑极体 作者:脑极体 2023-06-13 18:38 次阅读

2023年的春天,称得上一句AI之春。大模型成为技术力量新的爆发点,生成式AI(AIGC)应用风起云涌。

产业界争先恐后训大模型之际,广大用户最大的困惑是——发布了,但就是玩不到啊!

OpenAI有地域限制且不去说它,各种国产大模型也很少有大大方方让大家随便用的,排队等邀请码、群里求测试账号、不开放API、只定向邀请企业客户、上线没几天停止访问……

过去几个月,想用AIGC的人,没少受这些折磨。

当然,这种局面也不能怪大模型的开发运营团队,实在是“心有余而力不足”——AI算力太紧缺了。

想开发大模型的高校和研究机构,抢不到、买不起GPU卡;已经发布的大模型,用户暴涨,导致算力需求的指数级增长和巨大的成本压力,撑不住访问。

就像保尔·芒图在《十八世纪产业革命》中说的那样:“经济演变是比较混乱的,好像撒在大地上的种子那样慢慢生长。无数模糊不明的事实,在细节上几乎是微不足道的,但彼此无限地相互改变着”。

新型AI算力基础设施,就是那个至关重要的细节,直接影响到这次智能产业革命的进程。

在诸多解决方案中,新华三的破题思路,别具特色,一言以蔽之——精耕务实。

首先让我们先从算力本身出发,去看看大模型时代的AI奋锄者,究竟需要什么?又能得到什么?

晨兴理荒秽:算力土壤,为何贫瘠?

AIGC的价值潜力已经十分明晰,让大模型成了各大科技企业争相抢夺的那颗“好苗子”。

陶渊明描写古人耕种要“晨兴理荒秽,带月荷锄归”,先摘除阻碍作物生长的杂草,才能保障后续的收成。

所以,首先要搞清楚一个问题,为什么AI算力显得如此贫瘠?

第一,供给不足。受摩尔定律达到天花板的影响,计算硬件的性能提升越来越有限,AI算力短缺问题长期存在,大模型又进一步加剧了算力焦渴。以176B参数规模的大模型为例,FP16精度下,训练过程内存峰值会达到2800G+,需要35张以上80G显存的GPU才能容纳。很多国内高校,有AI人才、技术积累,想要探索大模型,却买不到、买不起GPU卡,止步于昂贵的AI算力门槛,是非常可惜的。

第二,需求溢出。大模型和生成式AI(AIGC)的出现,微软、谷歌、百度等科技巨头,都在用AI重新构想所有的核心产品。技术的快速溢出,算力基础设施没有来得及跟上,造成了AI算力供需的不匹配。随着AIGC扩展到每个领域,越来越多的智力劳动逐步被AI化、自动化,算力供需的“剪刀差”,还会继续拉大。

第三,效率低下。企业/科研机构对模型开发和AI全域应用的不了解、不高效,会直接导致准备不充足,比如训练数据质量低、AI应用开发经验不足、资源损耗大;研发周期长,比如大模型研发慢、推理效果差,不得不反复迭代试错,也就消耗了更多的时间成本、算力成本。

第四,安全隐患。数据是模型核心的原材料,企业私域数据更是企业的核心资产。企业的大模型如果使用不当,会存在企业私域数据泄露的风险,造成企业即便拥有大量算力也不敢放心使用。

第五,可持续顾虑。“焚薮而田,岂不获得,而明年无兽”,这个道理同样适用于大模型时代。大模型的数据处理量巨大,带动数据中心耗电量快速增加。GPT-3大模型每次训练,碳排放量高达552吨。中国大模型和AIGC的发展,必须建立在绿色节能的算力基础设施上,“东数西算”工程就为各地新建数据中心PUE,提出了严格的要求。

面对AI算力贫瘠的局面,干着急是没有用的,唯有靠劳作者挥锄挖地,为行业理清荒秽,释放算力这一新生产力。

迎着大模型和AIGC的晨光,新华三已经开始培育AI的土壤。

精耕细作:新华三蕴育全栈AI

“算力不足,那就增加供给,堆GPU卡,上服务器,建数据中心集群”——这是常规思路。

新华三的AI蕴育之路没这么简单,在刚刚落幕的2023 NAVIGATE 领航者峰会上,新华三正式发布了“百业灵犀LinSeer”私域大模型和支持AIGC大算力调度的“傲飞算力平台”,可与业务深度结合提升工作效率,持续优化算法和积累公域数据,为客户提供最新知识能力。同时推出了“AIGC开放战略”,既支持“百业灵犀+新华三ICT基础架构”的模式保障数据安全,实现最优配合,同时也支持“客户自选大模型+新华三ICT基础架构”的模式满足多种需求。

新华三如此用心耕耘,这么多的复合能力,究竟能为这一波AI浪潮带来什么?

第一步,培土,让大模型“用有其算”。

解决算力瓶颈,提供充足、普惠且安全的AI算力,支持高校、科研机构和广大企业的充分探索,大模型和AIGC才有茁壮生长的可能性,靠的就是新华三智算解决方案的“算力基础设施”,有三个显著特点:

充足。新华三对基础设施进行优化,让硬件发挥出极致性能。打造了超高性能AI服务器,强势推出H3C UniServer R5500 G6,可以提供8卡H800 OAM训练能力,内部互联400Gb/s极速网络,支撑大模型的高效训练。CX8000高性能分布式并行文件存储,专为AI训练研发,单节点IOPS可达20万+,可以满足AI超大规模数据对存力的需求。Seerfabric软硬一体方案,通过跟AI深度融合,实现流量零丢包,发挥RoCE网络最大性能,大模型训练时间缩短10%,配合主动安全全面防护,为上层平台和应用提供安全、高效的算力支撑。

普惠。模型开发部署的过程中,通过傲飞算力平台共享AI算力,降低算力空闲时间,可以将算力利用率提高至70%以上,智算中心成本大幅下降,提供普惠AI算力。

安全。避免大模型服务使用时造成的数据外泄是企业放心使用大模型的重要前提。新华三智算解决方案通过4大安全体系:传输安全+数据安全+访问安全+安全审计,保障用户使用私域大模型的同时,全方位保障私域数据安全,避免企业私域数据出域。

绿色。新华三的零碳数据中心,将各绿色单元组合起来,降低高算力带来的碳排放问题;新一代液冷解决方案,可以将数据中心的PUE降到1.1及以下,满足国家对数据中心的低碳要求,带来绿色算力。

wKgZomSIRxGAQ7m3AANyCaUpP_k980.jpg

第二步,护苗,让大模型“算有其法”。

从来没有下过地的新手,很容易就糟蹋了种苗,浪费了土地,更重要的是,错过了农时。

大模型作为新技术,很多参与者都是刚开始接触,要抓住宝贵的产业机会,必须有章法。新华三不仅提供“土壤”,还精心“护苗”,为大模型的成长、应用,带来了全链路的平台和服务。

平台层面,统一的数据平台“绿洲”,可有效进行数据全生命周期管理;支持AIGC的大算力调度平台“傲飞”,提供包含智能标注、智能训练、智能调优、智能部署、智能推理的全流程算力智能调度,支持8000节点的算力调度,并发训练时间缩短至50%,断点自动接续无感知训练更稳定,全方面提升大模型训练性能。

服务层面,针对大模型预训练/微调、强化学习、提示学习等特点,新华三根据自身大模型实践经验,封装了推理、微调、训练这三种大模型服务能力,降低大模型使用门槛。

比如基座大模型推理,对推理架构/执行/过程进行优化,并提供配套基础设施,可以为科研工作者构建AI科研环境,满足数据挖掘分析、模式识别等需求。新华三的“传输安全+数据安全+访问安全+安全审计”4大安全体系,可以在私域大模型的训练推理过程中,保障企业数据资产的安全不外流。

私域大模型微调,新华三的10+种基座大模型,结合微调优化,可以助力企业快速打造垂直领域私域大模型,实现小时级生成。

自主大模型训练,提供100多个评估维度与评估指标,如BLEU、ROUGE、METEOR等,有效缩短模型的研发周期。

接下来,孕蕾,让大模型“算有所值”。

大模型和AIGC要通过产业落地,来完成技术的价值转换。要结出更多的应用果实,前提是与百行百业开始连接、探索落地业务场景、孕育应用的花蕾。

这个“传花授粉”的过程,仅靠单一的产业角色是无法完成的。新华三构建了一个开放的产业生态,吸引合作伙伴参与到大模型建设中,共同蕴育全栈AI的无限潜力。

全栈AI的生态繁荣,才有大模型的硕果累累,技术红利的价值落地。

可以看到,正是新华三的精耕细作、用心栽培,大大降低了大模型和AIGC的发育难度。

借助新华三的智算解决方案,越来越多的研究者/企业,可以从算力焦灼中解放出来,抓住宝贵的增长窗口期,培育属于自己的大模型。

由此,可以引出下一个话题:与时代同步,培育大模型“土壤”,为什么是新华三?

实地立身:新华三的根深,大模型的叶茂

大模型和新型智能基础设施,是第四次产业革命的关键,也是数字经济的大势所趋,坦率地说,这个产业趋势是显而易见的。

但是,看到趋势,并不一定能抓住趋势。

大模型和AIGC等新技术的发展与应用,相当于在一片晨雾和产业荒原中摸索。算力基础设施服务商,不可能“以其昏昏,使人昭昭”,自己都没搞懂大模型和AIGC,自然没法赋能研究者和高科技企业。

能构建一套清晰可行的智算解决方案,新华三的优势就是“脚踏实地”。

首先,新华三的技术根深,可以构筑新价值。

深耕ICT领域,承担AI领域科研课题的新华三,技术能力与产品积累非常深厚,布局广泛,能够为全栈AI技术、软硬件和服务,提供持续创新的动能。

此外,新华三的创新务实,可以解决真问题。

大模型时代的技术变化和产业应用日新月异,各行业的落地条件和能力禀赋也有所不同,这就要求基础设施服务商对变化有深刻且快速的洞察,才能确保每个行业/产学研各类用户的需求都得到满足。

作为数字化解决方案领导者,新华三有丰富的服务实体产业经验,可以及时洞察产业客户的需求,进行技术和产品的更新迭代,让每一个创新都能切实解决用户在意的真问题。

智算解决方案中,普惠算力,高效易用的平台,软硬拉通的服务等,都来自产业用户在业务场景中成本敏感、效率优化等实际痛点。

回头对比一下几年前的生活,会发现AI技术已经在切实影响、改变我们的社会经济。大模型的到来,让智能变革继续加速,最终每个人、每个行业乃至每一个国家,都会是人工智能的参与者和受益人。

产业智能革命的土壤,从未像今天一样肥沃。在新华三的基础设施底座上,大模型这颗种子,正在茁壮生长。接下来,就看百行百业如何释放大模型的无限想象,将AIGC的硕果垂满中华。

审核编辑黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    9123

    浏览量

    85324
  • 算力
    +关注

    关注

    1

    文章

    964

    浏览量

    14793
  • AIGC
    +关注

    关注

    1

    文章

    361

    浏览量

    1539
  • 大模型
    +关注

    关注

    2

    文章

    2423

    浏览量

    2640
收藏 人收藏

    评论

    相关推荐

    基础篇:从零开始了解

    即计算能力(Computing Power),狭义上指对数字问题的运算能力,而广义上指对输入信息处理后实现结果输出的一种能力。虽然处理的内容不同,但处理过程的能力都可抽象为。比
    的头像 发表于 11-15 14:22 537次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基础篇:从零开始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    企业AI租赁是什么

    企业AI租赁是指企业通过互联网向专业的提供商租用所需的计算资源,以满足其AI应用的需求。以下是对企业AI
    的头像 发表于 11-14 09:30 488次阅读

    GPU开发平台是什么

    随着AI技术的广泛应用,需求呈现出爆发式增长。AI租赁作为一种新兴的服务模式,正逐渐成为企业获取
    的头像 发表于 10-31 10:31 165次阅读

    OCTC发布&quot;工厂&quot;!力促智中心高效规划建设投运

    创新提出面向未来数据中心的"工厂"模式,核心是以规(划)、建(设)、运(营)一体化的交钥匙工程,实现智中心快速投运、绿色低碳,在当前AIGC
    的头像 发表于 10-11 09:10 515次阅读
    OCTC发布&quot;<b class='flag-5'>算</b><b class='flag-5'>力</b>工厂&quot;!力促智<b class='flag-5'>算</b>中心高效规划建设投运

    中国大会召开,业界首个高质量评估体系发布

    首次完整地构建了人工智能时代高质量的理论体系,并探索性提出业界首个 "五位一体"的高质量评估体系。 发布现场 在当前由大模型和AIGC
    的头像 发表于 09-28 16:50 262次阅读
    中国<b class='flag-5'>算</b><b class='flag-5'>力</b>大会召开,业界首个<b class='flag-5'>算</b><b class='flag-5'>力</b>高质量评估体系发布

    大模型时代的需求

    现在AI已进入大模型时代,各企业都争相部署大模型,但如何保证大模型的,以及相关的稳定性和性能,是一个极为重要的问题,带着这个极为重要的问题,我需要在此书中找到答案。
    发表于 08-20 09:04

    浪潮信息携手天府云数据科技推出了42kW智风冷

    不仅标志着我国智基础设施迈入了全新的高密度、高效能时代,更为人工智能、自动驾驶、生物制药、AIGC(人工智能生成内容)及智能制造等多个前沿领域提供了强有力的支撑。
    的头像 发表于 07-15 16:18 655次阅读

    基础设施的风险与挑战

    编者按网络有一个美好的愿景,就是希望网,能像电力和电网一样:
    的头像 发表于 06-13 08:27 541次阅读
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基础设施的风险与挑战

    力系列基础篇——101:从零开始了解

    相信大家已经感受到,我们正处在一个人工智能时代。如果要问在人工智能时代最重要的是什么?那必须是:
    的头像 发表于 04-24 08:05 1002次阅读
    <b class='flag-5'>算</b>力系列基础篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>101:从零开始了解<b class='flag-5'>算</b><b class='flag-5'>力</b>

    AIGC需求革命,边缘计算将不再“边缘”

    AI瓶颈下边缘计算崛起
    的头像 发表于 04-22 14:51 345次阅读

    能RADXA微服务器试用体验】Radxa Fogwise 1684X Mini 规格

    通过网络可以了解到,能RADXA微服务器的具体规格: 处理器:BM1684X :高达32Tops INT8峰值 内存:16GB L
    发表于 02-28 11:21

    智能规模超通用,大模型对智能提出高要求

    德赢Vwin官网 网报道(文/李弯弯)是设备通过处理数据,实现特定结果输出的计算能力,常用FLOPS作为计量单位。FLOPS是Floating-point Operations Per Second
    的头像 发表于 02-06 00:08 6309次阅读

    大茉莉X16-P,5800M大称王称霸

    Rykj365
    发布于 :2024年01月25日 14:54:52

    网络面临三大挑战

    2024年,以AIGC为代表的人工智能技术将进一步激发需求,网络、智中心、超
    的头像 发表于 01-12 10:39 1093次阅读

    卫星通信序幕拉开,AI浪潮澎湃

    AI浪潮催生要求,基础设施需求持续提升。AIGC带来的超大需求拉动通信基础设施建设及扩容,光模块作为数据传输的基础部件,需求首先迎来
    发表于 01-03 10:22 388次阅读
    卫星通信序幕拉开,AI<b class='flag-5'>算</b><b class='flag-5'>力</b>浪潮澎湃