0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心
发布

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

规模化的AI应用落地,英特尔AI架构的优势可以从七个方面说起

锂电联盟会长 来源:陈年丽 2019-08-20 09:52 次阅读

昨天,各行各业正与人工智能AI)加速融合,通过智能化创新来寻求业务转型升级。与为数不多的顶级 AI 研发公司相比,大多数传统行业或企业有着更丰富的 AI 应用场景,推动着规模化的 AI 应用落地,其 AI 应用更具有实践意义。然而,在智能化技术架构和平台选择上,它们又往往面临着「拿着钉子到处找锤子」的尴尬局面。

尽管有人津津乐道于承载 AI 应用的一些专用架构平台,但实际情况是:仅采用专用加速芯片或优化单一框架,已经无法满足运行不同工作负载和适应不同应用场景所需。这是因为,AI 的应用需求是多种多样的,不同的应用也决定了从数据中心到边缘再到设备所需的硬件能力都会有所差别。而且,解决企业 AI 规模化落地,需要充分利用以数据为中心的基础架构,考虑芯片处理器、核心算法和软件工具等平台解决方案的选择。

无论是算法工程师、AI开发者还是数据科学家,他们在选择 AI 技术架构和平台时会有多方面的考量。一个共识是,基于既有的 IT 基础设施,统一大数据和人工智能平台,可以更加高效释放数据价值,实现 AI 业务目标。人们正在发现,更加通用的英特尔架构具有重要的先发优势。由英特尔计算架构和至强平台的助力,人工智能技术可以帮助企业从既有的平台起步,加速「破局」AI 产业实践。

英特尔 AI 架构带来的优势可以从七个方面说起,其中包括性能、数据预处理、可扩展性、内存、模型部署、大数据分析,以及跨平台部署应用。

第一重助力:性能

今天,CPU性能优化已有数量级的提升,VNNI 和框架优化等大幅提升了 CPU 架构运行深度学习推理的速度。

很多人可能都认为 AI 这种新出现的技术,或者说应用负载,也应该用新的架构来支撑,其实不然。实际上随着 CPU 性能的数量级提升,以及在软硬件层面针对 AI 应用的不断优化,CPU 平台也能很好地承载 AI 应用。现在 CPU 能兼容几乎所有的 AI 主流技术,深度学习的应用任务,特别是推理,完全可以用 CPU 来搞定。而且 CPU 还有一个特定的优势,就是当用户混合使用机器学习和深度学习方法时,CPU 更适合承载这样的任务。

不断更新换代的英特尔 CPU 平台,已经在众多 AI 应用,特别是推理上提供了强大的算力。以第二代英特尔至强可扩展处理器为例,它集成了加速人工智能深度学习推理的英特尔深度学习加速(英特尔 DL Boost)技术,将人工智能性能提升到一个全新的水平,可加速数据中心、企业和智能边缘计算环境中的人工智能推理工作负载。以常见的 Caffe Resnet-50 模型为例来看性能变化,第二代英特尔至强铂金 8280 处理器借助英特尔 DL Boost 技术,图像识别的速度可比上一代英特尔至强可扩展处理器提升 14 倍。

另外,英特尔 CPU 平台还与各类主流深度学习框架(包括TensorFlow、PyTorch、caffe 、MXNet、PaddlePaddle、BigDL 等)合作,针对 CPU 的 AI 训练和 AI 推理功能进行全面优化,Xeon 处理器训练性能因此得到不断提升,客户也可以选择使用适合自身需求的深度学习框架做模型训练,而无需购买或者设置不同的硬件基础设施。

随着软件工具的不断更新及面向主流框架的深度优化,CPU 平台不论是支持基于单一 AI 技术的应用,还是在运行融合了多种 AI 技术的应用时,其性能表现都更为突出。

对于全新硬件架构的每一个数量级的性能提升潜力,软件能带来超过两个数量级的性能提升。以第二代英特尔至强可扩展处理器上的 VNNI 深度学习加速指令为例,过去卷积神经需要三条指令,而现在的话一条指令就可以了,通过在底层的软硬件协同优化,可根据不同深度学习框架将推理性能加速 2-3 倍甚至更多。

第二重助力:数据预处理

数据的处理分析和之后的 AI 应用如果在一个平台上,可以给用户带来更大的便利性,也能节省成本和降低风险。

尽管当前市场对于 AI 技术抱有很大兴趣,但实施水平仍然相当低下。我们需要根据应用需求构建起完整的数据分析/AI 流水线,从高质量数据源整理、数据预处理与清洗、适当特征数据的选择与构建等前期工作开始,这就要求数据工程师、算法工程师等协同工作。

算法工程师往往要花很多时间,来处理用于深度学习模型训练和测试的庞大数据,数据预处理会涉及很多很零碎的事情,比如校对数据的标注是否符合某种逻辑。在进行数据预处理时,所写的代码不一定是执行起来效率最高的,因为有可能这些零碎的校验数据功能只用一次,而不是反复使用。在这种情况下,可以使用方便快速实现功能的Python语言调用 CPU 来实现,而且基于 CPU 有很多现成的包和工具,具有更快数据预处理的优势。CPU 还可以通过使用更多内存、减少 I/O 操作来提升 AI 运行效率。

如今的深度学习和 AI 领域,优秀的算法和框架数不胜数,但英特尔开源的 BigDL 和采用了这一技术的 Analytics Zoo 平台选择了一个颇具独特性的切入点,那就是专为已有大数据集群的场景设计。目前,来自零售业、金融服务行业、医疗保健业、制造业及电信业等领域的企业客户都已经开始在英特尔至强服务器上利用 Analytics Zoo、或基于 BigDL 构建更为平滑无缝的数据分析-AI 应用流水线。

第三重助力:可扩展性

作为普遍使用的基础设施,CPU 平台就是为可扩展性而搭建的,它们不仅易于在更多节点上进行扩展,还能按核实现弹性扩展和调配。

在深度学习和机器学习领域,不管是模型训练还是推理,为了分配和部署计算能力,常常需要基于现有的 IT 基础设施或者云平台进行硬件扩展。目前一些专有的 AI 架构平台只能以卡或芯片为单位来管理和扩展,而英特尔至强平台不仅更容易在更多节点上扩展,还能按核实现弹性的扩展和调配,能真正做到精细化的资源管理和调配。这使得 AI 平台可以尽可能通过云化来提高灵活性,提升自动化管理水平,并充分利用到每个计算核心的价值等。

比如有开发者指出,在新一代 Skylake-SP 微构架芯片设计上,英特尔首次开始采用了全新网格互连构架(Mesh Interconnect Architecture)设计方式,从传统的利用环形连接,到了新设计则全面改采用网格互连的方式,来进行资料存取与控制指令的传送。因为最小单位可以是以每行、每列来连接,所以每颗 Skylake-SP 核心、缓存、内存控制器及 I/O 控制器之间的路径选择变得更多元,还可以跨不同的节点互连,以寻找最短的数据传递捷径,即使是加大核心数量,也能够维持很快存取数据,并支持更高内存频宽,以及更高速的 I/O 传输。

第四重助力:内存

CPU 易扩展缓存,而英特尔傲腾DC持久内存 Apache Pass 更是集大容量、经济性和持久性于一身,性能接近DRAM

不论是 AI 训练还是推理,靠近计算单元的内存或者说较高速的数据缓存都非常重要。在 AI 分析中,它们对训练中的神经网络构建,并通过该网络进行推理比较都有着重要的影响。因此我们希望在靠近计算单元的地方尽可能缓存更多数据。其容量的增加,会很大程度上提高 AI 的整体性能、准确性、响应速度。

训练深度学习模型时,占用 CPU 内存比较大,一般来说单台刀片可以轻松做到 256GB 以上的内存,做分布式训练时还可以把数据分配到不同机器上进行计算,而且可以尽量把数据预存到 CPU。此外,CPU 大内存的优势不仅体现在训练上,更主要的是推理,比如对尺寸很大的医疗影像模型进行推理处理。

即使没有英特尔傲腾数据中心级持久内存的出现,英特尔至强处理器平台也很容易扩展内存的容量。但有了这种全新类型的产品后,内存的存储密度/价格比可能会更理想,其性能也接近 DRAM,让更大量的数据可以更接近 CPU 进行移动和处理,极大地降低从系统存储获取数据的延迟。相比之下,专有架构平台要扩展缓存,还是很不方便的。

第五重助力:模型部署

英特尔技术产品从端到端是有统一的应用兼容性的,这样可以保证我们在后端训练迭代算法,前端部署推理。

在深度学习实践中,是否应该去搭建一套新的专用平台?持否定意见的开发者认为,目前主要用于 AI 模型推理的平台都是基于 CPU 架构的,应该利用现有的数据中心基础设施,利用现有的、熟悉的处理器平台,以最低的成本部署人工智能,这相比另起炉灶、寻找其他计算平台的方法,用时更短 、风险更低、性价比更高。

有开发者据此总结了三条理由:首先,现如今标准 CPU 平台完全能够胜任 AI 所有应用;其次,现在 AI 属于「试错阶段「,同时技术也在快速演变和迭代,利用现有的 CPU 平台,可以最小成本做最大的事,无需大量额外投资,但如果另起炉灶可能得不偿失;最后,用多年熟悉且信任的 CPU 平台,构建「激进」的 AI 项目,本身就是一个绝好的平衡,让技术风险变得可控。

在现有英特尔架构支持的数据应用基础上构建 AI 应用,生产环境非常成熟,易于部署,运维人员学习难度低。英特尔从云到端都有硬件平台就绪,不论是通用计算还是专用芯片(如 Movidius),而且还有相关的软件支持,如众多优化库、框架和工具。另外,英特尔为 AI 应用的开发者们提供了 OpenVINO 等工具包,可以方便实现模型部署,优势显著。

第六重助力:大数据分析

英特尔至强处理器和 BigDL 软硬搭配,在 Hadoop 和 Spark 等主流大数据框架上,可以简化训练(数据获取+处理)过程。

Hadoop 和 Spark 是目前非常流行的大数据管理和处理框架,想利用它们承载的数据进行深度学习训练,通常需要把这些数据导出,然后进行处理,这个过程不仅耗时而且投资较大,所以在这些大数据平台上进行深度学习训练显得尤为重要。

有开发者认为,可以针对各种不同来源的数据,首先根据目标算法需要的数据格式,进行数据整合。得到目标数据之后,再根据业务需要,按照对应的比例,将最原始的数据分成训练数据和测试数据,通过算法对数据不断进行训练,后期进行相应的测试。

其实更好的方式是打通数据流水线。英特尔的 Analytics Zoo(内含 BigDL)打通端到端数据流水线,在 Hadoop 和 Spark 等主流的大数据框架上,把数据的收集、存储、传输、预处理、后期处理等环节,与 AI 的训练和预测等部分有机结合起来,就可以让企业的数据分析流水线变得高效而统一。例如,英特尔协助美的公司基于 Analytics Zoo 构建了一套端到端的产品缺陷检测方案,准确率优于人工检查方法,并避免了检查工作给生产线带来侵入性影响。

Analytics Zoo 将 Spark、TensorFlow 以及 BigDL 程序整合至同一流水线当中,整个流水线能够在 Spark 集群之上以透明方式实现扩展,从而进行分布式训练与推理。最终使美的的图像预处理时长由 200 毫秒降低至 50 毫秒,并将延迟影响由 2,000 毫秒缩短至 124 毫秒。

第七重助力:跨平台部署应用

英特尔至强处理器、Analytics Zoo 以及 OpenVINO 工具包,能够简化深度学习流水线,实现一站式端到端的 AI 应用部署。

深度学习应用的开发周期很长,而且往往会涉及多个工具和平台,如何将新技术、新创新应用到非常大规模、大数据的生产系统中,目前在软硬件架构上有非常大的断层。这提升了技术开发门槛,开发者十分期待从云端到终端能跨平台部署深度学习应用。

2018 年,英特尔开源了 Analytics Zoo,构建了端到端的大数据分析+AI 平台,无论是用 TensorFlow 还是 Keras,都能将这些不同模块的程序无缝运行在端到端流水线上,大大提升了开发效率。

并且,Analytics Zoo 也兼容 OpenVINO在 AI 应用上的加速特性。基于英特尔硬件平台、专注于加速深度学习的 OpenVINO工具套件,是一个快速开发高性能计算机视觉和深度学习视觉应用的工具包。

英特尔 OpenVINO 工具套件不仅适用于开发可模拟人类视觉的应用和解决方案,它还可以通过英特尔FPGA深度学习加速套件支持 FPGA,旨在通过优化广泛使用的 Caffe 和 TensorFlow 框架来简化采用英特尔 FPGA 的推理工作负载,并用于包括图像分类、机器视觉自动驾驶、军事以及医疗诊断等应用。

OpenVINO工具包基于卷积神经网络(CNN),可扩展英特尔硬件(包括加速器)的工作负载,并最大限度地提高性能。

具体来说,OpenVINO 具有面向 OpenCV 和 OpenVx 的优化计算机视觉库,并支持跨计算机视觉加速器的异构执行,可通过基于英特尔架构的处理器(CPU)及核显(IntegratedGPU)和深度学习加速器(FPGA、Movidius VPU)的深度学习加速芯片,增强视觉系统功能和性能。它支持 在边缘端进行深度学习推理,并加速高性能计算机视觉应用,帮助开发人员和数据科学家提高计算机视觉应用性能,简化深度学习部署过程。

AI 应用落地的实际选择

经过上述分析我们可以发现,在七个方面中,每个维度都支持 CPU 架构和平台的优势。一方面,CPU 的计算能力通过软硬件协同优化不断提升,可以更好地适应 AI 场景需求,企业渐渐意识到用 CPU 做 AI 已经「足够好」;另一方面,通过收购和探索不同芯片架构,英特尔的 AI 软硬件产品组合正在不断完善,这使得英特尔能够建立一个完整的 AI 基础架构,非常丰富的产品组合是英特尔与其他公司实现差异化的最大亮点。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10640

    浏览量

    208676
  • 人工智能
    +关注

    关注

    1787

    文章

    45805

    浏览量

    234094

原文标题:精品|锂电池电芯真空烘烤过程超强指导研究!

文章出处:【微信号:Recycle-Li-Battery,微信公众号:锂电联盟会长】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    运动员到开发者:英特尔以开放式AI系统应对多重挑战

    英特尔通过开放、易获取的 AI系统和生态协作,以创新的方式为运动员提供支持,并助力企业客户创造更多可能。 今日, 英特尔分享了与国际奥林匹克委员会(IOC)的一些合作细节,并披露了其以行业需求为导向所
    的头像 发表于07-25 09:28 167次阅读
    <b class='flag-5'>从</b>运动员到开发者: <b class='flag-5'>英特尔</b>以开放式<b class='flag-5'>AI</b>系统应对多重挑战

    英特尔发布AI创作应用AIPlayground,将于今夏正式上线!

    AIPC入门应用程序 AIPlayground,让广大用户在本地即可快速实现 AI个性 创作。 英特尔Xe2 GPU
    的头像 发表于06-14 09:44 279次阅读
    <b class='flag-5'>英特尔</b>发布<b class='flag-5'>AI</b>创作应用<b class='flag-5'>AI</b> Playground,将于今夏正式上线!

    英特尔CEO:AI时代英特尔动力不减

    英特尔CEO帕特·基辛格坚信,在 AI技术的飞速发展之下, 英特尔的处理器仍能保持其核心地位。基辛格公开表示,摩尔定律仍然有效,而 英特尔在处理器和芯片技术上的创新能力将持续驱动公司前进。
    的头像 发表于06-06 10:04 266次阅读

    英特尔助力京东云用CPU加速AI推理,以大模型构建数智供应链

    英特尔助力京东云用CPU加速 AI推理,以大模型构建数智 供应链
    的头像 发表于05-27 11:50 349次阅读
    <b class='flag-5'>英特尔</b>助力京东云用CPU加速<b class='flag-5'>AI</b>推理,以大模型构建数智<b class='flag-5'>化</b>供应链

    英特尔酷睿Ultra处理器突破500AI模型优化

    英特尔在最新推出的 英特尔® 酷睿™ Ultra处理器上宣布,超过500款 AI模型已得到优化运行。这款处理器无疑是市场上领先的 AIPC处理器,它不仅带来了前所未有的
    的头像 发表于05-09 11:18 558次阅读

    英特尔进军AI芯片市场:推出Gaudi 3AI加速卡与Xeon 6处理器

    Gaudi 3作为 英特尔AI领域的最新力作,旨在与英伟达等市场领导者展开竞争。据 英特尔透露,这款芯片在能效和 AI模型运行速度 方面均表现出色
    的头像 发表于04-10 15:37 632次阅读

    英特尔宣布AIPC加速计划新增两项AI举措

    首先,“ AIPC 开发者计划”面向软件研发人员和独立软件开发商,为他们提供便捷的开发环境,助力加速大 规模运用新型 AI技术。此计划包含一系列全面的工具、优化工作流方案、 AI部署框架
    的头像 发表于03-27 16:03 231次阅读

    英特尔酷睿Ultra通过全新英特尔vPro平台将AIPC惠及企业

    近日, 英特尔在2024年世界移动通信大会(MWC 2024)上宣布,全新 英特尔®vPro®平台将 AIPC的 优势惠及商用客户。
    的头像 发表于03-18 15:07 352次阅读

    英特尔vPro让AIPC造福企业

    全新vPro平台为各种 规模的企业提供出色的生产力、安全性、可管理性和稳定性 最新消息:今天, 英特尔在2024年世界移动通信大会(MWC 2024)上宣布,全新 英特尔® vPro®平台将 AI
    的头像 发表于02-28 16:01 262次阅读

    英特尔首推面向AI时代的系统级代工

    英特尔宣布全新制程技术路线图、客户及生态伙伴合作,以实现2030年成为全球第二大代工厂的目标。 新闻亮点: • 英特尔首推面向 AI时代的系统级代工—— 英特尔代工(Intel Foundr
    的头像 发表于02-26 15:41 274次阅读
    <b class='flag-5'>英特尔</b>首推面向<b class='flag-5'>AI</b>时代的系统级代工

    英特尔首推面向AI时代的系统级代工—英特尔代工

    英特尔首推面向 AI时代的系统级代工—— 英特尔代工(Intel Foundry),在技术、韧性和可持续性 方面均处于领先地位。
    的头像 发表于02-25 10:38 395次阅读
    <b class='flag-5'>英特尔</b>首推面向<b class='flag-5'>AI</b>时代的系统级代工—<b class='flag-5'>英特尔</b>代工

    英特尔推出新一代强大产品, 加速实现 “AI无处不在 ”

    英特尔® 酷睿™ Ultra 和第五代 英特尔® 至强® 可扩展处理器丰富了 英特尔出色的 AI产品组合,加速 AI惠及千行百业,开启全民
    发表于12-16 16:27 335次阅读
    <b class='flag-5'>英特尔</b>推出新一代强大产品, 加速实现 “<b class='flag-5'>AI</b> 无处不在 ”

    AI无处不在,英特尔酷睿Ultra 和第五代英特尔至强可扩展处理器正式发布

    英特尔酷睿 Ultra处理器和第五代 英特尔至强 可扩展处理器支持的 AI产品亮相,展现了 英特尔 云到端全方位的
    的头像 发表于12-16 16:05 541次阅读
    <b class='flag-5'>AI</b> 无处不在,<b class='flag-5'>英特尔</b>酷睿Ultra 和第五代<b class='flag-5'>英特尔</b>至强可扩展处理器正式发布

    英特尔新处理器,掀AIPC战火

    随着 ai时代的到来, 英特尔正在构想新的酷睿Ultra处理器(代号Meteor Lake),这是 英特尔的第一 基于npu的处理器,旨在在pc上应用 ai
    的头像 发表于12-11 11:26 755次阅读

    签了!英特尔与联想、爱奇艺引领加速AIPC落地

    10月31日下午, 英特尔公司、联想集团、爱奇艺三方备忘合作发布会在北京举行。三家企业签署合作备忘录,旨在携手加速 AI变革在应用端的 落地,为用户带来全新的 AI高级智能
    的头像 发表于11-01 14:06 315次阅读
    签了!<b class='flag-5'>英特尔</b>与联想、爱奇艺引领加速<b class='flag-5'>AI</b> PC<b class='flag-5'>落地</b>