1 细数二十一世纪以来深度学习框架的发展历程-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

细数二十一世纪以来深度学习框架的发展历程

Dbwd_Imgtec 来源:机器之心 作者:机器之心 2021-01-08 14:29 次阅读

当前,各式各样深度学习框架的发展充分赋能机器学习,尤其是深度学习领域,为开发者提供了极致便利。在本文中,Waymo 软件工程师 Lin Yuan 细数了二十一世纪以来深度学习框架的发展历程,并划分为了石器、青铜、铁器、罗马和工业化时代。

过去十年,机器学习(尤其是深度学习)领域涌现了大量算法和应用。在这些深度学习算法和应用涌现的背后,是各种各样的深度学习工具和框架。它们是机器学习革命的脚手架:TensorFlow 和 PyTorch 等深度学习框架的广泛使用,使得许多 ML 从业者能够使用适合的领域特定的编程语言和丰富的构建模块更容易地组装模型。

回顾深度学习框架的演变,我们可以清楚地看到深度学习框架和深度学习算法之间的紧密耦合关系。这种相互依赖的良性循环推动了深度学习框架和工具的快速发展。

By Nationalmuseet, CC BY-SA 3.0,

https://commons.wikimedia.org/w/index.php?curid=90400464

石器时代(21 世纪初)

神经网络的概念已经出现一段时间了。在 21 世纪初之前,有一些工具可以用来描述和开发神经网络。这些工具包括 MATLAB、OpenNN、Torch 等,它们要么不是专门为神经网络模型开发定制的,要么拥有复杂的用户 api,缺乏 GPU 支持。在此期间,ML 实践者在使用这些原始的深度学习框架时不得不做很多繁重的工作。

By Nationalmuseet, CC BY-SA 3.0,

https://commons.wikimedia.org/w/index.php?curid=90400464

青铜时代(~2012 年)

2012 年,多伦多大学的 Alex Krizhevsky 等人提出了一种深度神经网络架构,后来被称为 AlexNet[1],该架构在 ImageNet 数据集上达到了 SOTA 精度,并大大超过了第二名的选手。这一出色的结果引发了深度神经网络的热潮,此后各种深度神经网络模型在 ImageNet 数据集的准确性上不断创下新高。

大约在这个时候,一些早期的深度学习框架,如 Caffe、Chainer 和Theano 应运而生。使用这些框架,用户可以方便地建立复杂的深度神经网络模型,如 CNN、RNN、LSTM 等。此外,这些框架还支持多 GPU 训练,这大大减少了对这些模型的训练时间,并且能够对以前无法装入单一 GPU 内存的大型模型进行训练。在这些框架中,Caffe 和 Theano 使用声明式编程风格,而 Chainer 采用命令式编程风格。这两种不同的编程风格也为即将到来的深度学习框架设定了两条不同的开发路径。

Nordisk familjebok — Nordisk familjebok (1910), vol.13, Till art. Järnåldern. https://commons.wikimedia.org/w/index.php?curid=109777

铁器时代(2015 ~ 2016)

AlexNet 的成功引起了计算机视觉领域的高度关注,并重新点燃了神经网络的希望,大型科技公司加入了开发深度学习框架的行列。其中,谷歌开源了著名的 TensorFlow 框架,它至今仍是 ML 领域最流行的深度学习框架。Caffe 的发明者加入了 Facebook 并发布了 Caffe2;与此同时,Facebook AI 研究(FAIR)团队也发布了另一个流行的框架 PyTorch,它基于 Torch 框架,但使用了更流行的 Python api。微软研究院开发了 CNTK 框架。亚马逊采用了 MXNet,这是华盛顿大学、CMU 和其他机构的联合学术项目。TensorFlow 和 CNTK 借鉴了 Theano 的声明式编程风格,而 PyTorch 则继承了 Torch 的直观和用户友好的命令式编程风格。命令式编程风格更加灵活(比如定义一个 While 循环等)并且容易跟踪,而声明式编程风格通常为内存和基于计算图的运行时优化提供了更多的空间。另一方面,被称为「mix」-net 的 MXNet 同时支持一组符号(声明性)api 和一组命令式 api,并通过一种称为杂交(hybridization)的方法优化了使用命令式 api 描述的模型的性能,从而享受了这两个领域的好处。 2015 年,何凯明等人提出了 ResNet[2],再次突破了图像分类的边界,在 ImageNet 的准确率上再创新高。业界和学界已经达成共识,深度学习将成为下一个重大技术趋势,解决各种领域的挑战,这些挑战在过去被认为是不可能的。在此期间,所有深度学习框架都对多 GPU 训练和分布式训练进行了优化,提供了更加用户直观的 api,并衍生出了专门针对计算机视觉、自然语言处理等特定任务的 model zoo 和工具包。还值得注意的是,Francois Chollet 几乎是独自开发了 Keras 框架,该框架在现有框架(如 TensorFlow 和 MXNet)之上提供了神经网络和构建块的更直观的高级抽象。从今天开始,这种抽象成为 TensorFlow 中模型层面事实上的 api。

By User Lamré on sv.wikipedia

https://commons.wikimedia.org/w/index.php?curid=801434

罗马时代(2019 ~ 2020)

正如人类历史的发展一样,深度学习框架经过一轮激烈的竞争,最终形成了两大「帝国」:TensorFlow 和 PyTorch 的双头垄断,这两大「帝国」代表了深度学习框架研发和生产中 95% 以上的用例。2019 年,Chainer 团队_将他们的开发工作转移到 PyTorch;类似地,微软_停止了 CNTK 框架的积极开发,部分团队成员转而支持 Windows 和 ONNX 运行时上的 PyTorch。Keras 被 TensorFlow 收编,并在 TensorFlow 2.0 版本中成为其高级 api 之一。在深度学习框架领域,MXNet 仍然位居第三。

在此期间,深度学习框架空间有两种趋势。首先是大型模型训练。随着 BERT[3] 的诞生,以及它的近亲 GPT-3[4] 的诞生,训练大型模型的能力成为了深度学习框架的理想特性。这就要求深度学习框架能够在数百台(如果不是数千台的话)设备的规模下有效地进行训练。第二个趋势是可用性。这一时期的深度学习框架都采用命令式编程风格,语义灵活,调试方便。同时,这些框架还提供了用户级的装饰器或 api,以通过一些 JIT(即时)编译器技术实现高性能。

By Tharunbr77 — Own work, CC BY-SA 4.0,

https://commons.wikimedia.org/w/index.php?curid=86866550

工业时代(2021+)

深度学习在自动驾驶、个性化推荐、自然语言理解到医疗保健等广泛领域取得了巨大成功,带来了前所未有的用户、开发者和投资者浪潮。这也是未来十年开发深度学习工具和框架的黄金时期。尽管深度学习框架从一开始就有了长足的发展,但它们之于深度学习的地位还远远不如编程语言 JAVA/ c++ 之于互联网应用那样的成熟。还有很多令人兴奋的机会和工作有待探索和完成。 展望未来,有几个技术趋势有望成为下一代深度学习框架的主流:

基于编译器的算子(operator)优化。

如今,许多操作符内核都是通过手动或第三方库实现的,比如 BLAS、CuDNN、OneDNN 等,这些库针对特定的硬件平台。当模型被训练或部署在不同的硬件平台上时,这会造成很大的开销。此外,新的深度学习算法的增长速度往往比这些库的迭代速度快得多,这使得这些库常常不支持新的算子。深度学习编译器,如 Apache TVM、MLIR、Facebook Glow 等,已经提出了在任何硬件后端上有效优化和运行计算的建议。它们可以作为深度学习框架的整个后端。

统一的 API 标准。

许多深度学习框架共享类似但略有不同的用户 api。这给用户从一个框架切换到另一个框架带来了困难和不必要的学习曲线。虽然大多数机器学习从业者和数据科学家都熟悉 NumPy库,但在新的深度学习框架中,NumPy API 自然会成为 tenor 操作 API 的标准。我们已经看到快速发展的框架 JAX 受到了用户的热烈欢迎,它的 api 完全与 NumPy 兼容。

数据搬运作为一等公民。

多节点或多设备训练正在成为深度神经网络训练的规范。最近开发的深度学习框架,如 OneFlow,从设计的第一天起就将这一观点纳入设计考虑,并将数据通信视为模型训练的整体计算图的一部分。这为性能优化打开了更多的机会,而且由于它不需要像以前的深度学习框架那样维护多种训练策略(单设备 vs 分布式训练),因此除了提供更好的性能之外,它还可以提供更简单的用户界面。

总结

我们正处于一场人工智能革命的黎明。人工智能领域的新研究和新应用正在以前所未有的速度涌现。八年前,AlexNet 网络包含 6000 万个参数最新的 GPT-3 网络包含 1750 亿参数,网络规模在 8 年内增加了 3000 倍!另一方面,人类的大脑包含大约 100 万亿个参数(即突触)。这表明,如果有可能的话,神经网络要达到人类的智能水平还有很大的差距。

这种难以接受的网络规模对模型训练和推理的硬件和软件计算效率都提出了很大的挑战。未来的深度学习框架很可能是算法、高性能计算、硬件加速器和分布式系统的跨学科成果。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132556
  • 深度学习
    +关注

    关注

    73

    文章

    5500

    浏览量

    121109
  • pytorch
    +关注

    关注

    2

    文章

    807

    浏览量

    13197

原文标题:深度学习框架简史:TF和PyTorch双头垄断,未来十年迎来黄金时期

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    上海贝岭数字隔离器产品介绍

    数字隔离器作为二十一世纪新推出的隔离技术,以其更高的可靠性、简化的外围器件,高集成特性,已被广泛用于工业控制、汽车、仪表、医疗等应用。
    的头像 发表于 12-19 17:24 89次阅读
    上海贝岭数字隔离器产品介绍

    上海贝岭推出集成互锁功能的六通道数字隔离器

    数字隔离器作为二十一世纪新推出的隔离技术,以其更高的可靠性、简化的外围器件,高集成特性,已被广泛用于工业控制、汽车、仪表、医疗等应用。
    的头像 发表于 12-12 16:43 214次阅读
    上海贝岭推出集成互锁功能的六通道数字隔离器

    西井科技受邀出席第二十一届上海知识产权国际论坛

    近日,以“知识产权赋能新质生产力发展”为主题的第二十一届上海知识产权国际论坛在沪开幕。本届论坛由国家知识产权局、世界知识产权组织和上海市人民政府共同主办。市委副书记、市长龚正,国家知识产权局局长申长
    的头像 发表于 12-06 15:30 238次阅读

    基于MCX系列MCU的EBike仪表解决方案

    二十一世纪是电气化的时代。相比于化石燃料驱动的车辆,电能驱动车辆具有显著减少污染物排放、效率高、静谧平顺、行驶稳定、加速快的优点,并随着充电设施的不断完善,电能驱动车辆的应用已经越来越普及。电动自行车(EBike)也已成为现代城市出行的重要工具。
    的头像 发表于 10-25 10:22 336次阅读
    基于MCX系列MCU的EBike仪表解决方案

    云知声亮相第二十一届中国-东盟博览会

    以“亲诚惠容同发展 镶钻成冠创未来——促进中国—东盟自由贸易区3.0版建设和区域高质量增长”为主题的第二十一届中国—东盟博览会(以下简称“东博会”)在广西南宁举办。
    的头像 发表于 10-12 14:18 412次阅读
    云知声亮相第<b class='flag-5'>二十一</b>届中国-东盟博览会

    直径测量工具的发展历程

    关键字:直径测量,工业直径测量设备,线性尺量器,光电测径仪, 直径测量工具的发展历程是一个悠久且不断创新的过程,它随着科学技术的进步而不断演变。以下是直径测量工具发展历程的详细概述:
    发表于 10-10 16:55

    二十一届亚太智能建筑论坛精彩回顾

    二十一届亚太智能建筑论坛暨第六届青年智能建筑专家年会在静安区洲际酒店顺利落幕。为期两天的展会吸引了众多来宾的热情关注。在此,安科瑞衷心感谢每一位莅临我们展位的朋友,你们的信任与支持是我们不断前行
    的头像 发表于 09-01 08:01 292次阅读
    第<b class='flag-5'>二十一</b>届亚太智能建筑论坛精彩回顾

    直线电机生产厂家谈卫星互联网高轨卫星成功发射

    高轨卫星02星发射升空,随后卫星顺利进入预定轨道…… 据 直线电机生产厂家 小编所知,二十一世纪六十年代以来,人类已经将数以百计的通信广播卫星送入高轨道,在实现全球远距离通信和电视传输方面,这些卫星一直担当主角。高轨道卫星(GEO)移动
    的头像 发表于 08-16 08:13 252次阅读
    直线电机生产厂家谈卫星互联网高轨卫星成功发射

    NAND闪存的发展历程

    NAND闪存的发展历程是一段充满创新与突破的历程,它自诞生以来就不断推动着存储技术的进步。以下是对NAND闪存发展
    的头像 发表于 08-10 16:32 1249次阅读

    NVIDIA推出全新深度学习框架fVDB

    在 SIGGRAPH 上推出的全新深度学习框架可用于打造自动驾驶汽车、气候科学和智慧城市的 AI 就绪型虚拟表示。
    的头像 发表于 08-01 14:31 589次阅读

    关于直线电机尺寸问题的解析

    二十一世纪以来,随着我国科技地飞速发展,各行各业都搭上了这趟“快班车”,直线电机也不例外。近十几年以来,直线电机地发展可以用“天翻地覆”来形
    的头像 发表于 07-29 08:35 292次阅读
    关于直线电机尺寸问题的解析

    TensorFlow与PyTorch深度学习框架的比较与选择

    深度学习作为人工智能领域的一个重要分支,在过去十年中取得了显著的进展。在构建和训练深度学习模型的过程中,深度
    的头像 发表于 07-02 14:04 949次阅读

    2024第二十一届(上海)国际物联网展览会4月24日-26日开幕

    交流产业信息,把脉发展方向,IOTE 国际物联网展是每年物联网行业、企业、用户交流合作的大型平台。2024年4月24-26日IOTE®2024第二十一届国际物联网展•上海站,在上海世博展览馆开展。
    的头像 发表于 04-26 17:59 603次阅读
    2024第<b class='flag-5'>二十一</b>届(上海)国际物联网展览会4月24日-26日开幕

    闪耀湾区,诺安智能获评第二十一届“深圳知名品牌(湾区知名品牌)”称号

    2024年3月5日,深圳知名品牌评价委员会召开第二十一届“深圳知名品牌”评审会议,审核评选出113个市场占有率高、诚信度高、品牌知名度高的企业品牌为第二十一届深圳知名品牌。诺安智能在全市50多个细分
    的头像 发表于 03-20 09:13 571次阅读
    闪耀湾区,诺安智能获评第<b class='flag-5'>二十一</b>届“深圳知名品牌(湾区知名品牌)”称号

    国产人形机器人产业发展现状

    具备初级感知功能的智能化起步阶段(2001-2015年),进入二十一世纪,随着感知系统及交互系统等技术进步,人形机器人在该阶段可实现与外界环境有限的互动,并且运动自由度提升,能实现行走以外的其他简单行动操作,例如本田由 P系列所迭代出的 ASIMO 系列中的“All-new ASIMO”机器人;
    的头像 发表于 01-12 16:52 1822次阅读
    国产人形机器人产业<b class='flag-5'>发展</b>现状