0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心
发布

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

简单认识高级处理器

Semi Connect 来源:Semi Connect 2023-12-07 11:31 次阅读

除了传统的处理器(CPU、MPU/MCUDSPGPU),面向当代各种应用的高级处理器(Advanced Processors)层出不穷,例如加速处理单元 (AcceleratedProcessing Unit, APU) 、采用异构系统架构 ( Heterogeneous System Architecture,HSA) 特征设计的集成电路、基于人工神经网络(Artificial Neural Networks,ANN)深度学习(Deep Learning)的高级处理器等。

1. 加速处理单元

AMD公司于2006 年收购了 ATI 公司,从设计传统的串行计算处理器 CPU过渡到并行图形处理器 GPU;经过研发升级,再将 CPU 和GPU 合为一体成为APU,集成为单个芯片,使得微处理器的性能得到改进,处理能力得以提高。APU 为随后被扩展为 HSA 走出了一条新路。AMD 公司的三代 APU 架构开发项目见表 2-15。

bbc42e08-94ab-11ee-939d-92fbcf53809c.png

2.采用异构系统架构特征设计的集成电路

HSA 最早是由 AMD 公司开发的 APU 概念扩展而来的。HSA 定义了一套计算机硬件规范,其核心为 CPU 标量处理和 GPU (或者 DSP)并行处理的结合。与此相应的有开源软件的开发与应用,包括系统级 C/C++高级语言、用于异构系统的开放计算语言 (Open Computing Language, OpenCL)结构、针对三维图形(例如 GPU)的开放图形库 (Open Graphics Library, OpenGL)、开放多进程(Open Multi-Processing, OpenMP)应用程序接口、NVIDIA 公司开发的平行计算与应用接口 ( Compute Unified Device Architecture, CUDA) 的模型、支持多种操作系统Python等语言。2012年6月由 AMD、ARM、Imagination、联发科(MediaTek)、高通三星成立了非营利组织 HSA 协会。HSA 协会着重于开发和定义各种处理器(包括 CPU、GPU、DSP)以及存储器的特点和接口;之后,该协会又添加了ASIC设计公司成员,从而建立起新型的并行计算异构系统架构,如图2-31 所示。HSA 包括软件和硬件两大部分。软件包括 OpenCL、OpenMP、CUDA 模型等。图2-31中 CPU 和其专用存储器DDR,以及 GPU 和其专用存储器 GDDR, 使用指针 (Pointer)功能传递,在HSA 系统中形成了共享的系统虚拟存储器 (System Virtual Memory, SVM)。

3.基于人工神经网络深度学习的高级处理量

约翰•麦卡锡(John McCarthy)在1956年最早使用了人工智能(ArtificialIntelligence,AI)这个词,他也因此被称为 “人工智能之父”。AI通过使用机器学习(Machine Learning)而设计的产品应用广泛,发展迅速。1986 年 GeffreyHinton 等人发表了神经网络中反向传播算法(Back-Propagation Algorithm)的文章。2006 年Hinton 的这一研究有了新的突破,并提出了深度学习(DeepLearning)的概念。近年来,深度神经网络 (Deep Neural Network, DNN)、卷积神经网络 ( Convolutional Neural Network, CNN)、循环神经网络 (RecurrentNeural Network,RNN,例如时间递归神经网络,即 Long Short - Term Memory,LSTM)等深度学习方法大大推动了各种芯片的设计进程。

bbe06834-94ab-11ee-939d-92fbcf53809c.png

Intel公司 2017 年推出了 Nervana 平台,利用其 APU 产品 LakeCrest, 采用CPU 与FPGA重组架构设计,用在深度学习的分析算法领域中。另外,Intel于2016-2017 年发布的高级CPU 都可以用在深度学习的相关领域。例如,2016年第一季度发布了 14nm 工艺制造的 Atom x5-Z8330 处理器,含有4 核4线程,L2缓存(Cache)为 2MB, 最高工作频率为 1.92GHz。 Intel 于 2016 年第四季度发布了至强(Xeon Phi)系列处理器 7290,含72核,采用14nm 工艺,集成16GB 缓存,工作频率为 1.5GHz。Intel 于 2017 年发布了第七代4核处理器 IntelCore-i7 系列,工作频率为 3.5~4.5GHz。

IBM 公司承担美国 DARPA 的 SyNAPSE 项目,基于 CNN 设计了认知计算机(Cognitive Computer),从而于 2014 年设计出备受关注的具有 4096 个 CPU 众核的真北(TrueNorth) 神经网络芯片,它有54 亿个晶体管,功耗只有70mW。它vwin 2.68 亿个神经轴突(Synapse),每个 CPU 核可以模仿 256 个可编程的神经元 (Neuron),总共等效于 100 万个神经元。

中国科学院计算所2016年报道了结合 GPU 和 CPU 的深度学习专用处理器寒武纪(Cambrian)芯片,计算速度大为提高,为其虛拟现实研究建立了基础。寒武纪1号(DianNao)芯片采用 65nm 工艺.芯片面积为 3.02mm²,主频为0.98GHz,功耗为 0.485W,峰值性能达每秘 4520 亿次神经网络基本运算。寒武纪2 号(DaDianNao)芯片包含 16个处理器核,采用28nm 工艺,面积为67.7mm²,主频为 606MHz,功耗约为 16W。据称与主流 GPU 相比,寒武纪2号单芯片性能超过若干倍,能耗极低,高效能计算系统性能提升数百倍。寒武纪3号(PuDianNao)芯片采用 65nm 工艺,面积为 3.51mm²,主频为 1GHz,功耗为0.596W,峰值性能达每秒10 560 亿次基本操作。PuDianNao 运行机器学习算法时的平均性能与主流 GPGPU (通用GPU)相当,但面积和功耗仅为主流GPGPU 百分之一量级。

谷歌公司于2013 年9月从惠普实验室聘请了计算机体系结构领域专家 NormJouppi,参与开发被称作张量处理器 (Tensor Processing Unit, TPU)的集成电路设计,使用时通过 PCle插口去优化 CPU 和 GPU 芯片组的运行。该TPU 专为深度学习平台TensorFlow打造,运用高层次机器深度学习与计算,可以将复杂的数据结构传输至人工智能神经网络中进行分析和处理,可以用于语音识别或图像识别等多项机器深度学习。谷歌于 2014 年合并了英国 DeepMind 公司,其具有神经智能学习功能的阿尔法围棋(AlphaGo)于2016 年5月打败了世界顶级围棋棋手李世石。AlphaGo 2.0于2017 年6月打败个人围棋大赛四冠王柯洁。阿尔法围棋是在 TPU 之上运行的,在人机比赛时最多使用了 1920 个 CPU 和 280个GPU。谷歌公司于2017 年4月5 日公开发表官方博客,介绍TPU 的架构,其处理 AI 事务速度比其他 GPU 与 CPU 结合模式快 15~30倍,计算能效高 50~80倍。这些进展为未来各种新型的高级处理器产品设计带来新的激励。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    18789

    浏览量

    226132
  • dsp
    dsp
    +关注

    关注

    550

    文章

    7810

    浏览量

    346270
  • amd
    amd
    +关注

    关注

    25

    文章

    5325

    浏览量

    133180
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4553

    浏览量

    127961
  • 深度学习
    +关注

    关注

    73

    文章

    5414

    浏览量

    120415

原文标题:高级处理器,高級處理器,Advanced Processors

文章出处:【微信号:Semi Connect,微信公众号:Semi Connect】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    高级处理器特性能否提高编码效率?

    高级 处理器特性能否提高编码效率?
    发表于04-26 06:41

    別让处理器编号混淆您的认识

    別让 处理器编号混淆您的 认识随着90奈米 处理器(Dothan、Prescott)与新芯片组(915/925)的问世,英特尔(Intel)也增加一项新的 处理器编号命名方式
    发表于01-25 14:34 470次阅读

    用verilog实现简单处理器

    本站提供的用verilog实现 简单处理器资料,希望对你的学习有所帮助!
    发表于05-30 17:09 96次下载
    用verilog实现<b class='flag-5'>简单</b>的<b class='flag-5'>处理器</b>

    从Cortex-M到 Cortex-A认识ARM处理器

    从Cortex-M到Cortex-A 认识ARM 处理器
    的头像 发表于03-08 11:34 3268次阅读

    了解高级处理器功能可促进高效编码

    了解 高级 处理器功能可促进高效编码
    发表于05-14 18:38 10次下载
    了解<b class='flag-5'>高级</b><b class='flag-5'>处理器</b>功能可促进高效编码

    ADSP-BF522低功耗Blackfin处理器高级外围设备产品亮点

    ADSP-BF522低功耗Blackfin 处理器高级外围设备产品亮点
    发表于05-16 12:35 0次下载
    ADSP-BF522低功耗Blackfin<b class='flag-5'>处理器</b>与<b class='flag-5'>高级</b>外围设备产品亮点

    面向高级应用处理器的新型PMIC

    面向 高级应用 处理器的新型PMIC
    发表于05-23 16:49 12次下载
    面向<b class='flag-5'>高级</b>应用<b class='flag-5'>处理器</b>的新型PMIC

    视频处理器让投影变得更简单

    随着科技技术的不断发展,各种 高级别会议场所对投影机画面效果提出了更高的要求,视频 处理器的研发与生产满足了人们的高品质追求。其采用先进的分布学设计思想,经过一系列的接收信号、拼接画面到最后融合 处理
    的头像 发表于08-24 16:37 637次阅读
    视频<b class='flag-5'>处理器</b>让投影变得更<b class='flag-5'>简单</b>

    简单认识IA-64架构处理器

    IA- 64 架构 处理器(IA - 64 Processors )最早为安腾架构 (Itanium Architecture) 处理器的缩写,支持64 位 处理技术。但由于安腾架构 处理器
    的头像 发表于11-27 09:33 960次阅读

    简单认识POWER系列架构处理器

    POWER 架构最新的 处理器是 2017 年发布的 POWER9,采用14nm 工艺制造,性能远超 ×86 架构 处理器。POWER 系列架构历代产品的 简单说明见表 2-10。
    的头像 发表于11-28 09:21 1512次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>POWER系列架构<b class='flag-5'>处理器</b>

    简单认识MIPS架构处理器

    无互锁流水级微 处理器(Microprocessors without Interlocked Pipeline Stages,MIPS) 是流行的 RISC 架构 处理器之一。其原理是尽量利用软件
    的头像 发表于11-29 09:14 1220次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>MIPS架构<b class='flag-5'>处理器</b>

    简单认识数字信号处理器

    数字信号 处理器(Digital Signal Processor, DSP)是一种专用微 处理器,它在架构上对数字信号 处理(Digital Signal Processing)做了优化。第一款单
    的头像 发表于11-30 09:07 873次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>数字信号<b class='flag-5'>处理器</b>

    简单认识网络处理器

    网络 处理器(Network Processor, NP)或者网络 处理器单元 (NP Unit,NPU)可以 处理各种网络通信任务,包括数据包的 处理、协议分析、路由查找、声音和数据的汇聚、
    的头像 发表于12-05 09:34 846次阅读

    简单认识安全加密处理器

    安全加密 处理器(Secure Cryptoprocessor) 是一种本身不产生加密数据或程序指令,但产生密钥(Key)的 处理器,其应用产品有智能卡、ATM、电视机机顶盒、军事系统等。而加密型
    的头像 发表于12-06 09:19 755次阅读

    简单认识变压器

    简单 认识变压器
    的头像 发表于01-25 10:05 810次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识变压器</b>