0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心
发布

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

亚马逊开始转向另一个开源虚拟化技术KVM

lPCU_elecfans 来源:德赢Vwin官网 网 作者:德赢Vwin官网 网 2022-08-10 09:16 次阅读

电子发烧友网报道(文/周凯扬)云服务作为目前市面上利润最大的市场之一,已然成了不少互联网巨头公司的主要业务,而云服务供应商中稳坐头号交椅的,自然是亚马逊的AWS。作为占据全球市场近三分之一,在中国市场仅次于阿里云的公共云平台,亚马逊的云业务成了它最赚钱的业务,甚至在其零售业务开始亏损时,也依然在一己之力撑起亚马逊的利润率。

亚马逊的AWS业务之所以能收获这样的成功,同样离不开硬件。云服务市场初期的竞争很简单,由于硬件用的都是英特尔AMD这些厂商的服务器产品线,所以差距不大,只能靠虚拟化技术之类的软件架构以及更高的性价比来吸引客户。但为了进一步降低成本,云服务厂商们也纷纷开始自研芯片,亚马逊、谷歌还有阿里巴巴都是如此。

一次成功的收购对于云服务的基石实例来说,虚拟化是至关重要的。亚马逊此前用到的都是Xen这一开源虚拟化技术,随后在发现Xen在硬件虚拟化上的一些限制之后,亚马逊开始转向另一个开源虚拟化技术KVM。

但也正是这一转变让他们有了重大发现,那就是尽管英特尔和AMD的服务器CPU在虚拟化上越来越成熟,但KVM能与ASIC紧密结合在一起反而能发挥出更大的优势。为此,他们决定发展自己的芯片设计业务。

2015年,亚马逊以未公开的金额收购了一家来自以色列的初创芯片公司Annapurna Labs,而这时的Annapurna Labs甚至没有任何公开的产品,但亚马逊很明显看中了他们在服务器芯片上的开发实力。果不其然,2015年起,带有Annapurna Labs标志的ASIC芯片开始出现在Project Nitro中,只不过大部分ASIC芯片都只是作为网络/存储卸载卡上,每个实例的硬件主体大部分还是英特尔的x86 CPU。

2018年,第一代AWS Graviton面世,作为亚马逊自研的ARM服务器CPU方案,基于该处理器的实例在使用成本上要低于基于x86的方案,收获了不少用户的同时,也扩展了ARM的云端开发生态。这之后公布的第二代与第三代AWS Graviton,都为通用工作复杂提供了更高的性价比。

之所以有这么快的迭代速度,与亚马逊以IP为导向的设计路线有关。以AWS Graviton2和Graviton3为例,这两者分别运用了ARM Neoverse N1和Neoverse V1的方案,并不需要亚马逊像Ampere Computing这样的服务器芯片厂商一样,开始考虑自研ARM IP。

AI/ML带来的新一波热潮提供通用计算托管平台的亚马逊也没有止步于此,他们看上了新的市场,那就是AI/ML。作为“新电力”的人工智能正在为各个行业带去新的生机,但所需的算力也成了转型过程中最大的难题。最初大家指望用CPU来解决AI算力的问题,然而面对全新的计算方式,CPU很快就显得心有余而力不足。

但要去做GPU需要的技术积累可不少,市面上也只有英伟达的GPU在AI/ML上打出了名号,所以亚马逊和许多AI芯片初创公司一样,还是打算从ASIC上出发,推出了Inferentia和Trainium这两款推理和训练芯片。

不过Inferentia和Trainium与Graviton的定位是一样的,亚马逊并不指望从性能上打败如日中天的GPU,而是希望提供一个成本更低延迟更低并支持更多算法的方案,继续发挥云服务在即用即付这一高性价比商业模式上的优势。

与此同时,亚马逊作为全球市占比第一的云服务厂商,单靠自己的硬件是没法实现这样的地位的,所以无论是英伟达的GPU还是英特尔Habana Labs的AI加速器,亚马逊也都有合作部署。

即便Inferentia和Trainium带来了一定的成本和功耗优势,但要想打破当下以GPU主导的AI/ML生态,还面临着不少挑战,英伟达的CUDA已经打造了一个相当庞大的开发社区,要想让开发者迁移到ASIC硬件上,还有庞大的移植工作需要完成。这也是为何亚马逊的Annapurna Labs部门目前开放的100多个职位中,硬件开发的其实只有10多位,余下的大部分还是软件开发岗,大部分AI芯片初创公司也在面临着这类困境,并非独此一家。

结语在大部分服务器CPU、AI/ML加速器初创公司眼中,直接把硬件卖给各大数据中心和互联网公司并不是唯一的销售途径,能傍上亚马逊、谷歌和阿里巴巴这样的大腿不仅能盈利,还能提高自己产品的普及程度。

这也是为何Ampere Computing的Altra处理器开始陆续出现在Azure、谷歌云和阿里云等平台上,云服务平台自研芯片归根结底还是为了提供性价比更高的方案,但他们的客户还在猛增阶段,只靠闭门造车肯定是没法扩大市场份额的,拥抱更大的硬件生态才能实现共赢。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 虚拟化技术
    +关注

    关注

    1

    文章

    49

    浏览量

    13020
  • 开源
    +关注

    关注

    3

    文章

    3099

    浏览量

    41982
  • 云服务
    +关注

    关注

    0

    文章

    781

    浏览量

    38750
  • 亚马逊
    +关注

    关注

    8

    文章

    2591

    浏览量

    82765

原文标题:亚马逊作为第一云服务商在芯片上的投入

文章出处:【微信号:elecfans,微信公众号:德赢Vwin官网 网】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    电感的电流能否分流给另一个电感

    电感的电流能否分流给 另一个电感,这个问题涉及到电感器的工作原理、特性以及在电路中的应用。 电感器的基本概念 电感器是 种被动电子元件,其主要功能是存储能量。电感器由 或多个导线绕成的
    的头像 发表于08-21 10:02 78次阅读

    虚拟机数据恢复—KVM虚拟机被误删除的数据恢复案例

    虚拟机数据恢复环境: Linux操作系统服务器,EXT4文件系统。服务器中有数台 KVM 虚拟机。 虚拟机1:主数据库服务器 虚拟磁盘
    的头像 发表于08-07 13:33 91次阅读
    <b class='flag-5'>虚拟</b>机数据恢复—<b class='flag-5'>KVM</b><b class='flag-5'>虚拟</b>机被误删除的数据恢复案例

    服务器数据恢复—误删除KVM虚拟机的数据恢复案例

    1台服务器,Linux操作系统+EXT4文件系统,部署了数台 KVM 虚拟机,每台 虚拟机包含 qcow2格式的磁盘文件,和
    的头像 发表于06-17 15:10 183次阅读
    服务器数据恢复—误删除<b class='flag-5'>KVM</b><b class='flag-5'>虚拟</b>机的数据恢复案例

    服务器数据恢复—KVM虚拟机raw格式磁盘文件数据恢复案例

    服务器数据恢复环境: 台服务器安装Linux操作系统+EXT4文件系统。服务器上运行数台 KVM 虚拟机,每台 虚拟机包含
    的头像 发表于05-17 13:33 266次阅读
    服务器数据恢复—<b class='flag-5'>KVM</b><b class='flag-5'>虚拟</b>机raw格式磁盘文件数据恢复案例

    虚拟机数据恢复—EXT4文件系统下KVM虚拟机数据恢复案例

    虚拟 数据恢复环境&故障: KVM是Kernel-based Virtual Machine的简称,是
    的头像 发表于04-17 14:22 242次阅读
    <b class='flag-5'>虚拟</b>机数据恢复—EXT4文件系统下<b class='flag-5'>KVM</b><b class='flag-5'>虚拟</b>机数据恢复案例

    在tc275上怎么用核触发另一个核产生软中断?

    在tc275上怎么用 核触发 另一个核产生软中断?
    发表于02-19 08:14

    KVM矩阵的智能管理:提升运维效率与安全性

    管理如何助力企业实现运维效率与安全性的双重提升。 KVM矩阵的智能 管理概述 KVM矩阵的智能 管理是指通过集成先进的
    的头像 发表于02-18 14:51 314次阅读

    KVM矩阵:数据中心虚拟管理的关键组件

    将探讨 KVM矩阵在数据中心 虚拟 管理中的应用和重要性。 KVM矩阵与数据中心 虚拟
    的头像 发表于02-18 14:38 354次阅读

    如何使用BLE将数据从PSOC发送到另一个PSOC?

    我有 PSOC 板(我正在使用 CY8CPROTO-063-BLE )采样数据,我想通过 BLE 将其发送到 另一个PSOC 板。 我需要以 1.024 Mbit/sec 的速率传输数据(我正在
    发表于01-29 07:53

    路由器是干什么用的 路由器怎样桥接另一个路由器

    路由器是 网络设备,用于将数据包从 网络传输到 另一个网络。它通过控制数据包的路径来实现互联网上多个网络之间的通信。路由器在家庭、办公室和
    的头像 发表于01-19 17:12 956次阅读

    电源的正接到另一个电源的负会怎样?为什么?

    电源的正接到 另一个电源的负会怎样?为什么? 当 电源的正极连接到 另一个电源的负极时,会发
    的头像 发表于01-16 11:06 2010次阅读

    KVM是什么?KVM线缆的应用KVM网线怎么连接

    KVM是什么? KVM线缆的应用 KVM网线怎么连接 KVM(Keyboard, Video, Mouse)是 种用于实现远程管理的硬件设备
    的头像 发表于11-28 14:28 1720次阅读

    技术推荐 |开源嵌入式虚拟技术释放 x86 平台潜能 实现智能驾驶舱、工业负载整合等场景产品

    驾驶舱、工业领域的工作负载整合等。 为什么嵌入式系统需要 虚拟 技术 虚拟 技术尤其是
    的头像 发表于11-24 20:00 695次阅读
    <b class='flag-5'>技术</b>推荐 | <b class='flag-5'>开源</b>嵌入式<b class='flag-5'>虚拟</b><b class='flag-5'>化</b><b class='flag-5'>技术</b>释放 x86 平台潜能 实现智能驾驶舱、工业负载整合等场景产品<b class='flag-5'>化</b>

    如何把函数的参数指向另一个函数?

    就是有 平均值滤波函数filter(); 另一个函数getADC(); 大概结构如下: filter() { for() { vlaue=getADC(); } } 因为要求平均值
    发表于11-08 06:52

    AR/VR:呈现在眼前的另一个世界

    与同伴们进行交流 。 新的科技将开拓智能生活的未来。 元宇宙是在数字空间扩展的 另一个世界。进入元宇宙离不开小巧轻便且能够投射高分辨率图像的成像设备。 TDK的超小型全彩激光模块就是可通过AR/VR智能眼镜显示图像的设备。这些模块可
    的头像 发表于10-25 15:50 377次阅读
    AR/VR:呈现在眼前的<b class='flag-5'>另一个</b>世界