1 下一代ZNS?浅谈FDP在企业级SSD应用前景-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

下一代ZNS?浅谈FDP在企业级SSD应用前景

UnionMemory忆联 来源:未知 2023-10-12 15:55 次阅读

1、从ZNS说起

Zone Namespace(ZNS)在2020年开始广泛讨论,2021年在NVMe协议组织基本定稿发布。ZNS对于存储系统或者云系统,在系统侧可控制IO在SSD内的具体写入位置,通过系统侧的主动垃圾回收(Garbage Collection,简称GC),将SSD内的GC削减到0。一方面,可以减少系统和SSD两层GC带来的写放大和读写冲突,延长盘片使用寿命,也保证系统带宽和QoS。另一方面,由于SSD内基本不需要GC,可以减少SSD内的冗余空间(Over-Provisioning,简称OP),使OP基本减到零,对于SSD内部管理表项也带来简化,从而削减企业级SSD的DRAM

对于系统应用来说,一边能保性能,一边能降成本增寿命,这么两全其美的好处,立即得到了Flash Memory Summit(FMS)、Open Compute Project(OCP)等组织和技术社区热议。但是,技术上只谈好处,不谈开销是不合理的。笔者认为,ZNS主要的开销是在系统侧“做得太多”。

wKgaomUt2hGAXijxAACjHcFxE0o202.png

ZNS要求单个Zone之内的LBA地址,必须是严格顺序追加写的,与SSD写Flash的方式相对应。系统应用的管理粒度需要与Zone大小对齐,按Zone粒度进行写入和回收。这样,使得系统对SSD的操作方式,与SSD操作NAND的方式相符,SSD将Zone粒度映射到NAND的Block粒度,即可达成零GC的操作。

那么问题来了,严格顺序追加写对系统应用带来的约束太大。如果按ZNS定义的传统写方式,系统对单个Zone操作的Queue Depth只能是1,即对一个Zone只能做串行写,这对系统处理的约束很大。后来ZNS增加Append方式和ZRWA方式作为补充,改善了对追加写的约束,系统用起来还是会有些别扭。此外,对于SSD写异常,由于是严格顺序追加,系统也需要与SSD同步出错Zone的写位置,Zone能否继续追加等信息,才能进行后续的策略处理。

SSD要获得零GC收益,必须将Zone粒度和NAND的Block粒度对齐。NAND厂家基于工艺和成本考虑,不同厂家、不同代次的NAND Flash,Block大小均不相同。随着NAND厂家工艺叠层的增加,NAND Block大小持续增大,目前Block大小已基本超过100MB。这已经比系统应用一般的文件或者块管理粒度要大得多。如果系统应用只通过Zone跟单Block对齐,要跑满SSD性能,系统应用还需知道Zone和NAND通道、Die的物理拓扑关系,才能用满NAND并发。如果系统应用希望单Zone能跑满SSD性能,SSD实现需要将多个通道/Die的Block绑定成一个Zone,这样单Zone容量都到达GB级别了。此外,SSD盘内的静态Wear Leveling、NAND Data Retention/Disturb等场景,都需要通知系统进行搬移。

对消费级的单盘系统(如手机、笔记本电脑等),本身存储性能和QoS要求不高,在系统应用算力有剩余情况下,这些约束都可以接受。譬如苹果手机通过类ZNS方式获得了令人惊讶的用户体验。但对于企业级或者云场景的多盘存储系统,情况会更为复杂。存储系统需要考虑多供应、坏盘替换、利旧等场景,很难保证一个存储池内都是同NAND厂家同代次的SSD。这样系统侧就会面对多种Zone粒度的管理,对存储系统进行多备份、EC条带选择、垃圾回收等方面设计考虑,都会变得更为困难。

2、由多流演进而来

2021年,Google带着Flexible Data Placement(FDP)的概念和自研的Smart FTL应用进行宣讲,并联合Meta在2022年逐步把FDP推入到NVMe标准协议。近期,FDP议题在OCP进行了多次演进和讨论,逐步得到业界的重视。同样是为了追求削减SSD GC,降低写放大为目标。FDP和ZNS走的倒是不同的路线。

wKgaomUt2hGAaSt6AAEZ9161FKs394.png

ZNS沿着Open Channel的路线演进,Open Channel方式本身是把NAND Flash操作向系统应用呈现,通过系统直接控制NAND Flash操作来极大化利用NAND。这样的问题是,系统应用需要知道SSD上的NAND具体操作方式和物理拓扑,NAND代次演进和厂家差异,系统应用也需要进行适配。ZNS是在这基础上进行一层抽象,抽象成Zone粒度和追加写方式,把NAND Flash具体操作和粒度进行了一层屏蔽。

Multi-Stream多流则是在标准命令接口上,添加数据的冷热度标识,由SSD对数据进行分类存放和GC,来减少SSD的写放大,这对系统就容易适配多了。SSD在支持多流情况下,也是需要做GC的,这样只能一定程度的削减OP,譬如从3DWPD盘改为1DWPD盘就能符合系统应用;另外,系统应用层面的GC和SSD层面GC冲突,会带来QoS不利影响。后来IO Determinism主要在于通过NVM Set对SSD空间进行划分和性能隔离,通过Deterministic Window (DTWIN)和Non-Deterministic Window (NDWIN)的机制交互,让系统应用知道SSD的NVM Set的QoS状态,系统按一定规则可以得到确定性时延。与Open Channel路线相比,多流路线更看重系统和SSD盘片的解耦,以及系统应用的向下兼容。由此也更容易获得系统应用的支持和落地。FDP就是在此路线上做进一步精细化演进。

3、FDP是什么

wKgaomUt2hGAFAyTAACTiQnHVrY645.png

从FDP的操作模型来看,FDP是在IO写命令上,使用Directive Specific (DSPEC)字段(也是stream标识字段),来标识Reclaim Group和Placement Handle。Placement Handle在SSD内映射到Reclaim Unit Handle。这协议一下子就整了很多名词,实际上,FDP在SSD内就是围绕Reclaim Group和Reclaim Unit进行操作。

SSD可以将并发NAND拓扑划分为多个Reclaim Group,做成Reclaim Group间性能隔离。将SSD内的NAND物理block(或者Super block),划为Reclaim Unit。那么,Reclaim Unit Handle指向不同的Reclaim Unit,可以理解成写入不同的NAND物理block的写指针。从系统应用看来,就是在标准IO写时,通过DSPEC标识,指定写入到特定性能隔离区域Reclaim Group里面,放置到按类别(不同业务类型或者冷热度)区分的Reclaim Unit(即NAND block)。

与ZNS不同,FDP的写方式并没有与Reclaim Unit对齐,而且FDP是允许SSD盘内GC的。这样,SSD盘片在NAND异常处理的主动权就大得多。FPD定义Reclaim Unit Open时间,超过时间会造成Reclaim Unit切换。而且,SSD盘内由于异常处理等原因造成的Reclaim Unit切换都要事件上报。这样看,FPD就是要求更严格的多流或者IOD模式。

但是,FDP通过一些机制,避免与系统应用GC冲突,尽量减少SSD盘内GC。FDP定义Estimated Reclaim Unit Time Limit (ERUTL),用于表示Reclaim Unit写入后到被SSD盘内主动回收的时间。在未到时间前,系统应用主动回收,就不会触发SSD盘内GC。事实上,对系统应用中的热数据或者前台写入数据,在一定时间内系统应用进行整理回收。而系统中的冷数据,系统应用不会搬移,SSD内部会根据NAND特性主动进行GC和Wear Leveling。对于SSD应用能力较强的系统,可以通过感知Reclaim Unit粒度,根据Reclaim Unit制定系统GC策略,从而获得更好的效果。FDP通过与系统间的模糊策略交互,使SSD盘只有弱GC,减少写放大,降低SSD盘的OP。同时也减少系统和SSD两层GC冲突,保障系统侧的时延和QoS。

OCP的会议观点中认为,FDP具有比较好的向后兼容能力:1)FDP可以在标准设备中激活;2)应用在不理解FDP的情况下也可获得收益;3)理解FDP的应用可以获得更多收益。不修改应用情况下,将不同应用或者不同Namespace分配到不同Reclaim Unit Handle即可获得收益。

wKgaomUt2hGAWNZEAADTbHlkYpw056.png

FDP的提案TP4146已经在2022年底通过NVMe正式批准。FDP也在逐步合入Linux Kernel、xNVMe等各大开源平台中(如下图),接下来就看应用软件对接的发展了。

wKgaomUt2hGAMRb5AAHNF3-vOMQ429.png

4、结语

西部数据专家Dave Landsman在OCP会议研讨中,给出的FDP和ZNS的比较如下:

wKgaomUt2hKAGeV5AAB1oavY6ro604.png

如何获得系统最大收益,系统和SSD盘间如何解耦。在系统和SSD盘片垂直整合发展过程中,这两个问题如何权衡,如何获得一个更好的平衡点。在技术界会伴随FDP和ZNS的演进,继续讨论下去。

5、参考文献

  • TP4146a Flexible Data Placement, NVMe

  • NVM Express Zoned Namespace Command Set Specification, NVMe

  • SmartFTL SSDs, OCP Global Summit 2021

  • Flash Innovation: Flexible Data Placement, OCP Global Summit 2022

  • Flexible Data Placement using NVM Express Implementation Perspective, OCP Global Summit 2022

  • Flexible Data Placement from the NVM Express Perspective, OCP Global Summit 2022

  • Flexible Data Placement, 2023 OCP Storage Tech Talks

wKgaomUt2hKAV-9qAABbOPPgAIU276.jpg

长按识别关注更多忆联资讯

了解更多:

NAND Flash 原理深度解析(上)

NAND Flash 原理深度解析(下)

新盘入手必读|四款主流固态硬盘检测工具科普


原文标题:下一代ZNS?浅谈FDP在企业级SSD应用前景

文章出处:【微信公众号:UnionMemory忆联】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    13

    文章

    4296

    浏览量

    85796
  • SSD
    SSD
    +关注

    关注

    21

    文章

    2857

    浏览量

    117366

原文标题:下一代ZNS?浅谈FDP在企业级SSD应用前景

文章出处:【微信号:UnionMemory忆联,微信公众号:UnionMemory忆联】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    AI驱动存储需求激增,企业级SSD市场迎来国内厂商崛起

    随着人工智能(AI)应用的迅速普及,市场对高性能、高可靠性的存储产品的需求日益增长,企业级固态硬盘(SSD)因此受到了前所未有的关注。当前,全球SSD市场主要由五大原厂主导,但在中国,随着AI浪潮的推动,
    的头像 发表于 10-28 14:18 438次阅读

    开放协同 忆联新一代PCIe Gen5企业级SSD携手新华三智算新品持续进化

    多元异构算力平台H3C UniServer G7系列,并搭载忆联新一代PCIe Gen5企业级SSD,全速推进业务创新与数字化变革。 忆联总经理寇朋韬(右4)出席智算新品发布仪式 忆联旗下企业
    的头像 发表于 10-25 18:06 373次阅读
    开放协同 忆联新<b class='flag-5'>一代</b>PCIe Gen5<b class='flag-5'>企业级</b><b class='flag-5'>SSD</b>携手新华三智算新品持续进化

    探索KPM71RUG7T68 SSD企业级存储的可靠选择

    KPM71RUG7T68 SSD款高性能企业级固态硬盘,专为满足数据中心及企业级应用的需求而设计。它采用了先进的NAND闪存技术,提供卓越的读写速度和可靠性,确保
    的头像 发表于 10-22 10:55 233次阅读
    探索KPM71RUG7T68 <b class='flag-5'>SSD</b>:<b class='flag-5'>企业级</b>存储的可靠选择

    KCD81RUG7T68 SSD企业级存储解决方案的卓越选择

    在当今数据驱动的商业环境中,选择款可靠且高效的企业级SSD至关重要。KCD81RUG7T68 SSD凭借其出色的性能和高可靠性,成为众多企业
    的头像 发表于 10-16 10:32 227次阅读

    得瑞领新亮相2024云栖大会,展现企业级NVMe SSD创新实力

    2024云栖大会上,得瑞领新展示了企业级NVMe SSD解决方案云计算、大数据和金融等领域的优势,提升数据处理效率的同时优化了能耗管理,为企业
    的头像 发表于 09-24 15:23 334次阅读
    得瑞领新亮相2024云栖大会,展现<b class='flag-5'>企业级</b>NVMe <b class='flag-5'>SSD</b>创新实力

    忆恒创源发布国产PCIe 5.0企业级NVMe SSD PBlaze7 7A40系列

    9月3日,备受瞩目的ODCC大会上,国内领先的企业级PCIe SSD产品与服务提供商忆恒创源,荣耀发布了其自主研发的PCIe 5.0企业级NVMe
    的头像 发表于 09-04 14:44 569次阅读

    忆联推出企业级SATA SSD UM311b,提供稳定可靠的存储服务

    在当今数字化快速发展的时代,企业级高可靠业务场景对于数据存储的需求日益增强。为了满足这需求,忆联科技近日正式推出了款高性能、高可靠、高性价比的企业级SATA
    的头像 发表于 06-29 11:09 940次阅读

    忆联推出高性能企业级SATA SSD UM311b

    近日,面向企业级高可靠业务场景,忆联推出高性能、高可靠、高性价比的企业级SATA SSD UM311b,该产品可为互联网、运营商等行业客户提供稳定可靠的存储服务。
    的头像 发表于 06-29 10:22 653次阅读
    忆联推出高性能<b class='flag-5'>企业级</b>SATA <b class='flag-5'>SSD</b> UM311b

    聊聊下一代企业级SSD外形EDSFF #EDSFF #SSD #硬盘抽取盒

    硬盘SSD
    ICY DOCK硬盘盒
    发布于 :2024年06月13日 17:15:19

    CNBC对话纳微CEO,探讨下一代氮化镓和碳化硅发展

    近日,纳微半导体CEO Gene Sheridan做客CNBC,与WORLDWIDE EXCHANGE主持人Frank Holland对话,分享了AI数据中心所需电源功率呈指数增长的需求下,下一代氮化镓和碳化硅将迎来怎样的火
    的头像 发表于 06-13 10:30 541次阅读

    赛轮思与NVIDIA合作,利用生成式AI打造下一代车内体验

    AI 驱动的移动出行创新企业与 NVIDIA 合作,打造下一代车内体验。
    的头像 发表于 05-23 10:12 1234次阅读

    江波龙企业级存储产品取得显著市场突破

    自2023年1月江波龙推出企业级存储产品FORESEE ORCA 4836系列NVMe SSD与FORESEE UNCIA 3836系列SATA 3.2 SSD以来,这两款产品已经
    的头像 发表于 02-27 10:40 894次阅读

    江波龙企业级存储正式量产周年,交出亮眼“成绩单”

    自2023年1月江波龙首次发布企业级存储产品FORESEEORCA4836系列NVMeSSD与FORESEEUNCIA3836系列SATA3.2SSD以来,企业级存储产品于过去的年中
    的头像 发表于 02-19 12:56 465次阅读
    江波龙<b class='flag-5'>企业级</b>存储正式量产<b class='flag-5'>一</b>周年,交出亮眼“成绩单”

    江波龙企业级存储正式量产周年,交出亮眼“成绩单”

    自2023年1月江波龙首次发布企业级存储产品FORESEE ORCA 4836系列NVMe SSD与FORESEE UNCIA 3836系列SATA 3.2 SSD以来,企业级存储产品
    发表于 02-06 10:35 284次阅读
    江波龙<b class='flag-5'>企业级</b>存储正式量产<b class='flag-5'>一</b>周年,交出亮眼“成绩单”

    企业级SSD-高性能系列固态硬盘推荐

    除了传统的机械盘HDD,固态硬盘SSD也开始慢慢地企业级硬盘领域发挥重要的作用。由于企业级固态硬盘的价格远远高于机械硬盘,因此固态硬盘在企业级
    的头像 发表于 01-23 16:48 1237次阅读
    <b class='flag-5'>企业级</b><b class='flag-5'>SSD</b>-高性能系列固态硬盘推荐