1 如何快速认识Ceph/CephFS,最简单的方式就是快速应用它-德赢Vwin官网 网
0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何快速认识Ceph/CephFS,最简单的方式就是快速应用它

倩倩 来源:lq 作者:SandaG 2019-09-20 11:33 次阅读

大数据需要大存储,尤其是文件存储,Hadoop组件之一HDFS也因此得到了快速发展。随着AI时代的来临,机器学习对于大存储提出了更高的要求。 分布式、并行、高速、在线扩展、高可用、可靠、安全等等,现代机器学习尤其是深度学习,要做大模型和超大模型训练,要迭代数以TB级别甚至PB级别的样本,要做类似spark的checkpoint,要做动态感知计算和网络环境的调度,等等复杂负载,对文件系统的这些需求逐渐都变成了刚需。

当前比较流行的分布式文件系统,包括HDFS、Ceph/CephFS、Lustre、GPFS、GlusterFS等,各具特点,并应用于一些特定的场景。作为开源项目的佼佼者,Ceph/CephFS因提供了对象存储、块存储、文件系统三种接口,得到了最为广泛的应用。常规的场景中,对象存储可以搭建企业级网盘,块存储可以作为OpenStack/KVM的镜像后端,文件存储可以替代HDFS支持大数据。 在云原生大行其道的今天,Ceph也没有落后脚步。目前已经提供了Kubernetes/Docker存储的原生支持。

了解Ceph的人,大都会认为Ceph是一个相对复杂的系统,尤其当磁盘规模达到千块甚至万块时。Ceph经受住了长时间的应用考验,也说明其架构设计非常之优秀。

在OPPO的机器学习平台里,Ceph也在发挥着极其重要的作用,提供了诸如深度模型 分布式训练、 代码 和 数据共享 、 训练任务容灾 、 模型急速发布 等能力。Ceph的应用场景远不仅如此,但因为Ceph系统太过“复杂”,导致很多架构师或者技术经理不敢轻易触碰。

诚然,采纳和应用一门新技术,向来不是一个简单容易的过程,但认识或者理解一门新技术,对于我们这些混迹于IT和互联网圈的同学,可能从来都不是什么难事儿。

如何快速认识Ceph/CephFS,最简单的方式就是快速应用它 。 如果想要理解它的原理,看代码便是最直接的方式。后面,我们用源码构建并运行一个小型的Ceph,全面感知下Ceph的魅力。对于了解Docker的同学,可以在容器里进行这个尝试。

以下演示如何快速编译并启动一个 管理三块磁盘的 分布式文件系统 。图中Rados Cluster即为构造的Ceph存储集群, CephFS Kernel Client 是实现Linux VFS标准的内核模块,两者通过网络传递磁盘IO。

准备阶段

假设物理机ip为10.13.33.36,新启的容器ip为10.244.0.5

第一步: 准备好编译和运行的操作系统容器

第二步: 在容器内安装编译和运行Ceph的环境依赖库

第三步: 下载Ceph源代码并解压进入代码工程目录

第四步: 依赖准备

第五步: 编译Ceph

第六步: 启动Ceph集群并检查Ceph Cluster状态

第七步:客户端挂载CephFS文件系统

第八步: 客户端检测并使用CephFS文件系统

通过以上简单操作,即使是在未能熟悉mon/mds/osd服务功能,不用了解CRUSH算法原理,不懂cmake和make编译系统的情况下, 也可以快速体验到一个原生的Ceph/CephFS。

上述的Ceph集群虚拟管理了三块disk(filesystem),并通过CephFS接口暴露文件系统接口,客户端主机通过挂载该CephFS到/tmp/oppofs目录,所有读写/tmp/oppofs目录和文件的IO都会通过网络传递给Ceph Rados Cluster,并分发给三块disk。

当disk分布在多个主机时,在不同主机配置并启动相对应的OSD进程即可,每块磁盘的IO都是通过OSD进程进行管理。对Ceph性能和功能有特殊需求的场景,也可以通过直接调整源代码来定制。

Ceph本身具备的能力足以支撑起成千上万块磁盘,但因磁盘数量高速增长引来的其他相关挑战,就需要各位实践者去不断学习和积累相关的知识去应对了。 Ceph作为领先的大数据存储解决方案 , 应用场景将会越来越丰富 。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 磁盘
    +关注

    关注

    1

    文章

    375

    浏览量

    25201
  • 机器学习
    +关注

    关注

    66

    文章

    8406

    浏览量

    132553
  • 大数据
    +关注

    关注

    64

    文章

    8882

    浏览量

    137391
收藏 人收藏

    评论

    相关推荐

    tmp117有快速测试的方法吗?

    项目使用tmp117进行腋下测温时,室温22度,5S内腋下可升温到34度。但再往上上升就是0.01度的速度进行,上升到36.5度需要一二十分钟。 请教下有快速测试的方法吗?
    发表于 12-05 07:08

    电源拓扑快速参考指南

    德赢Vwin官网 网站提供《电源拓扑快速参考指南.pdf》资料免费下载
    发表于 11-13 15:25 1次下载
    电源拓扑<b class='flag-5'>快速</b>参考指南

    基于快速电流环路的PMSM快速响应控制

    德赢Vwin官网 网站提供《基于快速电流环路的PMSM快速响应控制.pdf》资料免费下载
    发表于 08-30 11:01 0次下载
    基于<b class='flag-5'>快速</b>电流环路的PMSM<b class='flag-5'>快速</b>响应控制

    基于DPU的Ceph存储解决方案

    1. 方案背景和挑战 Ceph是一个高度可扩展、高性能的开源分布式存储系统,设计用于提供优秀的对象存储、块存储和文件存储服务。它的几个核心特点是: 弹性扩展: Ceph能够无缝地水平扩展存储容量
    的头像 发表于 07-15 13:44 1300次阅读
    基于DPU的<b class='flag-5'>Ceph</b>存储解决方案

    带你快速认识 HarmonyOS

    国产操作系统HarmonyOS(鸿蒙操作系统)开始进入到大众的视野。鸿蒙寓意为“万物起源”,发展至今已经经过了好几个迭代版本。1.1.1.早期鸿蒙雏形LiteOS2015年5月20日,华为大会上,华为发布最轻量级的物联网操作系统LiteOS。HuaweiLiteOSHuaweiLiteOS是华为面向IoT领域,构建的轻量级物联网操作系统,遵循BSD-3开源许
    的头像 发表于 07-06 08:04 1164次阅读
    带你<b class='flag-5'>快速</b><b class='flag-5'>认识</b> HarmonyOS

    如何快速入门FPGA

    ,即芯片外挂的其他芯片,以便对整个平台有一个全面的认识。 实践项目: 在开发工具中编写自己的工程,实现一些简单的硬件功能,如串口发数等。 通过实践项目来检验自己的学习成果,并查找并补全知识漏洞。 进阶
    发表于 04-28 09:06

    如何快速入门FPGA?

    ,即芯片外挂的其他芯片,以便对整个平台有一个全面的认识。 实践项目: 在开发工具中编写自己的工程,实现一些简单的硬件功能,如串口发数等。 通过实践项目来检验自己的学习成果,并查找并补全知识漏洞。 进阶
    发表于 04-28 08:54

    CW32快速开发入门

    CW32快速开发入门
    的头像 发表于 04-24 18:56 1947次阅读
    CW32<b class='flag-5'>快速</b>开发入门

    Ubuntu系统快速上手

    Ubuntu系统快速上手概述和操作说明
    的头像 发表于 04-12 16:25 535次阅读
    Ubuntu系统<b class='flag-5'>快速</b>上手

    allegro快速入门教程

    德赢Vwin官网 网站提供《allegro快速入门教程.pdf》资料免费下载
    发表于 02-29 09:32 70次下载

    简单认识变压器

    简单认识变压器
    的头像 发表于 01-25 10:05 997次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>变压器

    请问怎样使用cephadm部署ceph集群呢?

    从红帽ceph5开始使用cephadm代替之前的ceph-ansible作为管理整个集群生命周期的工具,包括部署,管理,监控。
    的头像 发表于 01-16 09:32 1453次阅读
    请问怎样使用cephadm部署<b class='flag-5'>ceph</b>集群呢?

    快速入门BlueNRG SDK固件开发流程

    本文档指导用户快速地对 BlueNRG SDK 有一个直观、清晰的认识,了解其软件架构,以便顺利地学会利用 SDK 开发自己的用户固件。
    的头像 发表于 01-13 10:43 1942次阅读
    <b class='flag-5'>快速</b>入门BlueNRG SDK固件开发流程

    简单认识无源器件

    简单认识无源器件
    的头像 发表于 01-12 09:56 589次阅读
    <b class='flag-5'>简单</b><b class='flag-5'>认识</b>无源器件

    UPS电源蓄电池快速充电的改进方法

    UPS电源蓄电池快速充电的改进方法  UPS电源是一种重要的备用电源设备,用于在停电等紧急情况下提供电力。其中,蓄电池是UPS电源的核心组件之一,负责储存和提供电力。然而,传统的蓄电池充电方式存在
    的头像 发表于 01-10 16:50 859次阅读