Karmada 管理有状态应用 Xline 的早期探索与实践

背景与动机

目前随着云原生技术和云市场的不断成熟,越来越多的 IT 厂商开始投入到跨云多集群的怀抱当中。以下是 flexera 在 2023 年中关于云原生市场对多云多集群管理的接受程度的调查报告(http://info.flexera.com)


从 flexera 的报告中可以看出,目前在整个云原生市场中已经有超过 87% 的企业正在同时使用多个云厂商的服务,其中使用单一公有云和单一私有云的仅占13%。而其中使用了多云部署的厂商中则有 15% 的用户选择了多公有云或多私有云部署,而采用了混合云部署的用户比例则达到了 72%。这些统计数据都从侧面反映了云原生技术和云市场的不断成熟,未来将会是编程式多云管理服务的时代。

除了外部趋势以外,单一集群下的局限性也成为了推动用户拥抱多云多集群管理的一个内在动力。单集群部署的局限性包括但不限于:

  • 单点故障,难以容忍集群级别的故障,小的集群联邦优于大的 K8s 集群
  • 单集群的边界限制,例如一个 Node 默认只有 110 个 Pod,一个集群最多容纳 5000 个 Node
  • 业务层面上的发展需要,例如 Xline 本身作为一款跨集群的分布式键值存储
  • ....

Karmada 作为一款开源的多集群管理工具,已经被 Shopee、DaoCloud 等公司应用在了生产环境中。但由于 Karmada 目前缺少对有状态应用管理的支持,因此应用实践上主要还是以无状态应用的管理为主。

为了更好地应对未来多云多集群管理的趋势,在多云多集群场景下更好地管理有状态应用,Xline 和 Karmada 社区成立了工作小组,共同推进 Karmada 对有状态应用管理的支持。

Karmada 管理有状态应用存在哪些挑战?

要理解 Karmada 在多集群下管理有状态应用之前,我们需要先回顾一下 K8s 在单集群下管理有状态应用的实现。

早在 2012 年的时候,Randy Bias 就 “开放和可扩展云架构”进行了有影响力的演讲。在那次演讲中,他提出了 “宠物模式”与 “家畜模式”。


这两种模式分别对应了应用的无状态和有状态。其中,对于家畜模式而言,他们不需要有特定的名字,个体与个体之间也不存在本质的区别,因此,当其中的某个个体出现问题时,我们往往可以直接使用另外一个个体来代替它。而对于宠物模式来讲,每个个体都需要有一个特定的名字(标识符),每个个体都是独一无二的,因此当其中的某个个体出现了问题时,你需要进行特殊的照顾,以便帮助它恢复健康。

而 K8s 在 1.5 版本中首次引入了 StatefulSet 这一 API 对象,并在 1.9 版本中稳定可用的状态。目前已经被广泛应用于运行有状态应用。它为所管理的 Pod 提供了固定的 Pod 身份标识,每个 Pod 的持久化存储以及 Pod 之间严格的启停顺序。

那么问题来了,有状态的应用到底有哪些状态,而 K8s 的 StatefulSet 又是如何初步解决有状态应用的状态问题?
 



而在 Karmada 多集群场景下,有状态的应用则带来了如下的问题:

  1. 如何保证跨集群的多个应用实例能够有一个全局统一的启停顺序,这对一些应用实例的 scale in/out 和滚动更新会带来影响。对于一个基于共识协议的分布式 KV 存储来讲,scale 的过程需要经过 membership change,其中会涉及到集群中 majority 修改的判定。如果缺少全局统一的顺序保证,多个 member cluster 同时进行 scale out,则会对共识协议达成共识的行为带来正确性上的影响
  2. 如何保证跨集群的所有应用都有全局唯一的实例标识,一个自然的解决方案便是将 member cluster id 一起纳入到实例标识当中
  3. 如何解决跨集群的应用通信问题,以及提供全局统一的网络标识。目前,在我们的尝试和实践当中,我们通过 submariner 来打通多个 member cluster 之间的网络通信。目前的实现方式上依赖了某个具体的网络插件
  4. 如何解决跨集群的有状态应用的更新、以及扩缩容等常见的功能,提供更细粒度的更新策略,例如在 member cluster 中实现如 Partition Update 的功能


为了更好地解决上述提到的问题,需要在 Karmada 上引入新的 Workload 来实现跨集群版本的 “StatefulSet”。

Xline 的一些早期尝试

由于目前 Karmada 社区对新 API 的很多实现细节还没有讨论清楚的前提下,我们对 Xline 在 karmada 下的部署,扩缩容和更新做了一些简单的探索与尝试。方案整体的架构如下:


在整体架构上,目前采用的是一个双层 Operator 的方式,在 Karmada 的控制面上,我们部署了一个 Karmada Xline Operator,由它来负责对定义在 Karmada 上的一些 Xline 资源进行解释和拆分,并将其下发到 member cluster 上。而 member cluster 上的 Xline Operator 在监测到对应的资源被创建出来之后,则会进入到相应的 Reconcile 过程,从而完成相应的操作。

部署

让我们先来看看在单集群下,分布式应用集群的常见部署方法(以 etcd operator 部署 etcd 集群为例)。etcd-operator 部署 etcd 集群可以分为两个阶段:

  1. Bootstrap: 创建一个 etcd 的种子节点,种子节点的 initial-cluster-state 为 new,并制定了唯一的 initial-clsuter-token
  2. Scale out:在种子集群上执行 member add,更新集群网络拓扑,然后启动新的 etcd 节点,新节点中的 initial-cluster 为更新后的网络拓扑,并且 initial-cluster-state 为 existing

然而,在跨集群场景下,由于不同的 member cluster 中的 pod 启动顺序缺少全局统一的启动顺序,不同 member cluster 下的 Xline Operator 会并发执行集群扩充操作,这会对共识协议的成员变更过程带来不利的影响。而为了绕开上述问题,Xline 采用了静态部署的方式,具体过程如下图:


首先,用户需要先在 karmada 上定义好相应的资源来描述跨集群的 Xline 集群的集群拓扑。Karmada Xline Opeartor 在监测到资源被 apply 后,会对资源进行解释和拆分,将其转换为member cluster 上的 XlineCluster 这个 CR 并下发。XlineCluster 这个 CR 当中会包含当前 member cluster 应当创建的 replica 数量,同时也会包含其他集群的 member cluster id 以及对应的 replica 数量。而 member cluster 上的 Xline Operator 在监测到 CR 的创建后,会进入 Reconcile 的过程,利用下发的集群拓扑结构,生成整个 Xline 集群中其他节点的 dns name,并启动 Xline 的 Pod。

在探索的早期,静态部署的方式由于在部署过程中不涉及 membership change,从而绕开了 Karmada 多集群下应用实例缺乏全局统一启动顺序的问题。但软件行业没有银弹,静态部署也是如此,它有如下的一些 trade off。下表是针对动态部署和静态部署在单集群与多集群场景下特点的对比:
 




扩缩容

在 Karmada 下对有状态应用进行 scale in/out 具体可分为两种:
水平 scale in/out —— 移除/增加一个 member cluster,并在其上 scale in/out 节点

  • 垂直 scale in/out —— 在原有的 member cluster 上进行 scale in/out


水平 scale out


如上图所示,整体的过程如下:

  1. 创建好对应的 member cluster,配置好 submariner 网络,并将其加入到 Karmada 中进行管理
  2. 修改 Karmada 上的 Xline 资源,在 member cluster 字段中添加新的记录 member4: 4 表示,要在 member4上扩充 4 个 Xline 的 Pod
  3. Karmada Xline Operator 会将资源进行拆分解释,并下发到 member4 上
  4. member4 上的Xline Operator 在接收到相应资源后,进入对应的 Reconcile 过程,调用 Xline client 执行 member add,达成共识后,将新的 Xline Pod 启动起来,重复上述过程,直到 member4 上 Xline 的 replicas 达到指定数量

垂直 scale out


对于垂直 scale out,其大致过程也如上图所示:

  1. 修改 Karmada 上的 Xline 资源,例如指定 member1 中的 Xline 的 Pod 从 3 扩充到 4
  2. Karmada Xline Operator 会将资源进行拆分解释,并下发到 member1 上
  3. member1 上的 Xline Operator 在接收到资源修改通知后,进入对应的 Reconcile 过程,调用 Xline client 执行 member add,达成共识后,将新的 Xline Pod 启动起来,重复上述过程,直到 member1 上 Xline 的 replicas 达到指定数量


目前,由于 scale in/out 不可避免地会涉及到 membership change 的过程,而在 Karmada 下不同 member cluster 之间缺少必要的同步机制,因此,scale 的过程还是存在局限性:一次水平 scale out 只能扩容一个集群,一次垂直扩容也只能在某个指定的 member cluster 上进行。

滚动更新


对于滚动更新而言,大致的过程如上图所示:

  1. 用户修改 Karmada 上的 Xline 资源,修改其中的 xline 镜像版本
  2. Karmada Xline Operator 会将资源进行拆分解释,并下发到 member cluster 上
  3. member cluster 上的 Xline Operator 在监测到资源发生变化后,会进入相应的 Reconcile 流程,执行滚动更新操作。member cluster 上的更新流程和单集群上的更新没有区别。


目前主要支持的更新方式为默认的滚动更新,但从实际的应用场景来看,至少需要考虑以下两个问题:

  1. 更新的过程当中会涉及旧 Xline 节点的停止和新 Xline 节点的启动,需要有额外的机制来保证更新过程不会产生不可用的问题
  2. 需要支持更多细粒度的更新策略,例如 Partition Update。在多个 member cluster 中,应当优先更新只有 follower 存在的集群,并且在更新 leader 所在的 member cluster 时,还应当将 leader 转移到更新好了的 member cluster 上,以避免极端情况下,leader 因为 Rolling update 而导致频繁下台的情况

总结

鉴于多云多集群管理的发展趋势以及 Xline 本身业务上的特性,Karmada 社区和 Xline 社区目前成立了工作小组,共同推动有状态应用在 Karmada 多集群下的管理。为了更优雅地解决 Karmada 多集群管理有状态应用的问题,我们需要引入新的 Karmada workload。目前,由于 Karmada 社区对于新的 workload 的实现细节还没有达成共识,因此,在早期的尝试阶段,Xline 采用了两层的 Operator 方式,通过 Karmada Xline Operator 对顶层资源进行解释和拆分,并下发至 member cluster,再由 member cluster 上的 Xline Operator 来对资源进行调谐。

通过这样的方式,我们对在 Karmada 上部署 Xline 以及滚动更新做了一些早期的尝试与探索,为未来新的 Karmada StatefulSet workload 的开发与设计做了一些前期的铺垫。

Xline社区会议

为了更全面地向大家介绍Xline的进展,同时促进Xline社区的发展,我们将于2024年3月29日北京时间晚上11:00召开Xline社区会议

欢迎您届时登陆zoom观看直播:
会议号: 813 0547 8985
密码: 520159
会议链接
https://zoom.us/j/81305478985?pwd=PsnbMGQy1ZqxYyd67cAkaGROfnIoQa.1

Xline于2023年6月加入CNCF 沙箱计划,是一个用于元数据管理的分布式KV存储。Xline项目以Rust语言写就。感谢每一位参与的社区伙伴对Xline的帮助和支持,也欢迎更多使用者和开发者参与体验和使用Xline。

GitHub链接:
https://github.com/xline-kv/Xline
Xline官网:www.xline.cloud

Xline Discord: 
https://discord.gg/mJdTjzfD

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/283017.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Flutter Widget:StatefulWidgetStatelessWidgetState

Widget 概念 Widget 将是构建Flutter应用的基石,在Flutter开发中几乎所有的对象都是一个 Widget 。 在Flutter中的widget 不仅表示UI元素,也表示一些功能性的组件,如:手势 、主题Theme 等。而原生开发中的控件通常只是指UI元素。…

Microsoft Edge 中的 Internet Explorer 模式解决ie禁止跳转到edge问题

作为网工,网络中存在很老的设备只能用ie浏览器访问打开,但是win10后打开Internet Explorer 会强制跳转到Edge 浏览器,且有人反馈不会关,为此找到了微软官方的Microsoft Edge 中的 Internet Explorer 模式,可以直接在Mi…

【C语言】自定义类型:结构体

1、结构体类型的声明 struct tag { member - list; //成员 } variable-list; //变量列表 例如描述一本书&#xff1a; struct Book {char name[20];char author[20];float price;char id[13]; }; //分号不能丢 1.1 结构体变量的创建和初始化 #include <stdio.h&…

Orbit 使用指南 08 | 登记注册环境 | Isaac Sim | Omniverse

如是我闻&#xff1a; 在上一个指南中&#xff0c;我们学习了如何创建一个自定义的车杆环境。我们通过导入环境类及其配置类来手动创建了一个环境实例 # create environment configurationenv_cfg CartpoleEnvCfg()env_cfg.scene.num_envs args_cli.num_envs# setup RL envir…

Llama 2 模型

非常清楚&#xff01;&#xff01;&#xff01;Llama 2详解 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/649756898?utm_campaignshareopn&utm_mediumsocial&utm_psn1754103877518098432&utm_sourcewechat_session一些补充理解&#xff1a; 序列化&#xff…

活用 C语言之union的精妙之用

一、union的基本定义 Union的中文叫法又被称为共用体、联合或者联合体。它的定义方式与结构体相同,但意义却与结构体完全不同。下面是union的定义格式: union 共用体名 {成员列表}共用体变量名;它与结构体的定义方式相同,但区别在于共用体中的成员的起始地址都是相同的,…

备考ICA----Istio实验7---故障注入 Fault Injection 实验

备考ICA----Istio实验7—故障注入 Fault Injection 实验 Istio 的故障注入用于模拟应用程序中的故障现象&#xff0c;以测试应用程序的故障恢复能力。故障注入有两种: 1.delay延迟注入 2.abort中止注入 1. 环境准备 kubectl apply -f istio/samples/bookinfo/platform/kube/…

Flask 与小程序 的图片数据交互 过程及探讨研究学习

今天不知道怎么的&#xff0c;之前拿编程浪子地作品抄过来粘上用好好的&#xff0c;昨天开始照片突的就不显示了。 今天不妨再耐味地细细探究一下微信小程序wxml 和flask服务器端是怎么jpg图片数据交互的。 mina/pages/food/index.wxml <!--index.wxml--> <!--1px …

学习添加03(优惠卷)

1.优化卷模块的介绍 整体流程&#xff1a; 优惠卷表设计&#xff1a; 优惠卷范围表设计&#xff1a; 兑换码表设计&#xff1a;

Python核心编程 --- 高级数据类型

Python核心编程 — 高级数据类型 字符串 列表 元组 字典 1.序列 序列&#xff1a;一组按顺序排列的数据集合。 在Python中存在三种内置的序列类型&#xff1a;字符串、列表、元组 优点&#xff1a;可支持索引和切片操作 特点&#xff1a;第一个正索引为0&#xff0c;指…

【vue3.0】实现导出的PDF文件内容是红头文件格式

效果图: 编写文件里面的主要内容 <main><div id"report-box"><p>线索描述</p><p class"label"><span>线索发现时间:</span> <span>{{ detailInfoVal?.problem.createdDate }}</span></p><…

腾讯在GDC 2024展示GiiNEX AI游戏引擎现已投入《元梦之星》中开发使用,展示强大AIGC能力

在近日举行的GDC 2024游戏开发者大会上&#xff0c;腾讯揭开了其AI Lab团队精心打造的GiiNEX AI游戏引擎的神秘面纱。这款引擎依托先进的生成式AI和决策AI技术&#xff0c;为游戏行业带来了革命性的变革。 相关阅读&#xff1a;腾讯游戏出品&#xff01;腾讯研效AIGC&#xff…

hyperf 二十八 修改器 一

教程&#xff1a;Hyperf 一 修改器和访问器 根据教程&#xff0c;可设置相关函数,如set属性名Attribute()、get属性名Attribute()&#xff0c;设置和获取属性。这在thinkphp中也常见。 修改器&#xff1a;set属性名Attribute()&#xff1b;访问器&#xff1a;get属性名Attri…

lora-scripts 训练IP形象

CodeWithGPU | 能复现才是好算法CodeWithGPU | GitHub AI算法复现社区&#xff0c;能复现才是好算法https://www.codewithgpu.com/i/Akegarasu/lora-scripts/lora-trainstable-diffusion打造自己的lora模型&#xff08;使用lora-scripts&#xff09;-CSDN博客文章浏览阅读1.1k次…

什么是RabbitMQ的死信队列

RabbitMQ的死信队列&#xff08;Dead Letter Queue&#xff0c;简称DLQ&#xff09;是一种用于处理消息失败或无法路由的消息的机制。它允许将无法被正常消费的消息重新路由到另一个队列&#xff0c;以便稍后进行进一步处理、分析或排查问题。 当消息对立里面的消息出现以下几…

python网络相册设计与实现flask-django-nodejs-php

此系统设计主要采用的是python语言来进行开发&#xff0c;采用django框架技术&#xff0c;框架分为三层&#xff0c;分别是控制层Controller&#xff0c;业务处理层Service&#xff0c;持久层dao&#xff0c;能够采用多层次管理开发&#xff0c;对于各个模块设计制作有一定的安…

利用API打造卓越的用户体验

&#x1f34e;个人博客&#xff1a;个人主页 &#x1f3c6;个人专栏&#xff1a;日常聊聊 ⛳️ 功不唐捐&#xff0c;玉汝于成 目录 正文 1. 数据驱动的设计 2. 功能扩展与整合 3. 实时性与响应性 4. 个性化推荐与定制化服务 结语 我的其他博客 正文 随着数字化时代的…

如何让电脑定时开机?这个方法你一定要学会

前言 前段时间小白在上班的时候&#xff0c;个人使用一台台式机和一台笔记本电脑。台式机并不是经常使用&#xff0c;但整个公司的数据中心是建立在小白所使用的那台台式机上。 如果台式机没有开机&#xff0c;同事们就没办法访问数据中心获取自己想要的资料。领导也没办法链…

4核16G服务器租用优惠价格,26.52元1个月,半年149元

阿里云4核16G服务器优惠价格26.52元1个月、79.56元3个月、149.00元半年&#xff0c;配置为阿里云服务器ECS经济型e实例ecs.e-c1m4.xlarge&#xff0c;4核16G、按固定带宽 10Mbs、100GB ESSD Entry系统盘&#xff0c;活动链接 aliyunfuwuqi.com/go/aliyun 活动链接打开如下图&a…

Tkinter 一文读懂

Tkinter 简介 Tkinter&#xff08;即 tk interface&#xff0c;简称“Tk”&#xff09;本质上是对 Tcl/Tk 软件包的 Python 接口封装&#xff0c;它是 Python 官方推荐的 GUI 工具包&#xff0c;属于 Python 自带的标准库模块&#xff0c;当您安装好 Python 后&#xff0c;就可…