KubeBlocks 如何降低管理多种数据库的学习门槛

什么是 KubeBlocks

KubeBlocks 是一个开源的 Kubernetes 数据库 operator，能够帮助用户在 Kubernetes 上运行和管理多种类型的数据库。据我们所知，大多数数据库 operator 通常只能管理某种特定类型的数据库，例如：

CloudNativePG、Zalando、CrunchyData、StackGres operator 用于管理 PostgreSQL
Strimzi 用于管理 Kafka
Oracle 和 Percona MySQL operator 用于管理 MySQL

而 KubeBlocks 是一个通用的数据库 operator。这意味着在设计 KubeBlocks API 时，我们并没有将其与某种特定类型的数据库绑定。恰恰相反，我们抽象了各种数据库的通用特性，最终得到了一个通用的、与数据库引擎无关的 API。因此，围绕这个抽象 API 开发的 operator 实现也与具体的数据库引擎无关。

在上图中，Cluster、Component 和 InstanceSet 都是 KubeBlocks 提供的 CRD（Custom Resource Definition）。可参阅 KubeBlocks 概念文档，了解更多细节。

KubeBlocks 提供了 Addon API，支持集成各种数据库。例如，我们目前提供了以下 KubeBlocks Addon，支持各类主流开源数据库引擎：

MySQL
PostgreSQL
Redis
MongoDB
Kafka
RabbitMQ
MinIO
Elasticsearch
StarRocks
Qdrant
Milvus
ZooKeeper
etcd
…

您可参阅 KubeBlocks 支持的 Addon 表格，查看 Addon 及其功能的详细信息。

凭借统一的 API，KubeBlocks 成为在 Kubernetes 上运行多种数据库的绝佳选择，可显著降低掌握多个 operator 所需的学习门槛。

统一的 API 如何降低学习门槛

以下是使用 KubeBlocks Cluster API 编写 YAML 文件并创建一个 MySQL 三副本集群的示例。

apiVersion: apps.kubeblocks.io/v1alpha1
kind: Cluster
metadata:name: test-mysqlnamespace: default
spec:terminationPolicy: DeletecomponentSpecs:- name: mysqlcomponentDef: apecloud-mysqlreplicas: 3resources:limits:cpu: '0.5'memory: 0.5Girequests:cpu: '0.5'memory: 0.5GivolumeClaimTemplates:- name: dataspec:accessModes:- ReadWriteOnceresources:requests:storage: 10Gi

然后，见证奇迹的时刻到了：只需对某些字段进行少量修改，就可以创建一个 PostgreSQL 两副本集群。同样的方法也适用于 MongoDB 和 Redis。Redis YAML 文件稍长一些，因为它创建了两个组件：redis-server 和 sentinel。而且这种方法可以适用于多种引擎。

PostgreSQL

apiVersion: apps.kubeblocks.io/v1alpha1
kind: Cluster
metadata:name: test-postgresqlnamespace: default
spec:terminationPolicy: DeletecomponentSpecs:- name: postgresqlcomponentDef: postgresqlreplicas: 2resources:limits:cpu: '0.5'memory: 0.5Girequests:cpu: '0.5'memory: 0.5GivolumeClaimTemplates:- name: dataspec:accessModes:- ReadWriteOnceresources:requests:storage: 10Gi

MongoDB

apiVersion: apps.kubeblocks.io/v1alpha1
kind: Cluster
metadata:name: test-mongodbnamespace: default
spec:terminationPolicy: DeletecomponentSpecs:- name: mongodbcomponentDef: mongodbreplicas: 3resources:limits:cpu: '0.5'memory: 0.5Girequests:cpu: '0.5'memory: 0.5GivolumeClaimTemplates:- name: dataspec:accessModes:- ReadWriteOnceresources:requests:storage: 10Gi

Redis

apiVersion: apps.kubeblocks.io/v1alpha1
kind: Cluster
metadata:name: test-redisnamespace: default
spec:terminationPolicy: DeletecomponentSpecs:- name: rediscomponentDef: redis-7replicas: 2resources:limits:cpu: '0.5'memory: 0.5Girequests:cpu: '0.5'memory: 0.5GivolumeClaimTemplates:- name: dataspec:accessModes:- ReadWriteOnceresources:requests:storage: 10Gi- name: redis-sentinelcomponentDef: redis-sentinelreplicas: 3resources:limits:cpu: '0.5'memory: 0.5Girequests:cpu: '0.5'memory: 0.5GivolumeClaimTemplates:- name: dataspec:accessModes:- ReadWriteOnceresources:requests:storage: 10Gi

统一的 API 意味着在 Kubernetes 上管理多种数据库变得简单、高效且标准化，这为您节省了大量原本需要花在查找手册和 API 参考文档上的时间。

Key features

创建和销毁数据库集群。
启动、停止和重启数据库集群。
创建集群时，支持选择引擎 Addon 提供的部署拓扑结构，例如，Redis 提供了基于 Sentinel 的读写分离或 Redis 集群拓扑；MySQL 提供了 Proxy 拓扑，可实现读写分离和高可用解决方案，如内置的 Raft 共识插件、外部 etcd 作为协调器，或 Orchestrator。
支持在单个数据库集群中为多个副本分别配置不同的资源。例如，在一个 MySQL 集群中，主实例使用 8 个 CPU，而读副本使用 4 个 CPU。反观 Kubernetes 的 StatefulSet 则不支持这一能力。
灵活的网络管理：
- 以动态的方式将数据库访问端点暴露为服务（ClusterIP、LoadBalancer、NodePort）。
- 支持 HostNetwork。
- 部分数据库支持通过 Smart Client 进行访问，该客户端会根据服务器返回的节点地址，将请求重新定向到其他节点或支持处理读写分离。Redis、MongoDB 及 Kafka 支持 Smart Client 访问模式。此外，部分数据库还支持实现副本间自动故障转移的客户端，如 etcd。对于这些数据库，KubeBlocks 还支持为每个 Pod （Pod Service）分配服务地址。
支持丰富的 Day-2 运维操作：
- 水平伸缩（增加和减少副本数量）
- 变配（调整每个副本的 CPU 和内存资源）
- PVC 卷容量扩展
- 备份和恢复功能
- 配置变更（如果技术上存在可能，也支持热加载）
- 参数修改
- 主备切换
- 滚动升级
- 指定副本下线
- 小版本升级
除了声明式 API 之外，KubeBlocks 还提供了 Ops API，用于在数据库集群上执行一次性运维任务。Ops API 还支持其他功能，如排队、并发控制、进度跟踪和操作回滚。
可观测性：支持与 Prometheus 和 Grafana 集成。
KubeBlocks 提供了功能强大且直观的命令行工具 kbcli，使得在 Kubernetes 上操作 KubeBlocks CRs 更加简单，减少输入命令行的次数。对于熟悉 Kubernetes 的用户，也可以搭配 kubectl 使用 kbcli，用更简单的方式执行运维操作。

部署架构

下图展示了在云环境中部署 KubeBlocks 的典型架构图。

Kubernetes 应部署在节点间可以通过网络相互通信的环境中（例如，在一个 VPC 内）。KubeBlocks operator 部署在专用的命名空间（kb-system）中，而数据库实例则部署在用户指定的命名空间中。

在生产环境中，我们建议将 KubeBlocks operator 与数据库部署在不同的节点上（如果您也安装了Prometheus 和 Grafana，建议同样操作）。默认情况下，KubeBlocks 使用反亲和性规则调度数据库集群的多个副本，实现副本在不同节点上运行，以确保高可用性。用户还可以配置可用区（AZ）级别的反亲和性，以便将数据库副本分布在不同的可用区中，从而增强灾难恢复能力。

每个数据库副本在各自的 Pod 中运行。除了运行数据库进程的容器外，Pod 还包括几个辅助容器：一个名为 lorry 的容器（从 KubeBlocks v1.0 开始将更名为 kbagent），用于执行 KubeBlocks controller 的 Action 命令；另一个名为 config-manager 的容器（从 KubeBlocks v1.0 开始会合并到 kbagent中），用于管理数据库配置文件并支持热更新。此外，数据库引擎 Addon 也可能会有一个 exporter 容器，用于收集 Prometheus 监控所需的指标。