11、Kubernetes - 实战:Kubernetes Mysql Operator方案对比

一、前言

在生产环境中,业务对于mysql的需求存在两个不同层次的需求:一种是存小部分业务数据,低负载的访问,第一要求是数据的安全性;第二种是存大量业务数据,复杂业务查询场景。对于第二种需求,需要高性能的mysql集群加专业的数据库运维才能满足业务需求,类似于vitess这样的专门为大规模mysql集群辅助系统;对于第一种需求,考虑到业务需求和资源性价比,可以使用部署在Kubernetes的集群的mysql来提供服务。

考虑到数据库复杂的运维需求,使用Kubernetes operator模式是比较好的一个选择。在网站https://github.com/operator-framework/awesome-operators上列举了5个mysql operator:

截止2020年5月为止,其中#1、#2、#4已经一年甚至两年以上都没有更新了,#3和#5还在正常更新中。其中#3是一主多从的模式,主从进行异步/半同步同步(可用性和分区容忍性,并不保证数据一致性),使用github的orchestrator进行选主和切换管理;而#5是使用多主模式,借助Galera Lib进行同步完整复制(强调数据一致性和可用性),使用ProxySQL进行ingress控制。

二、Presslabs Mysql Operator方案分析

2.1 方案架构

在presslabs的mysql operator方案中:

  • 部署的MySQL Operator运行的POD由两个container组成:一个是operator container,用来响应CRD部署请求(包括创建集群、创建备份等动作:MySQLCluster、MySQLBackup、MySQLScheduledBackup);另一个是orchestrator container,用来管理mysql集群实例master的选举。
  • Operator会响应MySQLCluster这个CRD的创建请求,建立一个statefulset,每个POD包含6个container(init-mysql、clone-mysql、operator-sidecar、pt-heartbeat-sidecar、metrics-exporter、Percona Container)。
  • Percona DB的备份工作可以通过MySQLBackup或者MySQLScheduledBackup CRD进行,可以使用OSS作为备份的目的地。
  • 每个POD直接运行了metrics的导出服务,可以直接使用promethes收集数据库的运行状态。

2.2 功能特点

这个mysql集群operator方案的特点如下:

  • 异步/半同步复制
  • 集群自愈
  • 读高可用
  • 一定条件下写高可用
  • 自动发现和避免同步延迟
  • 自动备份和恢复(现在备份支持通过access key备份到公有云Vendor的OSS,但是不支持PV等方式)

根据项目在github发布的v1.0 Roadmap,灵活配置备份策略、ProxySQL基础、MySQL8.0的支持、SSL支持等功能还在规划中。

参考文档:

2.3 集群的HA方案

Presslabs MySQL Operator使用github维护的orchestrator进行集群的HA管理,它提供了如下功能:

  • 服务发现:发现MySQL节点的基本信息,例如replication状态、配置情况等
  • 拓扑重构:可以通过命令/UI进行快速的replication拓扑结构的编排,例如可以快速将一个slave mysql节点的复制来源从master改成另外一个slave
  • 服务自愈:通过比较强大的算法和策略,保证服务的自愈,在github官网,开发者使用了“holistic”这个词表明了他们对这个功能的自信,并且号称要解决“false positives and false negatives”问题,很少HA系统敢哪怕声称要挑战这个问题,更不用说解决了

github声称除了代码和版本,其它的操作动作比如commit、issues、reviews、新建用户或者仓库等都是通过mysql进行持久化的。所以他们是重度依靠orchestrator进行mysql的HA保障的。当然,人家也说的很清楚,不同业务的HA需求是不一样的,比如他们在设计HA方案的时候,考虑的是如下一些问题,可以给大家一些启发(为了原汁原味,将原文附上):

  • How much outage time can you tolerate?
  • How reliable is crash detection? Can you tolerate false positives (premature failovers)?
  • How reliable is failover? Where can it fail?
  • How well does the solution work cross-data-center? On low and high latency networks?
  • Will the solution tolerate a complete data center (DC) failure or network isolation?
  • What mechanism, if any, prevents or mitigates split-brain scenarios (two servers claiming to be the master of a given cluster, both independently and unknowingly to each other accepting writes)?
  • Can you afford data loss? To what extent?

以上这些准则也可以为我们设计其它业务系统的可用性提供参考。

2.4 成本和性能

据Presslabs的分析和测试,使用他们的WordPress托管服务的客户,99%以上的case对于数据库的QPS需求在100以下,原来配给WordPress的标准配置是使用1CPU的Google Cloud SQL服务,QPS最高在3000左右,价格在$50/月;而使用Kubernetes部署的MySQL,2CPU配置的worker节点价格同样也是$50/月,但是通过MySQL Operator在Kubernetes部署MySQL服务,在一个节点上stack了5组MySQL服务 ,每个的QPS在1000左右,足以满足客户的需求,并使得5组MySQL服务的总体成本从$250/月下降到$50/月:

从这里也可以看出来,上云和云原生并不是基础设施成本控制的银弹,将业务需求和技术能力灵活结合,才能做到对症下药,将吹过的牛B落到实处。对此,Presslabs的CEO还感觉良好的说了以下的话:

参考文档:

三、Percona XtraDB Clustser (PXC) Operator方案分析

3.1 Percona XtraDB集群(PXC)方案介绍

PXC是兼容MySQL的开源数据库方案,它的架构如下:

PXC集群的组成如下:

  • PXC节点
  • ProxySQL代理
  • PMM,监控和管理服务器
  • 持久化和备份存储

PXC具有以下特点:

  • 同步复制,强数据一致性
  • 多主复制,多节点可写
  • 通过galera进行多slave并行复制
  • 使用ProxySQL进行读写管控

3.2 PXC在Kubernetes的部署方案

PXC在Kubernetes的部署方案如下:

在这个部署方案的特点如下:

  • 通过node affinity尽量将PXC node打散到不同的Kubernetes节点
  • 通过PVC进行数据持久化
  • Operator控制器需要向API Server注册PerconaXtraDBCluster CRD并且响应针对这个CRD的创建、删除和更新操作