1 Why need Deployment?
K8S中Pod是用户管理工作负载的基本单位,Pod通常通过Service进行暴露,因此,通常需要管理一组Pod,RC和RS主要就实现了一组Pod的管理工作,其中,RC和RS的区别在于,RS提供更加高级的选择器(RS支持基于集合的选择符)。
在实际生产环境中,应用在初次部署完成后,当测试正常才会对外提供服务,之后就都是升级操作,而升级过程中,意味着删除老的Pod,并创建新的Pod。对于RS而言,如果需要升级Pod的镜像,可以使用kubectl edit修改RS中的Pod的镜像,或者直接修改RS的资源文件,然后执行kubectl apply,但是,这样做的话,会使得服务在短期内的不可用。虽然Service可以保证请求只路由到ready的Pod,并且RS会按照一定的策略删除老的Pod,然后再创建新的Pod,但是,在删除和创建的过程中可能无法保证服务的正常:无法保证永远有Pod在ready状态;无法保证有一定数量的Pod在处理请求。
为了解决服务更新的问题,K8S在RS的基础上提供了Deployment,它最大的特点是提供了滚动升级的能力,并且可以控制升级的速率,使得升级过程中可以正常提供服务,因此,通常都是使用Deployment,而不是RC或者RS。
2 Problem of ReplicaSet
设想一下,在只有RS的情况下,如何进行滚动升级,当然,在设计滚动升级流程之前必须要明确几个目标:
- 升级过程中有固定数量的Pod提供服务
- 为了保证服务不发生抖动,给定灰度的时间,可以减缓升级的速率
- 如果升级过程中发现请求处理异常可以及时回退
为了实现这些目标,在只有RS的情况下,你可能会这么做(假设RS的replicas为3):
- 用新的Pod的template创建新的RS,然后在RS的selector中新增标签,假设为A,并且RS的replicas设置为0
- 在原来的RS的selector和Pod中都加一个标签,假设为B,这样的话,这些Pod就只被老的RS管理,并通过Service对外暴露
- 将老的RS的replicas减1,新的RS的replicas加1,现在,old_replicas=2,new_replicas=1,并且由于A、B的存在,新老RS只管理各自的Pod,互不干扰,而这些Pod都可以被Service选择
- 此时,Service的Pod同时有新老两个版本,这时候就可以通过监控查看成功率,如果没有问题,等待一段时间(相当于灰度时间)
- 确认新的Pod没有问题,继续升级:老的RS的replicas继续减1,新的RS的replicas继续加1,现在old_replicas=1,new_replicas=2,继续关注监控指标
- 继续升级:old_replicas=0,new_replicas=3,此时,所有的Pod都升级到了新版本
升级过程中总是有3个Pod提供服务,如果升级过程发现异常,可以直接修改old_replicas进行回退,同时,为了持续观察新的Pod的情况,在新的Pod创建完成后,不是立刻就对外提供服务,而是会等待一段时间,用于观察请求成功率,从而决定是否继续进行升级。
上面的过程比较复杂,而且灰度期间如果有问题,需要人工回滚,为了解决滚动更新的问题,K8S提供了Deployment,相比于ReplicaSet,它最大的优势就是滚动更新。
3 What is Deployment
从基础字段上看Deployment跟ReplicaSet没有任何区别,都是在Pod的基础上增加replicas字段,保证副本的数量,Deployment的主要功能也是保证副本的数量。但是,为了保证服务的可用性,相比于ReplicaSet,Deployment提供了滚动更新的能力。
Deployment提供的滚动更新跟上面的人工更新过程类似,也是创建额外的RS,然后修改新老RS的replicas值,然后再添加一些策略,例如,是全部一起更新,还是一个接一个的更新。
4 How to use Deployment
由于Deployment要创建多个Pod的副本,因此,Deployment中十分重要的字段就是PodTemplate和副本数:deployment.spec.template、deployment.spec.replicas。
剩下的字段基本都跟升级相关:
- deployment.spec.progressDeadlineSeconds:当Deployment在一段时间内还没有升级成功,则会在deployment.status.conditions中的Progressing设置为False
- deployment.spec.revisionHistoryLimit:保存用于回滚的历史版本数量,默认是10
- deployment.spec.strategy:升级策略,这里有两种策略:Recreate、RollingUpdate。当deployment.spec.strategy.typeRollingUpdate时,表示滚动更新,并且可以设置deployment.spec.strategy.rollingUpdate.maxSurge(最大峰值,升级过程中可以创建出的超过预期pod数量的pod个数)和deployment.spec.strategy.rollingUpdate.maxUnavailable(最大不可用,升级过程中不可用的pod的数量,可以使用数字和百分比)。当deployment.spec.strategy.typeRecreate时,会干掉所有pod,当所有pod被干掉后,再创建新的pod。
kubectl create deployment --image=nginx my-nginx
上述语句创建了一个nginx的deployment,副本数和升级策略都是用的默认值:replcas=1,maxSurge=25%,maxUnavailable=25%。
4.1 Deployment相关资源和字段解释
kubectl get deploy my-nginx
上述命令可与查看该deployment,输出的结果中有三个重要字段:
- READY:就绪的pod数量,
- UP-TO-DATE:pod的定义与deployment中的Pod模板相同的pod的个数
- AVAILABLE:可用的pod数量
4.2 Deployment的升级
Deployment通常通过更新镜像进行升级:
kubectl set image deploy my-nginx nginx=nginx:1.9.1
kubectl annotate deploy my-nginx kubernetes.io/change-cause="set nginx to 1.9.1"
上述语句先更新my-nginx这个Deployment的nginx容器的镜像,再使用annotate设置变更的原因,最后可以使用kubectl rollout status deploy my-nginx
查看更新状态。
执行kubectl describe deploy my-nginx
可以查看更新过程:
同时可以查看历史版本:
这里的CHANGE-CAUSE就是上面设置的annotate,另外,这里需要注意的是,这里只会保存不重复的版本,如果用两个镜像交替更新,这里只会保存两个版本。
4.3 Deployment的回滚
当升级过程中出现问题,如果是升级过程就卡主了,例如,pod没起来,或者拉取镜像失败,老的pod不会被干掉,此时也不会有啥问题。如果是程序的bug造成的问题,通过监控或者其他方式验证发现了问题,可以对Deployment进行回滚。
kubectl rollout undo deploy my-nginx
此时,deployment会回到上个版本,并且在rollout history中可以看到之前的版本换到了最新版本,版本号加1:
当然,也可以回滚到指定版本:
kubectl rollout undo deploy my-nginx --to-revision=3
4.4 Deployment的手动缩放
当pod数量不够或者过多时,可以手动修改Deployment的replicas配置:
kubectl scale deploy my-nginx --replicas=3
收到将Deployment的副本数设置为3。
5 小结
Deployment作为k8s中无状态部署的最常用的资源,所有的业务逻辑层的高可用和负载均衡都会用它来部署。当Deployment资源已经创建后,可以通过kubectl set image
和kubectl scale
更新镜像和副本数,还能够使用kubectl rollout undo
进行回滚,同时,可以使用kubectl rollout history
查看历史版本。