K8S1.23.5部署（此前1.17版本步骤囊括）及问题记录

查看你对应命名空间下的pod的重启次数

kubectl get pods --namespace=<your-namespace> <your-pod-name> -o=jsonpath='{.status.containerStatuses[*].restartCount}'

应版本需求，升级容器版本为1.23.5

kubernetes组件

一个kubernetes集群主要由控制节点（master）与工作节点（node）组成，每个节点上需要安装不同的组件。

master控制节点：负责整个集群的管理。

ApiServer：资源操作的唯一入口，接收用户输入的命令，提供认证、授权、API注册和发现等机制。
Scheduler：负责集群资源调度，按照预定的调度策略将Pod调度到相应的node节点上。
Controller-Manager：负责维护集群的状态，比如程序部署安排、故障检测、自动扩展、滚动更新等。
Etcd：负责存储集群中各种资源对象的信息。
流程：运维人员通过kuberctl命令行下发部署指令，apiserver接收指令调度shchedule去etcd数据库查看节点信息，然后etcd再反馈给schedule，schedule再将空闲node信息反馈给apiserver，apiserver再调用controllmanager，controllmanager去连接node节点内的组件kubelet，kubelet再次调用（pod控制器）去搭建pod内的容器。

node工作节点：集群的数据平面，负责为容器提供运行环境。

kubelet：负责维护容器的生命周期，既通过控制docker，创建、更新、销毁容器

Docker：负责节点上容器的各种操作

kubeProxy：在node节点对外接收客户端请求

kubernetes概念

Master：集群控制节点，每个集群需要至少一个master节点负责集群的管控

Node：集群工作节点，由master分配容器到这些node节点上，然后node节点上的docker负责容器的运行

Pod：kubernetes的最小控制单元。

容器都是运行在pod中，一个pod中可以有1个或多个容器

Controller：控制器，通过它来实现对pod的管理。

比如启动pod、停止pod、伸缩pod的数量等等

Service：pod对外服务的统一入口，可以维护同一类的多个pod

客户去访问k8s内的服务，由node节点内的kube-proxy组件进行介绍，然后再下发信号给service，由service通过负载均衡分配道某个pod中的docker进行处理。

Label：标签，用于对pod进行分类，同一类pod会拥有相同的标签

NameSpac：命名空间，用来隔离pod的运行环境

kubernetes集群部署方式

kubernetes有很多种部署方式，目前主流的部署方式有kubeadm、minikube、二进制包

kubeadm特点：一个用于快速搭建kubernetes集群的工具
minikube特点：一个用于快速搭建单节点的kubernetes工具
二进制包：从官网下载每个组件的二进制包，依次去安装，安装麻烦

主机设置
mster	192.168.75.129
node1	192.168.75.130
node2	192.168.75.131

kubernetes集群环境准备（三台均需要配置）

1.关闭防火墙并设置防火墙随机不自启

（kubernetes和docker在运行中会产生大量防火墙规则）

[root@master ~]# systemctl stop firewalld
[root@master ~]# systemctl disable firewalld

2.关闭SELinux系统内核安全机制

#临时关闭

[root@master ~]# setenforce 0

#永久关闭

[root@master ~]# vi /etc/selinux/configSELINUX=disabled

3.配置本地yum源

清空yum路径下系统自带的仓库文件

[root@master ~]# rm -rf /etc/yum.repos.d/*

创建挂载点

[root@master ~]# mkdir /mnt/centos

挂载本地iso镜像文件至挂载点目录（临时挂载与永久挂载）

[root@master ~]# mount /dev/cdrom /mnt/centos/

永久挂载

[root@master ~]# vi /etc/fstab

/dev/cdrom /mnt/centos iso9660 defaults 0 0

重加加载/etc/fstab配置文件

[root@master ~]# mount -a

创建本地yum仓库

[root@master ~]# vi /etc/yum.repos.d/local.repo

[local]

name=local_centos

baseurl=file:///mnt/centos

enabled=1

gpgcheck=0

#查看仓库可用软件包

[root@master ~]# yum repolist

4.配置本地主机名与IP地址解析

（为了后面对集群节点的调用，企业中推荐使用内部DNS服务器）

[root@master ~]# vim /etc/hosts

注意：这一步需要改变主机名（举例）

#修改主机名
[root@weiyi001 ~]# hostnamectl set-hostname master#再打开一个bash环境
[root@weiyi001 ~]# bash

测试解析

[root@master ~]# ping node1[root@master ~]# ping node2

5.禁用swap交换分区（kubernetes强制要求禁用）

[root@master ~]# vim /etc/fstab

#/dev/mapper/centos-swap swap swap defaults 0 0

6.修改Linux内核参数，添加网桥过滤器和地址转发功能

#编辑/etc/sysctl.d/kubernetes.conf文件添加如下配置（该文件默认不存在）

[root@master ~]# vim /etc/sysctl.d/kubernetes.conf

net.bridge.bridge-nf-call-ip6tables = 1

net.bridge.bridge-nf-call-iptables = 1

net.ipv4.ip_forward = 1

重新加载配置

[root@master ~]# sysctl --system

加载网桥过滤器模块

[root@master ~]# modprobe br_netfilter

查看网桥过滤器模块是否加载成功

[root@master ~]# lsmod | grep br_netfilter

7.配置ipvs功能

kubernetes中Service有两种代理模型一种是基于iptables的，一种是基于ipvs，两者对比ipvs的性能要高，如果想要使用ipvs模型，需要手动载入ipvs模块

安装ipset和ipvsadm软件

[root@master ~]# yum -y install ipset ipvsadm

#添加需要加载的模块写入脚本文件

[root@master ~]# cat > /etc/sysconfig/modules/ipvs.modules <<EOF
modprobe --ip_vs
modprobe --ip_vs_rr
modprobe --ip_vs_wrr
modprobe --ip_vs_sh
modprobe --nf_conntrack_ipv4  
EOF

设置脚本权限

[root@master ~]# chmod +x /etc/sysconfig/modules/ipvs.modules

执行脚本

[root@master ~]# /etc/sysconfig/modules/ipvs.modules

查看对应的模块是否加载成功

[root@master ~]# lsmod | grep -e ip_vs -e nf_conntrack_ipv4

重新启动系统

[root@master ~]# reboot

检查SELinux是否关闭

[root@master ~]# getenforce

Disabled

#检查swap分区是否关闭

[root@master ~]# free -g

wap: 0B 0B 0B

#设置每台服务器的时区为中国标准时区CST（亚洲/上海）

[root@master ~]# timedatectl set-timezone Asia/Shanghai

#配置时间同步，保证每一个节点时间一致

[root@master ~]# yum -y install chrony

#启动chronyd

[root@master ~]# systemctl start chronyd[root@master ~]# systemctl enable chronyd

#查看时间

[root@master ~]# date

8.安装docker、kubeadm、kubelet、kubectl程序（三台主机都需要安装）

#创建阿里Base源与epel源用于安装依赖包


[root@master ~]# curl -o /etc/yum.repos.d/CentOS-Base.repo https://mirrors.aliyun.com/repo/Centos-7.repo

[root@master ~]# wget -O /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo

#生成yum缓存提高软件下载速度

[root@master ~]# yum makecache

#安装yum-utils软件用于提供yum-config-manager程序

[root@master ~]# yum install -y yum-utils

#使用yum-config-manager创建docker存储库（阿里）

[root@master ~]# yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo

#查看当前镜像源中支持的docker版本

#安装特定版docker-ce，安装时需要使用--setopt=obsoletes=0参数指定版本否则yum会自动安装高版本(我使用的高版本)

[root@master ~]# yum -y install docker-ce-18.06.3.ce-3.el7

#查看docker版本信息

[root@master ~]# docker --version

#创建/etc/docker目录，并在/etc/docker目录下添加一个配置文件

[root@master ~]# mkdir /etc/docker

#Docker默认使用的Cgroup Driver为默认文件驱动，而k8s默认使用的文件驱动为systemd，k8s要求驱动类型必须要一致，所以需要将docker文件驱动改成systemd

[root@master ~]# cat <<EOF > /etc/docker/daemon.json{"registry-mirrors": ["https://aoewjvel.mirror.aliyuncs.com"],"exec-opts": ["native.cgroupdriver=systemd"]}EOF

驱动问题或许会导致master初始化失败（许多问题会导致失败）具体看

K8S集群部署问题及处理记录-CSDN博客https://blog.csdn.net/m0_72264240/article/details/134438973?spm=1001.2014.3001.5502

#启动docker程序[root@master ~]# systemctl start docker#设置docker随机自启[root@master ~]# systemctl enable docker

9.安装kubernetes程序

#创建阿里kubernetes仓库

[root@master ~]# cat <<EOF > /etc/yum.repos.d/kubernetes.repo
[kubernetes]
name=Kubernetes
baseurl=https://mirrors.aliyun.com/kubernetes/yum/repos/kubernetes-el7-x86_64/
enabled=1
gpgcheck=0
repo_gpgcheck=0
gpgkey=https://mirrors.aliyun.com/kubernetes/yum/doc/yum-key.gpg https://mirrors.aliyun.com/kubernetes/yum/doc/rpm-package-key.gpg
EOF

#查看仓库可用软件包

[root@master ~]# yum repolist

#生成yum缓存提高软件下载速度

[root@master ~]# yum makecache

#安装kubeadm、kubelet、kubectl程序

#指定版本下载
[root@master ~]# yum install kubectl-1.23.5 kubelet-1.23.5  kubeadm-1.23.5  -y#设置kubelet开机自启，不然kubeadm init时会有警告提示
#集群初始化时候kubectl init时会自动start
[root@master ~]# systemctl enable kubelet

必须一次性下完

开始

若是低版本安装（请看开始到截至，1.23版本这部分不需要看）

这里注意：之前我配置的1.17版本需要配置kubelet的cgroup，编辑/etc/sysconfig/kubelet文件

[root@master ~]# vim /etc/sysconfig/kubelet

KUBELET_EXTRA_ARGS="--cgroup-driver=systemd"

KUBELET_PROXY_MODE="ipvs"

1.23未进行该操作以及初始化前的操作（可能是版本以及containerd支持问题）

#在安装kubernetes集群前，必须要准备好集群需要的镜像，所需的镜像可以通过下面命令查看

[root@master ~]# kubeadm config images list

k8s.gcr.io/kube-apiserver:v1.17.4

k8s.gcr.io/kube-controller-manager:v1.17.4

k8s.gcr.io/kube-scheduler:v1.17.4

k8s.gcr.io/kube-proxy:v1.17.4

k8s.gcr.io/pause:3.1

k8s.gcr.io/etcd:3.4.3-0

k8s.gcr.io/coredns:1.6.5

#定义镜像列表，因为此镜像在kubernetes仓库中，由于网络原因无法下载

[root@master ~]# images=(kube-apiserver:v1.17.4kube-controller-manager:v1.17.4kube-scheduler:v1.17.4kube-proxy:v1.17.4pause:3.1etcd:3.4.3-0coredns:1.6.5)

#从阿里镜像仓库下载镜像

[root@master ~]# for imageName in ${images[@]};dodocker pull registry.cn-hangzhou.aliyuncs.com/google_containers/$imageNamedocker tag registry.cn-hangzhou.aliyuncs.com/google_containers/$imageName k8s.gcr.io/$imageNamedocker rmi registry.cn-hangzhou.aliyuncs.com/google_containers/$imageNamedone

#查看镜像（标签已变成k8s标签）

[root@master ~]# docker images

截至

10.kubernetes集群初始化(master节点)

#初始化集群
kubeadm init --kubernetes-version=1.23.5  \
--apiserver-advertise-address=192.168.75.129   \
--image-repository registry.aliyuncs.com/google_containers  \
--service-cidr=10.10.0.0/16 \
--pod-network-cidr=10.122.0.0/16

[root@master ~]# export KUBECONFIG=/etc/kubernetes/admin.conf

#查看所有的pod[root@master ~]# kubectl get pods --all-namespaces

#查看kubernetes节点
[root@master ~]# kubectl get nodes

注意：未安装网络是ready

11.kubernetes安装网络插件

flannel

kubernetes支持多种网络插件，如：flannel、calico、canal等，任选一种使用即可

之前我实验选择的是flannel，这次试一试calico（但是flannel步骤也会写，自行选择）

只在master节点安装flannel插件即可，该插件使用的是DaemonSet控制器，该控制器会在每个节点上都运行；

#获取flannel配置文件

[root@master~]# wget https://raw.githubusercontent.com/coreos/flannel/master/Documentation/kube-flannel.yml

#执行文件启动flannel

[root@master ~]# kubectl apply -f kube-flannel.yml

#查看nodes节点信息

[root@master ~]# kubectl get nodes

calico

#下载calico.yaml文件

[root@master ~]# curl https://docs.projectcalico.org/v3.18/manifests/calico.yaml -O

calico.yaml获取：

链接：https://pan.baidu.com/s/1zhK26T7mA1PpAsNZY0Xhog?pwd=weiy
提取码：weiy

#安装calico

[root@master ~]# kubectl apply -f calico.yaml

[root@master ~]# kubectl get pods --all-namespaces

[root@master ~]# kubectl get nodes

12.node节点加入集群

这个地方为了使得证书有效，需要在master上生成新的证书。

为什么要重新生成证书？

通常情况下，我们可以使用初始化后给出的命令来添加worker节点。然而，这些命令通常只在24小时内有效。为了避免在后续增加worker节点时需要重新生成token，我们可以自行生成一个永不过期的命令。这样一来，我们就可以直接使用这个命令来添加worker节点，省去了临时重新生成token的步骤。这样可以更加方便和高效地管理和增加worker节点。

#查看现有token

[root@master ~]#  kubeadm token list

#创建一个永不过期的token

[root@master ~]# kubeadm token create --ttl 0

#获取ca证书sha256编码hash值

[root@master ~]# openssl x509 -pubkey -in /etc/kubernetes/pki/ca.crt | openssl rsa -pubin -outform der 2>/dev/null | openssl dgst -sha256 -hex | sed 's/^.* //'

生成后，node节点加入

node操作

[root@node1 ~]# kubeadm join 192.168.75.129:6443 --token murk1y.4pdoh7s8a96ejw4v     --discovery-token-ca-cert-hash sha256:475eb6e0d651f1cb7ea17767945dd15a78c1f2511636166b8590c729cbb9e757

[root@node2 ~]# kubeadm join 192.168.75.129:6443 --token murk1y.4pdoh7s8a96ejw4v     --discovery-token-ca-cert-hash sha256:475eb6e0d651f1cb7ea17767945dd15a78c1f2511636166b8590c729cbb9e757

[root@master ~]# kubectl get pods --all-namespaces

[root@master ~]# kubectl get nodes

等待加入成功，状态由notready到ready

注意：在node节点无法使用kubectl的命令

因为Kubernetes集群中的kubectl命令通常用于与集群进行交互，例如部署、管理和监控应用程序。

在正常情况下，kubectl命令应该在Kubernetes集群的master节点上使用，而不是在node节点上。这是因为master节点才是集群的控制平面，负责管理整个集群的状态和控制逻辑，而node节点主要用于运行应用程序和服务。

因此，在node节点上使用kubectl命令可能会导致权限不足或无法连接到集群的问题。

如果需要在node节点上执行kubectl命令，通常建议通过远程登录到master节点来执行，但是生产环境有时也会需要从node节点去查看pod的健康状态

需要去下载master节点的：/etc/kubernetes/admin.conf

[root@node1 ~]#  scp root@master:/etc/kubernetes/admin.conf /etc/kubernetes/
[root@node1 ~]# echo "export KUBECONFIG=/etc/kubernetes/admin.conf" >> /etc/profile
[root@node1 ~]# source /etc/profile

node2节点同上

13.安装Dashboard

Kubernetes Dashboard是Kubernetes集群的官方Web用户界面，它提供了一种直观的方式来可视化和管理集群中的应用程序、资源和工作负载。通过Kubernetes Dashboard，用户可以查看集群中的各种资源对象（如Pods、Services、Deployments等）、监控集群的状态、进行日志查看、执行命令等操作。

它为用户提供了一个方便的方式来管理和监控他们的Kubernetes集群，而无需深入了解Kubernetes的命令行工具或API。Kubernetes Dashboard使得管理和操作Kubernetes集群变得更加直观和便捷。

[root@master ~]# wget https://raw.githubusercontent.com/kubernetes/dashboard/v2.5.1/aio/deploy/recommended.yaml

recommended.yaml文件索取地址：

链接：https://pan.baidu.com/s/1K7A_PnMpgHpduMIuTqb2rg?pwd=weiy
提取码：weiy

#在recommended.yaml的service里添加nodeport，这样可以通过主机ip+port 来访问dashboard

镜像拉取策略

在容器环境中，镜像拉取策略用于指定容器运行时如何获取所需的镜像。

1. Always（始终拉取）：无论本地是否已经存在镜像，始终拉取最新版本。如果本地已有镜像，则会重新拉取最新版本并覆盖原有镜像。

2. IfNotPresent（若不存在则拉取）：仅当本地不存在指定镜像时才拉取。如果本地已经存在所需镜像，则直接使用本地镜像而不进行拉取。

3. Never（不拉取）：从不拉取镜像，仅使用本地已存在的镜像。如果本地不存在所需镜像，容器将无法启动。

建议改为Never 不然远程拉取容易出错（我这里没做改变）

注意如果修改后要使用kubectl apply -f recommended.yaml而不是create

#创建danshboard

[root@master ~]#  kubectl create -f recommended.yaml

#查看所有pod

[root@master ~]#  kubectl get pods --all-namespaces

查看pod两个pod的详细信息

[root@master ~]# kubectl describe pod/dashboard-metrics-scraper-799d786dbf-5c5ts --namespace=kubernetes-dashboard

[root@master ~]# kubectl describe pod/kubernetes-dashboard-fb8648fd9-f6ncv --namespace=kubernetes-dashboard

这一步或许会有镜像拉不下来的问题

Kubernetes Dashboard部署ImagePullBackOff问题处理-CSDN博客https://blog.csdn.net/m0_72264240/article/details/134461203

14.访问dashboard界面

经过谷歌以及edge测试

处理办法：使用火狐

#token登录
#创建账号

[root@master ~]# kubectl create serviceaccount dashboard-admin -n kube-system

#授权

[root@master ~]# kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kube-system:dashboard-admin

#获取token信息

[root@master ~]# kubectl describe secrets -n kube-system $(kubectl -n kube-system get secret | awk '/dashboard-admin/{print $1}')