13_kubernetes_concepts/13.2_concepts.md
如图 13-2 所示,Kubernetes 由控制平面与工作节点构成。
图 13-2:Kubernetes 基本概念示意图
Node):一个节点是一个运行 Kubernetes 中的主机。Pod):一个 Pod 对应于由若干容器组成的一个容器组,同个组内的容器共享一个存储卷 (volume)。pod-states):包含所有容器状态集合,包括容器组状态类型,容器组生命周期,事件,重启策略,以及 replication controllers。services):一个 Kubernetes 服务是容器组逻辑的高级抽象,同时也对外提供访问容器组的策略。volumes):一个卷就是一个目录,容器对其有访问权限。labels):标签是用来连接一组对象的,比如容器组。标签可以被用来组织和选择子对象。accessing_the_api):端口,IP 地址和代理的防火墙规则。ux):用户可以通过 web 界面操作 Kubernetes。cli):kubectl 命令。在 Kubernetes 中,节点是实际工作的点,节点可以是虚拟机或者物理机器,依赖于一个集群环境。每个节点都有一些必要的组件以运行容器组,并且它们都可以通过控制平面来管理。必要组件包括 kubelet、容器运行时(如 containerd 或 CRI-O)和 kube-proxy;Docker 不再是 Kubernetes 节点的默认基线运行时。
容器状态用来描述节点的当前状态。现在,其中包含三个信息:
主机 IP 需要云平台来查询,Kubernetes 把它作为状态的一部分来保存。如果 Kubernetes 没有运行在云平台上,节点 ID 就是必需的。IP 地址可以变化,并且可以包含多种类型的 IP 地址,如公共 IP,私有 IP,动态 IP,ipv6 等等。
注:Pending / Running / Succeeded / Failed / Unknown 是 Pod 的生命周期阶段(pod.status.phase),不是节点状态。节点本身没有 Terminated 状态。
节点的状态通过一组条件(Conditions)来描述。主要条件包括 Ready(kubelet 健康且可以接收 Pod)、MemoryPressure(内存不足)、DiskPressure(磁盘不足)和 PIDPressure(进程数过多)等。其中 Ready 条件最为关键:值为 True 表示节点健康可调度,False 表示节点异常,Unknown 表示节点控制器超过一定时间未收到心跳。被标记为 Unknown 较长时间的节点,其上的 Pod 会被驱逐重新调度到其他节点。
节点并非 Kubernetes 创建,而是由云平台创建,或者就是物理机器、虚拟机。在 Kubernetes 中,节点仅仅是一条记录,节点创建之后,Kubernetes 会检查其是否可用。可以通过 kubectl 查看节点信息:
$ kubectl get nodes
NAME STATUS ROLES AGE VERSION
control-plane Ready control-plane 10d v1.36.0
worker-1 Ready <none> 10d v1.36.0
worker-2 Ready <none> 10d v1.36.0
每个节点的详细信息以如下结构保存:
apiVersion: v1
kind: Node
metadata:
name: worker-1
labels:
kubernetes.io/os: linux
status:
capacity:
cpu: "4"
memory: 8Gi
conditions:
- type: Ready
status: "True"
在 Kubernetes 控制平面中,节点控制器 (Node Controller) 负责管理节点的生命周期,主要包含:
节点控制器会持续监控节点的健康状态。当节点变为不可达时,控制器会等待一个超时期限,然后将该节点上的 Pod 标记为失败,并触发重新调度。可以使用 kubectl 来管理节点,例如标记节点为不可调度或排空节点上的工作负载:
## 标记节点为不可调度
$ kubectl cordon worker-1
## 排空节点上的 Pod
$ kubectl drain worker-1 --ignore-daemonsets
在 Kubernetes 中,使用的最小调度单位是容器组 (Pod),它是创建、调度、管理的最小单位。一个 Pod 包含一个或多个紧密协作的容器,它们共享网络命名空间和存储卷。
Pod 通常不会被直接创建,而是通过 Deployment 等控制器来管理。当节点发生故障时,控制器会在其他可用节点上重新创建 Pod。
容器组 (Pod) 的设计主要是为了解决应用间的紧密协作和资源共享问题。
容器组主要是为了数据共享和它们之间的通信。
在一个容器组中,容器都使用相同的网络地址和端口,可以通过本地网络来相互通信。每个容器组都有独立的 IP,可用通过网络来和其他物理主机或者容器通信。
容器组有一组存储卷 (挂载点),主要是为了让容器在重启之后可以不丢失数据。
容器组是一个应用管理和部署的高层次抽象,同时也是一组容器的接口。容器组是部署、水平放缩的最小单位。
容器组可以通过组合来构建复杂的应用,典型的使用模式包含:
包括若干状态值:Pending、Running、Succeeded、Failed。
| 状态 | 说明 |
|---|---|
| Pending | Pod 已被集群接受,但有一个或多个容器还没有运行起来(可能在拉取镜像)。 |
| Running | Pod 已被调度到节点,并且所有容器都已启动。至少有一个容器处于运行状态。 |
| Succeeded | Pod 中的所有容器都正常退出,且不会被重启。 |
| Failed | Pod 中的所有容器都已终止,且至少有一个容器以失败状态退出。 |
Pod 的重启策略 (restartPolicy) 决定了容器退出后的行为:
| 重启策略 | 容器正常退出 | 容器异常退出 |
|---|---|---|
| Always (默认) | 重启容器 | 重启容器 |
| OnFailure | 不重启 | 重启容器 |
| Never | 不重启 | 不重启 |
当节点故障或不可达时,节点控制器会将该节点上所有 Pod 的状态标记为 Failed。如果这些 Pod 由 Deployment 等控制器管理,控制器会自动在其他节点上重新创建。
Deployment 是管理无状态应用的推荐方式,它通过 ReplicaSet 来确保指定数量的 Pod 副本始终在运行。
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
spec:
replicas: 3
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx
image: nginx:1.28
ports:
- containerPort: 80
Deployment 的核心能力包括:
早期 Kubernetes 使用 Replication Controller (RC) 来管理副本,现已被 ReplicaSet/Deployment 取代。
Deployment 适合无状态应用,而 StatefulSet 用于管理有状态应用(如数据库、消息队列)。与 Deployment 不同,StatefulSet 为每个 Pod 提供稳定的网络标识和持久化存储。
apiVersion: apps/v1
kind: StatefulSet
metadata:
name: mysql
spec:
serviceName: mysql
replicas: 3
selector:
matchLabels:
app: mysql
template:
metadata:
labels:
app: mysql
spec:
containers:
- name: mysql
image: mysql:8.4
volumeMounts:
- name: data
mountPath: /var/lib/mysql
volumeClaimTemplates:
- metadata:
name: data
spec:
accessModes: ["ReadWriteOnce"]
resources:
requests:
storage: 10Gi
StatefulSet 的核心特性:
volumeClaimTemplates 为每个 Pod 自动创建独立的 PVCDaemonSet 确保在集群的每个节点(或指定节点)上运行一个 Pod 副本。典型用途包括日志收集、监控代理和网络插件。
apiVersion: apps/v1
kind: DaemonSet
metadata:
name: fluentd
spec:
selector:
matchLabels:
app: fluentd
template:
metadata:
labels:
app: fluentd
spec:
containers:
- name: fluentd
image: fluent/fluentd:v1.17
volumeMounts:
- name: varlog
mountPath: /var/log
volumes:
- name: varlog
hostPath:
path: /var/log
当新节点加入集群时,DaemonSet 会自动在该节点上创建 Pod;当节点被移除时,对应的 Pod 也会被回收。
Job 用于运行一次性任务,确保指定数量的 Pod 成功完成后自动退出。CronJob 则按照 cron 表达式周期性地创建 Job。
apiVersion: batch/v1
kind: Job
metadata:
name: data-migration
spec:
completions: 1
template:
spec:
containers:
- name: migrate
image: myapp/migrate:latest
command: ["python", "migrate.py"]
restartPolicy: Never
backoffLimit: 3
apiVersion: batch/v1
kind: CronJob
metadata:
name: daily-backup
spec:
schedule: "0 2 * * *"
jobTemplate:
spec:
template:
spec:
containers:
- name: backup
image: myapp/backup:latest
restartPolicy: OnFailure
Job 的 backoffLimit 控制失败重试次数,completions 指定需要成功完成的 Pod 数量。CronJob 适用于定时备份、报表生成等场景。
服务 (Service) 定义了一组 Pod 的逻辑集合和访问策略。由于 Pod 的 IP 地址是动态分配的,Service 提供了一个稳定的访问入口。
apiVersion: v1
kind: Service
metadata:
name: nginx-service
spec:
selector:
app: nginx
ports:
- port: 80
targetPort: 80
type: ClusterIP
常见的 Service 类型:
| 类型 | 说明 |
|---|---|
| ClusterIP | 默认类型,仅集群内部可访问 |
| NodePort | 在每个节点上开放固定端口,集群外部可通过 节点IP:端口 访问 |
| LoadBalancer | 通过云平台的负载均衡器暴露服务 |
卷 (Volume) 为 Pod 中的容器提供持久化存储。Kubernetes 支持多种卷类型:
| 卷类型 | 说明 |
|---|---|
| emptyDir | 临时存储,Pod 删除后数据丢失 |
| hostPath | 挂载节点上的文件或目录 |
| PersistentVolumeClaim | 使用持久卷声明,与底层存储解耦 |
| configMap / secret | 将配置或敏感数据挂载为文件 |
生产环境中,推荐使用 PersistentVolume (PV) 和 PersistentVolumeClaim (PVC) 来管理存储,实现存储资源与使用者的解耦。
标签 (Label) 是附加到 Kubernetes 对象上的键值对,用于组织和选择对象子集。标签是 Kubernetes 中实现松耦合的关键机制。
## 为 Pod 添加标签
$ kubectl label pod my-pod env=production
## 通过标签选择器查询
$ kubectl get pods -l env=production
Service、Deployment 等资源都通过标签选择器 (selector) 来关联目标 Pod。
Kubernetes API 的访问通过三个阶段进行控制:
Kubernetes Dashboard 是一个基于 Web 的用户界面,用于部署容器化应用、监控集群资源和排查问题。Dashboard 的部署方法详见部署 Dashboard 章节。
kubectl 是 Kubernetes 的命令行工具,用于与集群进行交互。常用命令如下:
## 查看集群中的资源
$ kubectl get pods,deployments,services,nodes
## 创建资源
$ kubectl apply -f deployment.yaml
## 查看 Pod 日志
$ kubectl logs my-pod
## 进入 Pod 执行命令
$ kubectl exec -it my-pod -- /bin/sh
## 查看资源详情
$ kubectl describe pod my-pod
更多 kubectl 操作详见kubectl 命令行章节。