learning/k8s-basics/scale.md
本文翻译自 Kubernetes Running Multiple Instances of Your App ,并有所改写
在之前的文章中,我们创建了一个 Deployment,然后通过 服务 提供访问 Pod 的方式。我们发布的 Deployment 只创建了一个 Pod 来运行我们的应用程序。当流量增加时,我们需要对应用程序进行伸缩操作以满足系统性能需求。
伸缩 的实现可以通过更改 nginx-deployment.yaml 文件中部署的 replicas(副本数)来完成
spec:
replicas: 2 #使用该Deployment创建两个应用程序实例
下图中,Service A 只将访问流量转发到 IP 为 10.0.0.5 的Pod上
</img>修改了 Deployment 的 replicas 为 4 后,Kubernetes 又为该 Deployment 创建了 3 新的 Pod,这 4 个 Pod 有相同的标签。因此Service A通过标签选择器与新的 Pod建立了对应关系,将访问流量通过负载均衡在 4 个 Pod 之间进行转发。
</img>::: tip 通过更改部署中的 replicas(副本数)来完成扩展 :::
修改 nginx-deployment.yaml 文件
将 replicas 修改为 4
apiVersion: apps/v1
kind: Deployment
metadata:
name: nginx-deployment
labels:
app: nginx
spec:
replicas: 4
selector:
matchLabels:
app: nginx
template:
metadata:
labels:
app: nginx
spec:
containers:
- name: nginx
image: nginx:1.7.9
ports:
- containerPort: 80
执行命令
kubectl apply -f nginx-deployment.yaml
查看结果
watch kubectl get pods -o wide
在 default 名称空间 点击 展现层 --> Nginx部署
点击下图中红色箭头按钮,可以执行伸缩操作,没点击一次,副本数加 1;
该页面中还可以观察到工作负载伸缩的过程。
~~一旦运行了多个应用程序实例,就可以在不停机的情况下执行滚动更新了,
~~let‘s go-> 执行滚动更新
</SharingBlock>