设置代理
kubectl proxy --address=192.168.112.38 --disable-filter=true &
k8s基本命令
删除Evicted 状态驱逐pod
kubectl get pods | grep Evicted | awk '{print $1}' | xargs kubectl delete pod
强制删除pod
kubectl delete pod [pod name] --force --grace-period=0 -n [namespace]
注意:必须加-n参数指明namespace,否则可能报错pod not found。
#节点信息查询
kubectl get pods -o wide
#获取dashboard的token
kubectl -n kube-system describe $(kubectl -n kube-system get secret -n kube-system -o name | grep namespace) | grep token
查看dashboard状态
kubectl get po,svc -n kubernetes-dashboard
卸载dashboard
pod删除
$ kubectl -n kube-system delete $(kubectl -n kube-system get pod -o name | grep dashboard)
pod “kubernetes-dashboard-3313488171-7706x” deleted
pod “kubernetes-dashboard-3313488171-ddkqd” deleted
pod “kubernetes-dashboard-3313488171-dpf9t” deleted
pod “kubernetes-dashboard-3313488171-jdz1n” deleted
pod “kubernetes-dashboard-3313488171-sxc9n” deleted
删除pod
$ kubectl delete pod kubernetes-dashboard-75d8b49cf6-wswnz -n kube-system --force --grace-period=0
卸载dashboard
kubectl delete deployment kubernetes-dashboard --namespace=kube-system
kubectl delete service kubernetes-dashboard --namespace=kube-system
kubectl delete role kubernetes-dashboard-minimal --namespace=kube-system
kubectl delete rolebinding kubernetes-dashboard-minimal --namespace=kube-system
kubectl delete sa kubernetes-dashboard --namespace=kube-system
kubectl delete secret kubernetes-dashboard-certs --namespace=kube-system
kubectl delete secret kubernetes-dashboard-csrf --namespace=kube-system
kubectl delete secret kubernetes-dashboard-key-holder --namespace=kube-system
集群配置文件的位置
# k8s配置文件位置
/etc/kubernetes/admin.conf
# k3s配置文件位置
/etc/rancher/k3s.k3s.yaml
# 改变配置文件的服务器地址
如果不是集群主机访问集群,就需要修改配置文件的server字段,只需将server的IP改成master的主机IP即可
获取全部空间
kubectl get pods --all-namespaces
删除deployments
kubectl delete deployments nginx-deployment
查询dashboard
dashboard get service kubernetes-dashboard
kubectl get pods --namespace=kubernetes-dashboard -o wide
kubectl -n kube-system describe $(kubectl -n kube-system get secret -n kube-system -o name | grep namespace) | grep token
预检集群
kubectl get cs
kubectl get pods -A -o wide
k8s操作命令大全
通过yaml文件创建:
kubectl create -f xxx.yaml (不建议使用,无法更新,必须先delete)
kubectl apply -f xxx.yaml (创建+更新,可以重复使用)
通过yaml文件删除:
kubectl delete -f xxx.yaml
查看kube-system namespace下面的pod/svc/deployment 等等(-o wide 选项可以查看存在哪个对应的节点)
kubectl get pod/svc/deployment -n kube-system
查看所有namespace下面的pod/svc/deployment等等
kubectl get pod/svc/deployment --all-namcpaces
重启pod(无法删除对应的应用,因为存在deployment/rc之类的副本控制器,删除pod也会重新拉起来)
kubectl get pod -n kube-system
查看pod描述:
kubectl describe pod XXX -n kube-system
查看pod 日志 (如果pod有多个容器需要加-c 容器名)
kubectl logs xxx -n kube-system
删除应用(先确定是由说明创建的,再删除对应的kind):
kubectl delete deployment xxx -n kube-system
根据label删除:
kubectl delete pod -l app=flannel -n kube-system
扩容
kubectl scale deployment spark-worker-deployment --replicas=8
导出配置文件:
导出proxy
kubectl get ds -n kube-system -l k8s-app=kube-proxy -o yaml>kube-proxy-ds.yaml
导出kube-dns
kubectl get deployment -n kube-system -l k8s-app=kube-dns -o yaml >kube-dns-dp.yaml
kubectl get services -n kube-system -l k8s-app=kube-dns -o yaml >kube-dns-services.yaml
导出所有 configmap
kubectl get configmap -n kube-system -o wide -o yaml > configmap.yaml
复杂操作命令:
删除kube-system 下Evicted状态的所有pod:
kubectl get pods -n kube-system |grep Evicted| awk '{print $1}'|xargs kubectl delete pod -n kube-system
以下为维护环境相关命令:
重启kubelet服务
systemctl daemon-reload
systemctl restart kubelet
修改启动参数
vim /etc/systemd/system/kubelet.service.d/10-kubeadm.conf
# 查看集群信息
kubectl cluster-info
# 查看各组件信息
kubectl get componentstatuses
#查看kubelet进程启动参数
ps -ef | grep kubelet
查看日志:
journalctl -u kubelet -f
设为不可调度状态:
kubectl cordon node1
将pod赶到其他节点:
kubectl drain node1
解除不可调度状态
kubectl uncordon node1
master运行pod
kubectl taint nodes master.k8s node-role.kubernetes.io/master-
master不运行pod
kubectl taint nodes master.k8s node-role.kubernetes.io/master=:NoSchedule
K8s一些命令:
通过yaml文件创建:
kubectl create -f xxx.yaml (不建议使用,无法更新,必须先delete)
kubectl apply -f xxx.yaml (创建+更新,可以重复使用)
通过yaml文件删除:
kubectl delete -f xxx.yaml
查看kube-system namespace下面的pod/svc/deployment 等等(-o wide 选项可以查看存在哪个对应的节点)
kubectl get pod /svc/deployment -n kube-system
查看所有namespace下面的pod/svc/deployment等等
kubectl get pod/svc/deployment --all-namcpaces
重启pod(无法删除对应的应用,因为存在deployment/rc之类的副本控制器,删除pod也会重新拉起来)
kubectl get pod -n kube-system
查看pod描述:
kubectl describe pod XXX -n kube-system
查看pod 日志 (如果pod有多个容器需要加-c 容器名)
kubectl logs xxx -n kube-system
删除应用(先确定是由说明创建的,再删除对应的kind):
kubectl delete deployment xxx -n kube-system
根据label删除:
kubectl delete pod -l app=flannel -n kube-system
扩容
kubectl scale deployment spark-worker-deployment --replicas=8
导出配置文件:
导出proxy
kubectl get ds -n kube-system -l k8s-app=kube-proxy -o yaml>kube-proxy-ds.yaml
导出kube-dns
kubectl get deployment -n kube-system -l k8s-app=kube-dns -o yaml >kube-dns-dp.yaml
kubectl get services -n kube-system -l k8s-app=kube-dns -o yaml >kube-dns-services.yaml
导出所有 configmap
kubectl get configmap -n kube-system -o wide -o yaml > configmap.yaml
复杂操作命令:
删除kube-system 下Evicted状态的所有pod:
kubectl get pods -n kube-system |grep Evicted| awk '{print $1}'|xargs kubectl delete pod -n kube-system
以下为维护环境相关命令:
重启kubelet服务
systemctl daemon-reload
systemctl restart kubelet
修改启动参数
vim /etc/systemd/system/kubelet.service.d/10-kubeadm.conf
# 查看集群信息
kubectl cluster-info
# 查看各组件信息
kubectl get componentstatuses
#查看kubelet进程启动参数
ps -ef | grep kubelet
查看日志:
journalctl -u kubelet -f
设为不可调度状态:
kubectl cordon node1
将pod赶到其他节点:
kubectl drain node1
解除不可调度状态
kubectl uncordon node1
master运行pod
kubectl taint nodes master.k8s node-role.kubernetes.io/master-
master不运行pod
kubectl taint nodes master.k8s node-role.kubernetes.io/master=:NoSchedule
获取集群的基本信息
kubectl cluster-info
kubectl get nodes
kubectl get namespaces
kubectl get deployment --all-namespaces
kubectl get svc --all-namespaces
kubectl get pod
kubectl get pod -o wide --all-namespaces
kubectl logs podName
创建pod或srv
kubectl create -f development.yaml
检查将要运行的 Pod 的资源状况
kubectl describe pod podName
删除 Pod
kubectl delete pod podName
pod有多少副本
kubectl get rc
扩展 Pod
kubectl scale --replicas=3 rc podName
删除
kubectl delete deployment kubernetes-dashboard --namespace=kube-system
kubectl delete svc kubernetes-dashboard --namespace=kube-system
kubectl delete -f kubernetes-dashboard.yaml
进入pod
kubectl exec -ti podName /bin/bash
命令表
查看类命令:
获取节点相应服务的信息 : kubectl get pods 按selector名来查找pod: kubectl get pod --selector name=redis
查看集群信息: kubectl cluster-info
查看各组件信息: kubectl -s http://localhost:8080 get componentstatuses 或 kubectl get cs
查看pods所在的运行节点: kubectl gkubectl get pods -o yamlet pods -o wide
查看pods定义的详细信息: kubectl get pods -o yaml
查看运行pod的环境变量: kubectl exec pod名 env
查看指定pod的日志: kubectl logs -f pods/heapster-xxxxx -n kube-system
操作类命令:
创建资源: kubectl apply -f 文件名.yaml kubectl create -f 文件名.yaml
重建资源: kubectl replace -f 文件名 [--force]
删除资源: kubectl delete -f 文件名、kubectl delete pod pod名、kubectl delete rc rc名、kubectl delete service service名
kubectl进阶命令操作
kubectl get:获取指定资源的基本信息 kubectl get services kubernetes-dashboard -n kube-system #查看所有service
kubectl get deployment kubernetes-dashboard -n kube-system #查看所有发布
kubectl get pods --all-namespaces #查看所有pod
kubectl get pods -o wide --all-namespaces #查看所有pod的IP及节点
kubectl get pods -n kube-system | grep dashboard
kubectl get nodes -l zone #获取zone的节点
kubectl describe:查看指定资源详细描述信息 kubectl describe service/kubernetes-dashboard --namespace="kube-system"
kubectl describe pods/kubernetes-dashboard-349859023-g6q8c --namespace="kube-system" #指定类型查看
kubectl describe pod nginx-772ai #查看pod详细信息
kubectl scale:动态伸缩 kubectl scale rc nginx --replicas=5 # 动态伸缩
kubectl scale deployment redis-slave --replicas=5 #动态伸缩
kubectl scale --replicas=2 -f redis-slave-deployment.yaml #动态伸缩
kubectl exec:进入pod启动的容器 kubectl exec -it redis-master-1033017107-q47hh /bin/bash #进入容器
kubectl label:添加label值 kubectl label nodes node1 zone=north #增加节点lable值 spec.nodeSelector: zone: north #指定pod在哪个节点
kubectl label pod redis-master-1033017107-q47hh role=master #增加lable值 [key]=[value]
kubectl label pod redis-master-1033017107-q47hh role- #删除lable值
kubectl label pod redis-master-1033017107-q47hh role=backend --overwrite #修改lable值
kubectl rolling-update:滚动升级 kubectl rolling-update redis-master -f redis-master-controller-v2.yaml #配置文件滚动升级
kubectl rolling-update redis-master --image=redis-master:2.0 #命令升级
kubectl rolling-update redis-master --image=redis-master:1.0 --rollback #pod版本回滚
etcdctl 常用操作
etcdctl cluster-health #检查网络集群健康状态
etcdctl --endpoints=https://192.168.71.221:2379 cluster-health #带有安全认证检查网络集群健康状态
etcdctl member list
etcdctl set /k8s/network/config '{ "Network": "10.1.0.0/16" }'
etcdctl get /k8s/network/config
删除节点
从Kubernetes集群中删除节点,正确流程如下:
1、获取节点列表
kubectl get node
2、设置不可调度
kubectl cordon $node_name
3、驱逐节点上的Pod
kubectl drain $node_name --ignore-daemonsets
4、移除节点
节点上pod都被驱逐后,可以直接移除节点:
kubectl delete node $node_name
这样我们就平滑移除了一个 k8s 节点。
方法2
1.设置不可调度
kubectl cordon k8s-node-1
kubectl uncordon k8s-node-1 #取消
2,驱逐已经运行的业务容器
kubectl drain --ignore-daemonsets --delete-local-data k8s-node-1
3.如果想删除node 节点,则进行这个步骤
kubectl delete node k8s-node-1
节点分配不均衡,k8s创建多个副本默认先用第一台服务器,当第一台服务器资源满了才会去第二台服务器创建副本
解决方案:1. 给相应的节点打上标签,并添加亲和性。
2.使用DaemonSet 参考文档https://blog.csdn.net/yanggd1987/article/details/107507216
1.给相应节点打上标签
#查看节点全部标签
kubectl get node --show-labels
执行如下命令标注 node-75是配置 标签serviceType值为query-service
kubectl label node node-75 serviceType=query-service
然后通过 kubectl get node --show-labels 查看全部节点的 label。
如果要删除 label disktype,就执行如下命令删除即可:
kubectl label node k8s-node1 disktype-
2.给部署yaml加上亲和性
spec:
replicas: 4
selector:
matchLabels:
app: http-socsp-query
strategy: {}
template:
metadata:
creationTimestamp: null
labels:
app: http-socsp-query
spec:
#亲和性添加 有nodeAffinity根据node选择 Podaffinity 根据pod等
affinity:
nodeAffinity:
requiredDuringSchedulingIgnoredDuringExecution:
nodeSelectorTerms:
- matchExpressions:
- key: serviceType
operator: In
values:
- query-service
containers:
- image: 192.168.0.74:5000/http-socsp-query:latest
imagePullPolicy: Always
ports:
- containerPort: 19237
name: http-socsp-query
resources: {}
volumeMounts:
3.运行yaml文件
kubectl apply -f http-socsp-query.yaml
4.查看pod运行情况
kubectl get pod -o wide
5.副本数根据节点完成了均匀分配
常见命令
#启动异常查询
journalctl -xefu kubelet
#重启服务
systemctl daemon-reload
systemctl restart kubelet
label
执行如下命令标注 k8s-node1 是配置了 SSD的节点
kubectl label node k8snode1 disktype=ssd
然后通过 kubectl get node --show-labels 查看节点的 label。
kubectl get pod -o wide
可以看到disktype=ssd 已经成功添加到 k8snode1,除了 disktype,Node 还有几个 Kubernetes 自己维护的 label。有了 disktype 这个自定义 label,接下来就可以指定将 Pod 部署到 k8snod1。比如我编辑nginx.yml,增加nodeSelector标签,指定将此Pod部署到具有ssd属性的Node上去。
如果要删除 label disktype,就执行如下命令删除即可:
kubectl label node k8s-node1 disktype-
k8s设置重启服务
kubeadm 是k8s集群快速构建工具
kubelet 运行在所有节点上,负责启动pod和容器,以系统服务的形式出现
kubectl 是k8s命令行工具,提供指令
systemctl start kubelet
设置开机启动 systemctl enable kubelet
#重启服务
systemctl restart kubelet && systemctl enable kubelet
#详情 describe 删除delete 查询get
#查看所有信息服务
kubectl get pod,deployment,svc -n kube-system
#查询部署服务信息、端口、节点
kubectl get pod,svc,deploy -o wide
#集群信息
kubectl cluster-info
#命令空间
kubectl get namespace
#获取节点的全部空间
kubectl get pods --all-namespaces
#Controller 信息
#Deployment 查询全部部署(控制器)
kubectl get deployments.apps
kubectl get deployments
#Replicaset 控制器(副本)
kubectl get replicasets.apps
kubectl get replicasets
#Statefulset 控制器
kubectl get statefulsets.apps
kubectl get statefulsets
#Daemonset 控制器
kubectl get daemonsets.apps
kubectl get daemonsets
#job控制器
kubectl get job
#Service
kubectl get service
#针对服务查询对应端口nginx-service服务名
kubectl get svc nginx-service -o wide
#svc 服务对外暴露的端口
kubectl get svc
#pod
kubectl get pod
#查询pod暴露端口
kubectl get pods,svc
#参数
-o wide 查看更多信息,Pod 可以查看到 ip 地址,node 节点。Service 可以查看到选择器,控制器可以看到镜像,选择器等。
–all-namespaces 查看所有 namespace 下的资源
查看污点
当不清楚集群中node的污点时,可以用以下命令查看和删除污点。
kubectl describe nodes k8s-master |grep Taints
Taints: gameble=true:NoSchedule
[root@k8s-master ~]# kubectl describe nodes k8s-slave1 | grep Taints
Taints: drunk=true:NoSchedule
[root@k8s-master ~]# kubectl describe nodes k8s-slave2 | grep Taints
Taints: smke=true:NoSchedule
删除污点,根据上边命令查出来的污点名来删。
gameble- 就是污点名,后加减号就删掉了
gameble
[root@k8s-master ~]# kubectl taint node k8s-master gameble-
node/k8s-master untainted
[root@k8s-master ~]# kubectl taint node k8s-slave1 drunk-
node/k8s-slave1 untainted
[root@k8s-master ~]# kubectl taint node k8s-slave2 smke-
node/k8s-slave2 untainted
#重启服务
kubeadm reset
#删除deployments
kubectl delete deployments nginx-deployment
#查看pod日志inittax容器名,inittax-75df9b9b47-nv6vl指pod名称
kubectl logs inittax-75df9b9b47-nv6vl -c inittax
#预检集群
kubectl get cs
kubectl get pods -A -o wide
#查看pod详情
kubectl describe pod inittax-bf647f97-4bmm8
#查询dashboard的token
dashboard get service kubernetes-dashboard
kubectl get pods --namespace=kubernetes-dashboard -o wide
kubectl -n kube-system describe $(kubectl -n kube-system get secret -n kube-system -o name | grep namespace) | grep token
#查看dashboard状态
kubectl get po,svc -n kubernetes-dashboard
#获取配置
kubectl config view
#删除节点
kubectl delete node k8s-node2
集群命令
子节点重新加入集群
# 重启服务
kubeadm reset
# 重新加载节点
#先获取token
[root@k8s-master pki]# kubeadm token create --print-join-command
kubeadm join 192.168.180.121:6443 --token p08kmc.nci5h0xfmlcw92vg --discovery-token-ca-cert-hash sha256:44315d59e08f4d94bc75d20730b861818dfeda6517c1b228399f061f4256329b
### 获取加入集群命令
kubeadm token create --print-join-command
hostnamectl set-hostname node-199
### 子节点重新加入
[root@k8s-node01 lib]# kubeadm join 192.168.180.121:6443 --token p08kmc.nci5h0xfmlcw92vg --discovery-token-ca-cert-hash sha256:44315d59e08f4d94bc75d20730b861818dfeda6517c1b228399f061f4256329b
[preflight] Running pre-flight checks
[WARNING IsDockerSystemdCheck]: detected "cgroupfs" as the Docker cgroup driver. The recommended driver is "systemd". Please follow the guide at https://kubernetes.io/docs/setup/cri/
[preflight] Reading configuration from the cluster...
[preflight] FYI: You can look at this config file with 'kubectl -n kube-system get cm kubeadm-config -oyaml'
[kubelet-start] Downloading configuration for the kubelet from the "kubelet-config-1.16" ConfigMap in the kube-system namespace
[kubelet-start] Writing kubelet configuration to file "/var/lib/kubelet/config.yaml"
[kubelet-start] Writing kubelet environment file with flags to file "/var/lib/kubelet/kubeadm-flags.env"
[kubelet-start] Activating the kubelet service
[kubelet-start] Waiting for the kubelet to perform the TLS Bootstrap...
This node has joined the cluster:
* Certificate signing request was sent to apiserver and a response was received.
* The Kubelet was informed of the new secure connection details.
Run 'kubectl get nodes' on the control-plane to see this node join the cluster.
查看节点信息
[root@k8s-master pki]# kubectl get nodes
NAME STATUS ROLES AGE VERSION
k8s-master Ready master 3d4h v1.16.1
k8s-node01 Ready
k8s-node02 Ready
踢出节点
#在硬件升级,维护或节点出现异常等情况下,我们需要将某些剔除,使其脱离kubernetes集群的调度范围。
先将要剔除会退出的节点设置成不可调度状态,设置好之后节点状态上会多了一个 “SchedulingDisabled”标记,这样新创建的pod就不会网该节点调度
kubectl cordon test-k8s-node05
之后驱逐调节点上的pod
kubectl drain test-k8s-node05
如果是节点出了问题,执行不了指令,可以采取强制驱逐的方式
kubectl delete pods -n kube-system nginx-6qz6s
将节点从集群中剔除或退出
kubectl delete node test-k8s-node05
加入集群后无法运行容器
重置kubernetes服务,重置网络。删除网络配置,link
sudo ifconfig cni0 down
sudo ip link delete cni0
kubeadm reset
kubeadm join 192.168.0.74:6443 --token mhqm8p.3ae3ksr8uwgisgxq --discovery-token-ca-cert-hash sha256:49ee762d2f9096bfd4a58c84b983544b7a557c2f63302dc17281c40cbac668d0
评论区