k8s学习

k8s前世今生

Google 10年容器化基础架构
特点:
轻量级:消耗资源少
开源
弹性伸缩
负载均衡:IPVS

适合人群:软件工程师 测试工程师 运维工程师 软件架构师 项目经理

知识图谱

介绍说明: 前世今生 Kubernetes框架 kubernetes关键字含义

基础概念:什么是Pod(最小管理单元) 控制器类型 k8s 网络通讯模式

kubernetes: 构建k8s集群

资源清单:资源 掌握资源清单的语法 编写Pod 掌握Pod的生命周期

Pod控制器:掌握各种控制器的特点以及使用定义方式

服务发现:掌握SVC原理及其构建方式

存储:掌握多种存储类型的特点,并且能够在不同环境中选择合适的存储方案

调度器:掌握调度器原理 能够根据要求把Pod定义到想要的节点运行

安全:集群的认证 鉴权 访问控制 原理及其流程

HELM:等于Linux中的Yum管理器 掌握HELM原理 HELM模板自定义 HELM部署一些常用插件

运维:修改Kubeadm达到证书可用期限为10年 能够构建高可用的Kubernetes集群

服务分类

​ 有状态服务:DBMS

​ 无状态服务:LVS APACHE

高可用集群副本数据最好是>=3 奇数个

主要组件

APISERVER:所有服务访问统一入口

ControllerManager:维持副本期望数目

Scheduler:负责介绍任务,选择合适的节点进行分配任务

ETCD:键值对数据库,存储k8s集群所有重要信息(持久化)

Kubelet:直接跟容器引擎交互实现容器的声明周期管理

Kube-proxy:负责写入规则至IPTABLES 、IPVS实现服务

COREDNS:可以为集群中的SVC创建一个域名IP的对应关系解析

DASHBOARD:给k8s集群提供一个B/S结构访问体系

INGRESS CONTROLLER:官方只能实现四层代理,INGRESS可以实现七层代理

FEDETATION:提供一个可以跨集群中心多k8s统一管理功能

PROMETHEUS:提供k8s集群的监控能力

ELK:提供k8s集群日志统一分析接入平台

k8s基础功能

  1. Pod概念
    • 自主式Pod
    • 控制器管理的Pod
  2. 网络通讯方式

在同一个Pod里,端口是一样的。既共享网络,又共享存储卷。

ReplicaSet与Deployment

ReplicationController用来确保容器应用的副本数始终保持在用户定义的副本数。即如果有容器异常退出,会自动创建新的Pod来替代;而如果异常多出来的容器也会自动回收。在新版本的Kubernetes中建议使用ReplicaSet来取代ReplicationController

ReplicaSet,跟ReplicationController没有本质的不同,只是名字不一样,并且ReplicaSet支持集合式的selector

虽然ReplicaSet可以独立使用,但一般还是建议使用Deployment来自动管理ReplicaSet,这样就无需担心跟其他机制的不兼容问题(比如ReplicaSet不支持rolling-update 但Deployment支持)

HPA: Horizontal Pod Autoscaling

Horizontal Pod Autoscaling仅适用于Deployment和ReplicaSet,在v1版本中仅支持根据Pod的CPU利用率扩容,在v1alpha版本中,支持根据内存和用户自定义的metric扩缩容

StatefullSet

StatefullSet是为了解决有状态服务的问题(对应Deployments和ReplicaSets是为无状态服务而设计),其应用场景包括:

稳定的持久化存储,即Pod重新调度后还是能访问到相同的持久化数据,基于PVC来实现

稳定的网络标志,即Pod重新调度后其PodName和HostName不变,基于headless Service(即没有Cluster IP的Service)来实现

有序部署,有序扩展,即Pod是有顺序的,在部署或者扩展的时候要依据定义的顺序一次进行(即从0到N-1,在下一个Pod运行之前所有之前的Pod必须都是Running和Ready状态),基于init containers来实现

有序收缩,有序删除(即从N-1到0)

DeamonSet

DeamonSet确保全部(或者一些)Node上运行一个Pod的副本,当有Node加入集群时,也会为他们新增一个Pod。当有Node从集群移除时,这些Pod也会被回收。删除DaemonSet将会删除它创建的所有Pod。

使用DaemonSet的一些典型用法:

  • 运行集群存储daemon,例如每个Node上运行glusterd、ceph
  • 在每个Node上运行日志手机daemon,例如fluentd、logstash
  • 在每个Node上运行监控daemon,例如Prometheus Node Exporter

Job,Cronjob

Job负责批处理任务,即仅执行一次的任务,它保证批处理任务的一个或多个Pod成功结束

Cron Job管理基于时间的Job,即

  • 在给定时间点只运行一次
  • 周期性地在给定时间点运行

image-20211203202022302

多服务之间的交互方式

image-20211203203526208

网络通讯方式

Kubernetes的网络模型假定了所有Pod都在一个可以直接联通的扁平的网络空间中,这在GCE(Google Compute Engine)里面是现成的网络模型,Kubernetes假定这个网络已经存在。

而在私有云里搭建Kubernetes集群,就不能假定这个网络已经存在了,我们需要自己实现这个网络假设,将不同节点上的Docker容器之间的互相访问先打通,然后运行Kubernetes

同一个Pod内的多个容器之间:localhost

各Pod之间的通讯:Overlay Network

Pod和Service之间的通讯,各节点的Iptables规则

Overlay Network怎么实现

Flannel是CoreOS团队针对Kubernetes设计的一个网络规划服务,简单来说,它的功能是让集群中的不同节点主机创建的Docker容器都具有全集群唯一的虚拟IP地址。而且它还能在这些IP地址之间建立一个覆盖网络(Overlay Network),通过这个覆盖网络,将数据包原封不动地传递到目标容器内。

Flannel怎么运行

image-20211203204451842

ETCD和Flannel的关系

ETCD给Flannel提供说明:

  • 存储管理Flannel可分配的IP地址段资源
  • 监控ETCD中每个Pod的实际地址,并在内存中建立维护Pod节点路由表