Kubernetes QoS机制：从入门到精通 – wiki基地

Kubernetes QoS 机制：从入门到精通

在 Kubernetes 中，资源管理是确保集群稳定性和应用性能的关键。为了有效管理节点上的计算资源（CPU 和内存），Kubernetes 引入了服务质量（Quality of Service, QoS）机制。QoS 机制通过对 Pod 进行分类，影响调度决策和在资源不足时的驱逐策略，从而保证关键工作负载的正常运行。

每个 Pod 都会被 Kubernetes 自动分配一个 QoS 等级，该等级基于 Pod 中所有容器的 CPU 和内存的 requests（请求）和 limits（限制）配置。理解这些 QoS 等级对于优化资源利用率、避免应用中断至关重要。

Kubernetes QoS 的三种等级

Kubernetes 将 Pod 分为以下三种 QoS 等级：Guaranteed（保证）、Burstable（可突发）和 BestEffort（尽力而为）。

1. Guaranteed (保证)

判定标准：
一个 Pod 要被分类为 Guaranteed，其所有容器必须满足以下条件：
* 每个容器都必须为其 CPU 和内存设置 requests 和 limits。
* 每个容器的 requests 和 limits 值必须相等（即 cpu request == cpu limit 且 memory request == memory limit）。

特性：
* 最高优先级： Guaranteed 级别的 Pod 拥有最高的优先级。
* 资源保证： Kubernetes 承诺会为这些 Pod 分配它们所请求的全部资源。这意味着它们的性能最可预测。
* 最不容易被驱逐： 在资源紧张时，Guaranteed Pod 最不容易被驱逐。它们只会在两种情况下被驱逐：一是其消耗的资源超出了设定的 limits，二是节点本身即将终止。

使用场景：
适用于对资源可用性和性能稳定性要求极高的关键应用，例如数据库服务器、实时通信服务或需要严格 SLA 的核心业务应用。

2. Burstable (可突发)

判定标准：
如果一个 Pod 不符合 Guaranteed 的标准，但其至少有一个容器为 CPU 或内存设置了 requests 或 limits，那么它就会被分类为 Burstable。通常，这意味着其 limits 值大于 requests 值（即 limit > request）。

特性：
* 中等优先级： Burstable Pod 的优先级介于 Guaranteed 和 BestEffort 之间。
* 资源灵活性： 它们被保证获得其 requests 所定义的资源量。如果节点有空闲资源，它们可以“突发”使用超出 requests 但不超过 limits 的额外资源。
* 次于 BestEffort 被驱逐： 当节点资源不足时，Burstable Pod 会在 BestEffort Pod 被驱逐之后才会被考虑驱逐。如果 Burstable Pod 超出了其内存 requests 但未超过 limits，当内存不足时，它将成为被驱逐的候选者。

使用场景：
适用于工作负载资源需求波动较大的应用，例如 Web 服务器、消息队列或批处理作业。它们可以从临时可用的额外资源中受益，同时也能在资源紧张时接受一定程度的性能下降。

3. BestEffort (尽力而为)

判定标准：
如果一个 Pod 的所有容器都没有设置任何 CPU 或内存的 requests 和 limits，那么它就会被分类为 BestEffort。

特性：
* 最低优先级： BestEffort Pod 拥有最低的优先级。
* 无资源保证： 它们不会被保证获得任何特定量的 CPU 或内存资源。仅当节点上有充足的剩余资源时，它们才会获得运行所需的资源。
* 最容易被驱逐： 在节点资源紧张时，BestEffort Pod 会是第一个被驱逐的对象。

使用场景：
适用于非关键性的、可以容忍中断和资源变化的后台任务、开发/测试环境中的一次性 Pod，或不需要稳定性能的辅助性服务。

QoS 与驱逐策略

当 Kubernetes 节点面临资源压力（例如，内存不足）时，kubelet 会启动驱逐（eviction）过程以释放资源。QoS 等级在决定驱逐顺序中扮演着至关重要的角色：

BestEffort Pods 首先被驱逐。
Burstable Pods 其次被驱逐，尤其是那些已经超出其 requests 的 Pod。
Guaranteed Pods 最后才会被驱逐，并且只有在它们超出其 limits 或节点本身被关闭时才会发生。

值得注意的是，CPU 被认为是“可压缩”资源，如果容器超出其 CPU limit，它会被限流（throttling）而不是被驱逐。而内存是“不可压缩”资源，超出内存 limit 可能会导致容器甚至 Pod 被终止和驱逐。

最佳实践与总结

为关键应用使用 Guaranteed QoS： 确保核心业务应用获得最高的资源保障和最稳定的性能。
为大多数应用使用 Burstable QoS： 为那些资源需求有一定波动但仍需基本保障的应用提供灵活性。合理设置 requests 和 limits 是关键。
谨慎使用 BestEffort QoS： 仅用于真正非关键的、可中断的工作负载。
合理设置 requests 和 limits： 这是 Kubernetes 资源管理的基础。过高会导致资源浪费，过低会导致应用被限流或驱逐。进行充分的性能测试和基准测试以确定合适的值。
监控资源使用： 持续监控 Pod 的资源使用情况，结合 Prometheus、Grafana 等工具，可以帮助你发现资源瓶颈并优化 QoS 配置。

通过有效利用 Kubernetes QoS 机制，运维团队可以更好地管理集群资源，提高应用可靠性，并确保在多租户或高负载环境下关键服务的可用性和性能。