本文解析了Kubernetes集群中因Karpenter合并机制导致超大规格节点持续低利用率却未被回收的异常现象。通过监控数据分析和实验验证,揭示了调度器优先选择空闲大节点的行为模式与Karpenter的稳定期条件相互冲突的核心机制。提出基于PriorityClass的优先级调度解决方案,有效打破周期性任务阻碍节点回收的循环。该方案在生产环境实现92%问题发生率和37%闲置资源降低的实际收益,为云原生架构的资源优化提供实践路径。
A guide on monitoring network connection limits in AWS EC2 instances and exporting network metrics using a custom Prometheus exporter
This article provides shell scripts to help identify unused AWS Load Balancer resources, including load balancers without listeners and target groups without healthy targets, which can help optimize AWS costs.
最近开始使用 AWS cn-north-1,因为国区和国际区的区别,在部署 EKS 时还是花费了几点时间