在阿里巴巴,我们如何先于用户发现和定位 Kubernetes 集群问题?

在阿里巴巴,我们如何先于用户发现和定位 Kubernetes 集群问题?

作者:彭南光(光南)本文整理自阿里云高级研发工程师彭南光(光南) 在 KubeCon China 2021 大会的演讲实录,分享了阿里巴巴是如何通过自研通用链路探测+定向巡检工具 KubeProbe 应对大规模集群的稳定性挑战的。关于阿里云云原生团队在本次 KubeCon 上分享的全部内容沉淀于电子...

有没有可参考的关于如何在用户面前发现和定位Kubernetes集群问题的Demo?

有没有可参考的关于如何在用户面前发现和定位Kubernetes集群问题的Demo?

使用ASK容器化部署大语言模型FastChat

1 课时 |
16 人已学 |
免费

使用Kubernetes监控定位Pod状态异常根因

1 课时 |
162 人已学 |
免费

如何使用Kubernetes监控定位慢调用

1 课时 |
137 人已学 |
免费
开发者课程背景图

TensorFlow on Kubernetes性能瓶颈定位

当前性能问题描述 增加worker数,一定范围内能带来较好的性能提升,但是继续增加worker数时,训练性能提升不明显; 增加ps数,一定范围内能带来较好的性能提升,但是继续增加ps数时,训练性能提升不明显; 可能原因: 与ps和worker的分布情况强相关: 目前的调度策略,主要根据服务器的cpu...

Kubernetes 应用故障的一些定位方法

常备工作 准备一个工具镜像 其中包含 nslookup, ping, curl, 甚至是 ab、siege 等常用工具以及一个顺手的 Shell。一言不合就可以用静态 Pod 的方式将其运行到 Kubernetes 之中进行内部诊断。 sysctl -a | grep forwarding 你猜这是...

Kubernetes-应用部署问题定位和处理

1、应用部署问题处理的整体思路 在将容器化的应用部署到Kubernetes集群中,可能会出现各种问题。根据Kubernetes的架构设计原理,容器化应用对外提供服务出现的主要问题在三个点上: 1)应用本身的问题:此问题为应用本身的问题,不在此文中进行详细的阐述; 2)作为容器化应用逻辑主机的Pod的...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云容器服务 ACK
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
234772+人已加入
加入
相关电子书
更多
智算时代,基于 Kubernetes 落地云原生 AI
容器服务 ACK 加速企业应用现代化升级
容器服务 ACK – 智算时代的现代化应用平台
立即下载 立即下载 立即下载
相关镜像

容器服务Kubernetes版定位相关内容