k8s诊断之记一次业务pod被异常删除的分析

k8s诊断之记一次业务pod被异常删除的分析

背景信息: 某用户反馈,头一天晚上21:05左右,某几个deployment的pod被重建了一遍,客户的pod有特殊限制,基本可以保证1个节点上就只有这一个pod独占,客户怀疑后端异常导致,这种问题可以先去看下元集群的信息,看看各种controller 的pod 在异常时间段有没...

K8S报错异常锦集(持续更新)

K8S报错异常锦集(持续更新)

更新镜像没反应 k8s组件异常①故障现象:使用脚本更新pod服务镜像,pod无变化,状态没更新;更新镜像:无变化 kubectl set image deployment/em-api em-api=192.168.90.10/zhufuc/em-api:v1.0-20201110100058 po...

使用ASK容器化部署大语言模型FastChat

1 课时 |
16 人已学 |
免费

使用Kubernetes监控定位Pod状态异常根因

1 课时 |
162 人已学 |
免费

如何发现Kubernetes中服务和工作负载的异常

1 课时 |
162 人已学 |
免费
开发者课程背景图
k8s诊断之记一次pod oom的异常shmem输出

k8s诊断之记一次pod oom的异常shmem输出

背景信息: 客户反馈java设置xms,xmx参数固定8G内存,而pod的limit则为16G, 三番五次出现了pod oom的情况,且oom的时候他的业务进程输出也是8g, 同时promethus的监控对应pod的working_set_memory也是8个多g, 剩下的几个g的内存到底去哪里了呢...

有大佬做native flink on k8s的部署方案吗,按照官网的配置,报这种异常,大佬帮忙瞅瞅

有大佬做native flink on k8s的部署方案吗,按照官网的配置,报这种异常,大佬帮忙瞅瞅

如何发现 Kubernetes 中服务和工作负载的异常

如何发现 Kubernetes 中服务和工作负载的异常

大家好,我是来自阿里云的李煌东,今天由我为大家分享 Kubernetes 监控公开课的第二节内容:如何发现 Kubernetes 中服务和工作负载的异常。本次分享由三个部分组成:一、Kubernetes 异常定位存在痛点;二、针对这些痛点,Kubernetes 监控如何更快、更准、更全的发现异常;三...

线上 leaderelection lost 导致 Kubernetes 组件异常退出的问题排查

线上 leaderelection lost 导致 Kubernetes 组件异常退出的问题排查

问题描述在线上集群中,遇到了 kube-scheduler,kube-controller-manager 频繁的异常退出重启,报错信息如下:排查处理流程选举失败一般是从几个方向去考虑排查:组件资源占用,给到组件过低的资源可能会导致选举失败ETCD 存在问题,比如 etcd 挂载的磁盘性能过差&am...

Kubernetes监控基发现Kubernetes集群大多数的异常基于什么啊?

Kubernetes监控基发现Kubernetes集群大多数的异常基于什么啊?

使用kubeadm搭建kubernetes单机master,亲测无异常

使用kubeadm搭建kubernetes单机master,亲测无异常

本专栏记录了楼主安装k8s master的过程,耗时2周,原因是百度上的教程基本都不好用。楼主承诺本文章好用,建议收藏。1.准备工作1.确认环境swapoff -a //关闭swap setenforce 0 //临时关闭selinux每台机器的以下内容不能相同sudo cat /sys/class...

记录一次k8s APIService 包含的借口异常导致删除Pod一直处于terminating状态

问题现象:k8s 执行 delete操作发现pod一直处于terminating问题排查执行:kubectl get APIService发现:v1beta1.events.k8s.io Local True 13d v1beta1.extensions Local True ...

k8s 监控程序Metric-server pod运行异常报:it doesn't contain any IP SANs

k8s 监控程序Metric-server pod运行异常:出现metrics-server error because it doesn't contain any IP SANs 查看 pod状态,pod 正在运行 但是pod状态不正常:kubectl get pods -n kube-syst...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云容器服务 ACK
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
234772+人已加入
加入
相关电子书
更多
智算时代,基于 Kubernetes 落地云原生 AI
容器服务 ACK 加速企业应用现代化升级
容器服务 ACK – 智算时代的现代化应用平台
立即下载 立即下载 立即下载
相关镜像

容器服务Kubernetes版异常相关内容