Pod诊断

Pod容器镜像下载阻塞情况 检查Pod同节点是否有其他Pod的容器镜像下载被阻塞。请检查Pod状态及日志。更多信息,请参见 Pod异常问题排查。Pod容器镜像Secrets有效性检查 检查Pod拉取镜像的Secrets是否有效。请检查Pod状态及日志。更多信息,...

如何处理常见的Pod问题

部署在 Serverless 应用引擎 SAE(Serverless App Engine)上的应用运行时,可能会出现Pod问题。本文介绍常见的Pod问题和解决方法。ImagePullBackOff 当 SAE 无法获取到Pod中某个容器的镜像时,将出现此错误。可能原因:镜像名称无效,例如...

查看应用事件

在EDAS控制台,您可以查看部署在K8s集群中的应用的事件信息,从而了解应用运行时的状态并快速聚焦问题。操作步骤 登录 EDAS控制台。在左侧导航栏单击 应用列表。在 应用列表 页面选择地域、微服务空间和 集群类型,然后单击目标应用名称。...

ACK Virtual Node

修复某些情况下启用WaitForFirstConsumer功能导致Pod一直Pending问题。此次升级不会对业务造成影响。v2.9.2 registry-vpc.$RegionId.aliyuncs.com/acs/virtual-nodes-eci:v2.9.2 2023年04月28日 修复ACK标准版无法调度虚拟节点的问题。此次...

日志

本文说明如何查看应用的Pod日志,从而了解Pod情况。应用限制 EDAS标准版不支持查看应用的Pod日志,专业版和铂金版支持查看应用的Pod日志。功能入口 登录 EDAS控制台。在左侧导航栏,单击 应用管理>应用列表,在顶部菜单栏选择地域并在页面...

云盘存储卷FAQ

kubectl set image daemonset/flexvolume acs-flexvolume=registry.cn-hangzhou.aliyuncs.com/acs/flexvolume:v1.9.7-42e8198 -n kube-system 对于已经出问题Pod,需要重建。关于Flexvolume组件版本信息,请参见 Flexvolume。卸载云盘时...

收集GPU节点的问题诊断信息

GPU节点问题 如果不属于Pod运行失败的情况,例如GPU节点运行失败或者其他GPU节点环境问题,您可以执行以下操作:登录到该GPU节点上,执行以下命令,下载并执行诊断脚本。sudo curl ...

应用FAQ

检查Pod 关于Pod异常问题的处理,请参见 Pod异常问题排查。检查Deployment 创建Deployment、DaemonSet、StatefulSet或Job等资源时,可能为Pod问题。请参见 Pod异常问题排查 检查Pod问题。您也可以通过查看和Deployment相关的事件及日志...

使用Prometheus配置报警规则的最佳实践

POD"}/100000)by(namespace,pod)*100()vector(0)>=85 在指定命名空间或Pod下,容器副本Pod的CPU资源水位超过Pod Limit的85%时,会触发报警。若此Pod未配置Limit,值为0。85%的默认阈值为推荐的参考值,实际取值可以以您的业务情况为准。如...

DNS FAQ

什么通过exec无法进入CoreDNS Pod问题现象 使用 kubectl-n kube-system exec-it {coredns pod} bash 及类似命令无法进入到CoreDNS Pod问题原因 CoreDNS所使用的容器镜像是基于Scratch构建,不具备Shell执行环境。解决方案 可以使用 ...

常见问题

如何解决HPA启动时CPU或内存飙高造成扩容多余Pod的多弹现象?为什么HPA审计日志数值未达阈值但扩缩了?基于组件指标的水平伸缩常见问题 如果执行kubectl get hpa后发现target一栏为<unknown>怎么办?如何查找HPA支持的指标名称?

Pod诊断

容器智能运维平台 提供Pod诊断功能,帮助您诊断异常的Pod信息。本文介绍Pod诊断的检查项以及对应的修复方案。容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI...

使用ACK Net Exporter定位网络问题

configs:source_labels:[_meta_kubernetes_pod_annotation_prometheus_io_scrape]action:keep regex:true-source_labels:[_meta_kubernetes_pod_annotation_prometheus_io_path]action:replace target_label:_metrics_path_regex:(.+)-...

kube-scheduler组件监控

本文主要介绍kube-scheduler组件的指标清单、对应大盘的使用指导以及常见指标异常的问题解析。指标清单 指标是组件对外透状态和参数的方式之一,kube-scheduler组件使用的指标清单如下。指标清单 类型 说明 scheduler_scheduler_cache_...

ack-kubernetes-webhook-injector

在对权限要求相对较高的云上场景中,需要将Pod的IP地址动态地加入或移指定的阿里云产品白名单,以实现对权限最细粒度的控制。您可以使用ack-kubernetes-webhook-injector通过为Pod添加注解的方式动态地将Pod IP加入或移白名单。本文...

常见问题

本文汇总了通过阿里云容器服务Kubernetes版使用ECI时的常见问题,包括ECI Pod、网络等问题。ECI Pod 如何创建GPU实例?如何查看ECI实例ID?使用了镜像缓存,为什么创建ECI Pod的速度还是很慢?创建ECI Pod后,Pod一直处于Pending状态怎么办...

Kubernetes集群网络异常的排查方法

问题描述 在Kubernetes集群内,某个节点上的Pod出现网络访问异常,具体现象如下所示:Pod访问外网异常。Pod访问其他Service异常。Pod访问其他节点上的Pod异常。问题原因 集群内ECS的安全组配置错误或者冲突。集群内VPC的路由表条目配置错误...

网络概述

服务发现DNS ACK使用DNS来实现应用的服务发现能力,例如客户端应用可以通过Service的服务名解析它的ClusterIP访问,可以通过StatefulSet的Pod名解析出Pod的IP地址。采用DNS服务发现的能力让集群中应用间的调用与IP地址和部署环境解耦。...

自定义成本核算的策略

为解决上述场景下企业成本核算时的数据定制需求,成本套件提供自定义价格模板功能,您可以通过编辑模板配置Pod的各资源单价,即可聚合出Pod的定价成本。说明 目前Pod定价成本仅支持以API的形式透,开启并完成定价配置后,您可以通过API...

网络概述

服务发现DNS ACS使用DNS来实现应用的服务发现能力,例如客户端应用可以通过Service的服务名解析它的ClusterIP访问、可以通过StatefulSet的Pod名解析出Pod的IP地址。采用DNS服务发现的能力让集群中应用间的调用与IP地址和部署环境相解耦。...

AIOps套件概述

诊断项 说明 Pod诊断 涵盖了常见的Pod问题,例如Pod启动失败、Pod镜像拉取失败、Pod运行异常等,并在发现异常时给相应的根因及修复方案。节点诊断 涵盖了常见的节点问题,例如节点NotReady、Node网络异常、运行时异常等,并在发现异常时...

AIOps套件概述

诊断项 说明 Pod诊断 涵盖了常见的Pod问题,例如Pod启动失败、Pod镜像拉取失败、Pod运行异常等,并在发现异常时给相应的根因及修复方案。节点诊断 涵盖了常见的节点问题,例如节点NotReady、Node网络异常、运行时异常等,并在发现异常时...

Service异常问题排查

Service删除后SLB未删除 什么情况下会自动删除SLB?SLB负载不均 问题原因 SLB的调度算法设置不合理。问题现象 SLB后端服务器负载不均。解决方案 Local模式Service(即 externalTrafficPolicy:Local)需要将SLB调度算法设置为加权轮询算法,...

Service异常问题排查

Service删除后CLB未删除 什么情况下会自动删除SLB?CLB负载不均 问题原因 CLB的调度算法设置不合理。问题现象 CLB后端服务器负载不均。解决方案 Local模式Service(即 externalTrafficPolicy:Local)需要将CLB调度算法设置为加权轮询算法,...

OSS存储卷FAQ

创建硬链接时返回错误Operation not supported或Operation not permitted ossfs常见问题 挂载问题 OSS静态卷卸载失败,Pod一直处于Terminating状态 控制台检测失败问题 控制台检测长期卡住,或失败无信息透,或显示unknown error 网络...

Service异常问题排查

Service删除后SLB未删除 什么情况下会自动删除SLB?问题原因 SLB的调度算法设置不合理。问题现象 SLB后端服务器负载不均。解决方案 如果业务为长连接,则需要将SLB调度算法设置为加权最少连接算法,即为Service添加注解 service.beta....

驱逐及防护

默认情况下,会保证至少50%的Pod处于Ready的情况下才允许触发ACS主动驱逐的逻辑。但对于不满足Scale子资源Workload生产的Pod或者裸Pod,默认没有此类防护策略。ACS默认防护和您配置的PDB策略不会冲突,可同时生效。集群维护窗口 设置 为了...

部署ImageCache CRD

查看Pod情况。kubectl get pod-n kube-system 预期返回:NAME READY STATUS RESTARTS AGE alibabacloud-eci-imagecache-controller-8857984bd-2lnhs 1/1 Running 1 7s.查看ImageCache CRD。kubectl get crd imagecaches.eci.alibabacloud....

云盘存储卷FAQ

问题原因 该Event是kubelet报的错误信息,由于kubelet存在一个方法,该方法用来循环检查所有节点的Pod所使用的存储是否Ready,如果存储卷没有Ready,会出现上面的报错信息。该Event报错并没有实际意义,仅说明在当前时间点挂载还未完成,...

Pod配置独立虚拟交换机和安全组

索引 步骤一:创建网络定义 步骤二:创建Pod 部署示例 常见问题 如何判断Pod是否使用了PodNetworking的网络配置?Pod创建后为什么没有使用PodNetworking中的网络配置?步骤一:创建网络定义 在 ACK Serverless ACK 中,您可以创建多个...

常见问题

网络相关问题 云上服务如何访问线下IDC的Pod IP?线下IDC服务如何访问云上的Pod IP?内网域名无法解析怎么办?线下IDC服务如何访问云上服务?镜像拉取相关问题 使用自建的容器镜像仓库无法拉取镜像,怎么办?Pod调度相关问题 如何调度Pod到...

基本概念

容器垂直伸缩(VPA)容器垂直伸缩会基于Pod的资源使用情况自动为集群设置资源占用的限制,从而让集群将Pod调度到有足够资源的最佳节点上。容器垂直伸缩也会保持最初容器定义中资源 request 和 limit 的占比。适用于无法水平扩展的应用,...

Ingress诊断

请根据错误日志查找问题Pod并修复。关于Ingress异常问题排查,请参见 Nginx Ingress异常问题排查。Ingress资源上存在地址 检查Ingress资源被Ingress Controller成功更新了地址。该值不存在时,检查Ingress的IngressClass是否存在对应的...

Ingress诊断

请根据错误日志查找问题Pod并修复。关于Ingress异常问题排查,请参见 Nginx Ingress异常问题排查。Ingress资源上存在地址 检查Ingress资源被Ingress Controller成功更新了地址。该值不存在时,检查Ingress的IngressClass是否存在对应的...

Ingress诊断

请根据错误日志查找问题Pod并修复。关于Ingress异常问题排查,请参见 Nginx Ingress异常问题排查。Ingress资源上存在地址 检查Ingress资源被Ingress Controller成功更新了地址。该值不存在时,检查Ingress的IngressClass是否存在对应的...

自定义弹性资源优先级调度

whenTryNextUnits(集群版本1.24及以上,调度器为6.4版本及以上可用):描述Pod在何种情况下被允许使用后续Unit中的资源。policy:代表Pod采用的策略。可选值包括 ExceedMax、LackResourceAndNoTerminating、TimeoutOrExceedMax、...

通过巡检工具问题排查

检查节点网络是否正常 IaaS层网络问题 K8s节点间无法正常通信 K8s集群无法正常工作 ping出问题的Node节点;检查基础网络配置是否异常;如果仍然无法修复,请找研发。检查容器到节点、容器到容器、容器到Service网络、容器到NodePort是否正常...

Service FAQ

计算公式如下所示:V1.9.3.276-g372aa98-aliyun及之后版本 权重计算方式因为计算精度问题Pod间还会存在轻微的负载不均。在V1.9.3.276-g372aa98-aliyun及之后版本,CCM将Node上部署的Pod数量设置为Node权重,如下图所示,三台ECS的权重...

存储FAQ-CSI

csi-provisioner组件日志出现failed to renew lease xxx timed out waiting for the condition报错 存储组件导致的OOM问题 创建或挂载存储卷时,PVC提示no volume plugin matched csi-plugin的Pod监控上出现大量流量 云原生常见问题 Pod的...

使用Terway网络插件

详情见下表:Terway模式 创建集群时选择的Terway模式 使用的组件 特点 节点最大容器网络Pod数量 Pod维度网络(固定IP、虚拟交换机、安全组)支持配置的Pod数量 网络数据路径 共享ENI多IP模式 默认为terway-eniip,无需进行其他选择。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云防火墙 云监控 智能顾问 DDoS防护 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用