故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

故障排查

ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的排查方法 容器服务ACK应用故障排查 如何升级集群?排查故障的...

查看集群信息

异常:当前集群异常。集群资源使用量 显示集群的CPU和内存信息。说明 如果您想查看组件的资源消耗,请前往容器服务ACK控制台查看相应Pod的资源使用情况。所属ACK集群 ACK集群的名称。命名空间 ACK集群的命名空间。创建时间 显示集群创建的...

查看集群列表信息

异常:表示集群异常。创建时间/运行时间 集群创建的时间以及运行的时长。付费类型 集群的付费类型。操作 支持的集群操作:详情:进入集群的详情页,查看集群创建后的详细信息。展示已创建集群的详细信息,包括集群信息、网络信息、软件信息...

ES节点连接报错|ES集群状态异常

问题描述 同VPC下的客户端连接ES服务报错No alive nodes found in your cluster 问题原因 1、集群读写QPS较大,各个节点负载较高,load的指标已经超过了当前集群规格的负载能力,导致集群异常无法连接。2、集群可以正常连接,但是查询或者...

容器防护设置

开启容器K8s威胁检测能力后,云安全中心将为您开启 容器集群异常 类型告警的检测。云安全中心支持的检测项详情,请参见 容器K8s威胁检测项。版本限制 仅云安全中心的旗舰版支持该功能,其他版本不支持。购买和升级云安全中心服务的具体操作...

Persistent Buffer Pool

Persisted Buffer Pool(PBP)特性能够帮助您在集群异常退出或者重新启动时,仍然可以使用集群退出前的Shared Buffer Pool。前提条件 支持的 PolarDB PostgreSQL版 的版本如下:PostgreSQL 14(内核小版本14.5.2.0及以上)PostgreSQL 11...

Persistent Buffer Pool

Persisted Buffer Pool(PBP)特性能够帮助您在集群异常退出或者重新启动时,仍然可以使用集群退出前的Shared Buffer Pool。前提条件 支持的 PolarDB PostgreSQL版(兼容Oracle)的版本如下:Oracle 2.0(内核小版本2.0.14.2.0及以上)说明...

查看集群信息

异常:当前集群异常。集群资源使用量 显示集群的CPU和内存信息。说明 如果您想查看组件的资源消耗,请前往容器服务ACK控制台查看相应Pod的资源使用情况。所属ACK集群 ACK集群的名称。命名空间 ACK集群的命名空间。创建时间 显示集群创建的...

配置专属集群告警

参数 说明 集群异常状态通知 选择集群处于异常状态时,是否需要发送告警。打开:发送告警。关闭:不发送告警。DU使用率(集群级别)设置集群的DU使用率,取值范围为1%~200%,默认为80%。当集群的DU使用率达到该值时,发送告警。说明 当前只...

启用集群检查

警告:需要确认,引起集群异常的情况需要处理。异常:尽快处理,避免集群无法正常工作。针对单项检查结果,可以单击状态颜色框,查看检查对象信息及具体检查结果。检查结果包含检查内容、可能影响以及推荐的修复方案。您可以参考异常影响及...

使用集群检查

警告:需要确认,引起集群异常的情况需要处理。异常:尽快处理,避免集群无法正常工作。针对单项检查结果,可以单击状态颜色框,查看检查对象信息及具体检查结果。检查结果包含检查异常内容、可能影响以及推荐的修复方案。您可以参考异常...

管理用户

具有sudo权限的用户如果操作错误(如误删除E-HPC软件栈模块),会导致集群异常。用户组 说明 普通权限组 适用于只有提交、调试作业需求的普通用户。sudo权限组 适用于需要管理集群的管理员。除提交、调试作业外,还可以执行sudo命令进行...

容器服务报警管理

背景信息 容器服务报警管理包含的功能:集群异常事件报警,此类报警的数据链路同步自容器服务事件中心。更多信息,请参见 事件监控。集群相关基础资源的关键指标报警,此类报警的数据链路同步自云监控基础资源监控。更多信息,请参见 基础...

常见问题旧版索引

故障排查 ACK集群异常 容器服务ACK应用故障排查 如何升级集群?排查故障的经典步骤与常见原因 如何通过查看日志排查故障?产品FAQ 授权管理FAQ 集群管理FAQ 节点与节点池FAQ 容器网络FAQ Service FAQ Ingress FAQ DNS FAQ 应用FAQ 存储FAQ-...

使用集群诊断

警告:需要确认,引起集群异常的情况需要处理。异常:尽快处理,避免集群无法正常工作。未知:未正常完成检查或结果未知。Pod诊断包括 Pod、ClusterComponent 检查项。通过Pod状态、集群组件状态综合判定Pod异常原因。在诊断详情页面,可以...

2022年度更新日志

修复集群异常时部署工单无法关闭的问题 修复删除应用后未清楚关联流水线信息的问题 修复历史工单未记录部分快照数据导致点击查询不到的问题 修复在编排时添加变量失败的问题 优化 流水线执行后列表状态自动刷新 应用编排版本和变量版本增加...

查看集群信息

重要 这些资源由阿里云容器服务进行管理,请勿随意删除或自行修改,避免导致集群异常,影响集群内应用的正常运行。集群监控 对接阿里云可观测监控 Prometheus 版,对集群进行资源监控,支持快速查看负载的CPU、内存、网络等指标的使用率,...

查看集群信息

重要 这些资源由阿里云容器服务进行管理,请勿随意删除或自行修改,避免导致集群异常,影响集群内应用的正常运行。集群监控 对接阿里云可观测监控 Prometheus 版,对集群进行资源监控,支持快速查看负载的CPU、内存、网络等指标的使用率,...

查看集群信息

重要 这些资源由阿里云容器服务进行管理,请勿随意删除或自行修改,避免导致集群异常,影响集群内应用的正常运行。集群监控 对接阿里云可观测监控 Prometheus 版,对集群进行资源监控,支持快速查看负载的CPU、内存、网络等指标的使用率,...

ACK集群概述

详细信息,请参见 集群异常状态。删除中(deleting)删除集群中。删除失败(delete_failed)删除集群失败。已删除(deleted,该状态用户不可见)成功删除集群。图 1.集群状态流转 开源项目 有关容器服务ACK使用的开源项目,请参见 开源项目...

配置集群巡检

定期检查:在日常运维中定时检查集群运行环境,以便及时发现集群异常并进行处理,避免影响作业运行。使用限制 仅适用于Linux集群。仅适用于云上集群,不支持混合云集群。配置集群巡检 登录 弹性高性能计算控制台。在顶部菜单栏左上角处,...

控制台访问集群异常问题排查

本文介绍控制台访问集群异常问题的问题现象、问题原因和解决方案。例如,当前集群APIServer请求异常,访问容器组日志时报错API Server请求异常,当前账号未被授予该操作所需的集群RBAC权限,当前账号未被授予该操作所需的RAM权限。当前集群...

使用集群诊断

警告:需要确认,引起集群异常的情况需要处理。异常:尽快处理,避免集群无法正常工作。未知:未正常完成检查或结果未知。节点诊断包括 Node、NodeComponent、ClusterComponent、ECSControllerManager、GPUNode 检查项,通过节点状态、节点...

使用VPC附加网段扩充集群的虚拟交换机

需要 提交工单 联系技术支持 配置管控面,否则集群管控面将无法访问到新节点上和其上的Pod,这将导致但不限于以下问题:kubectl exec/logs 操作失败、webhook/apiservice无法调用、Pod或其他资源无法创建等的集群异常。ACK专有版的管控节点...

容器资产管理

如果您需要查看容器集群异常告警,请先开启K8s威胁检测配置。具体操作,请参见 容器K8s威胁检测。同步最新资产 查看容器资产信息前,您需要先同步最新的容器资产信息,确保将新接入的容器资产同步到云安全中心资产列表。登录云安全中心控制...

集群检查项及修复方案

重要 误删除APIService会导致集群异常。如果您不清楚异常APIService用途,请 提交工单 联系我们。kubectl-n kube-system delete apiservices${your-abnormal-apiservice-name} 集群中存在废弃API 判断废弃API的来源,对废弃API采取对应处理...

重启实例或节点

如果并发度为100%,将同时重启所有节点,导致集群无法访问,未写入磁盘的缓存数据可能存在丢失情况,一般建议在集群异常需紧急恢复场景应用。说明 预计所需总时间表示按照前一次单节点重启时间的均值,乘以总节点个数进行评估。可能存在...

计费说明

ACK集群Pro版 收取集群管理费用,涉及云产品资源费用。本文主要介绍 ACK集群Pro版 的计费项、...产品计费常见问题 关于购买产品购买、集群使用时可能遇到的计费相关问题,例如集群异常或删除失败时是否会产生计费,请参见 资源计费常见问题。

集群检查项及修复方案

重要 误删除APIService会导致集群异常。如果您不清楚异常APIService用途,请 提交工单 联系我们。kubectl-n kube-system delete apiservices${your-abnormal-apiservice-name} 节点存在使用HostPath的Pod 在Node替盘升级时,如果Pod使用了...

升级ACK Edge集群

边缘节点池和控制面最多只能相差两个次要版本,例如控制面为1.22版本,边缘节点池最低是1.20版本,否则会导致集群异常。您可以登录 容器服务管理控制台,进入 集群 页面,在集群列表的 版本 列查看当前 ACK Edge集群 的版本。ACK Edge集群 ...

基于多集群网关实现同城容灾

创建多集群网关后,通过设置流量规则可以实现按权重路由流量、根据Header将流量路由到指定集群的能力,当其中一个集群异常时,流量将自动路由到另一个集群中。前提条件 已开通MSE微服务引擎。已开启舰队管理功能。具体操作,请参见 开启...

RecoverCluster-重置并修复集群

调用RecoverCluster重置并修复异常集群。接口说明 仅当集群状态为 exception(异常)时,才能调用该接口重置并修复集群。您可以通过调用 ListClusters 获取集群 ID 及集群状态。建议您操作前导出所有作业数据。重置并修复集群会有以下影响...

API概览

RecoverCluster 重置并修复集群 调用RecoverCluster重置并修复异常集群。DeleteCluster 释放一个集群 调用DeleteCluster释放指定集群。混合云集群 API 标题 API概述 CreateHybridCluster 创建一个E-HPC混合云集群 调用CreateHybridCluster...

查看集群信息

ACS集群提供集群信息页面...重要 这些资源由阿里云容器计算服务进行管理,请勿随意删除或自行修改,避免集群异常,影响集群内应用的正常运行。任务日志 查看集群任务、任务状态、变更时间等。失败任务将提示失败信息,协助问题的排查和诊断。

故障排查

分类 相关文档 集群资源和集群组件异常问题排查 集群检查项及修复方案(包括升级集群、迁移集群、安装组件、升级组件过程中出现的异常以及解决方案)Pod异常问题排查 Pod诊断 Service异常问题排查 Service诊断 Ingress异常问题排查 Ingress...

将报警配置功能接入注册集群

通过配置并查看 集群异常事件报警规则集 感知集群节点或容器节点异常。例如,集群节点Docker进程异常、集群节点进程异常及集群容器副本启动失败等异常。通过配置并查看 集群存储异常事件报警规则集 感知集群存储的变更与异常。通过配置并...

Kubernetes集群网络异常的排查方法

问题描述 在Kubernetes集群内,某个节点上的Pod出现网络访问异常,具体现象如下所示:Pod访问外网异常。Pod访问其他Service异常。Pod访问其他节点上的Pod异常。问题原因 集群内ECS的安全组配置错误或者冲突。集群内VPC的路由表条目配置错误...

查看集群信息

重要 这些资源由阿里云容器服务进行管理,请勿随意删除或自行修改,避免导致集群异常,影响集群内应用的正常运行。集群监控 对接阿里云可观测监控 Prometheus 版,对集群进行资源监控,支持快速查看负载的CPU、内存、网络等指标的使用率,...

集群状态

异常终止 如果集群创建过程中遇到不可恢复的错误时,则集群处于此状态。您可以在EMR控制台上释放该集群。您可以单击 状态 列的问号,查看异常原因。运行中 集群处于正常运行状态。终止中 单击集群操作列中的释放按钮可达到此状态,此状态...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库专属集群 云原生数据仓库AnalyticDB MySQL版 云数据库 Redis 版 Web应用防火墙 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用