常见报错及解决方案

1.10.0.yaml A:可以先跳过错误,加上-skip-actions install_cluster,执行./hopctl install-ppwd-overwrite-coredns-config-skip-actions install_clusteru Q:升级底座后 mq 的两个 broker 的 POD 出现 OOMkilled 的报错,这种情况该如何...

错误和消息

您无法预见所有可能的异常,但您可以编写异常处理程序,让您的程序在出现异常时继续运行。任何PL/SQL块都可以有一个异常处理部分,该部分可以有一个或多个异常处理程序。例如,异常处理部分可以使用以下语法,其中ex_name_n是异常的名称,...

常见问题

问题描述 在ACK+Virtual Node的场景下,可能会出现Pod显示已经调度到virtual-kubelet节点,但是一直没有新的事件更新的现象。这种情况下,您需要获取对应的virtual-kubelet日志,根据报错信息进行问题排查。说明 如果有新的事件产生,您...

虚拟交换机剩余IP状态感知调度

在多个集群同时使用同一个虚拟交换机或多个节点同时使用同一个虚拟交换机时,可能出现Pod调度到节点上后由于虚拟交换机可用IP不足启动失败的情况。这种情况下,Pod控制器通常会重建Pod,之后原生Kubernetes集群调度器通常会再次调度Pod到...

诊断服务端报错问题

步骤三:诊断异常出现的原因 掌握应用异常的统计信息还不足以诊断异常出现的原因。虽然日志中异常堆栈包含调用的代码片段,但并不包含这次调用的完整上下游信息和请求参数。ARMS探针采用了字节码增强技术,让您能够以很小的性能消耗捕获...

Cava 异常处理

建议用户在除法、数组访问和对象访问之前都进行合法性检测,从而避免异常出现。除0异常 代码示例:int b=0;int a=1/b;除0异常-double c=0;double b=1/c;浮点数除0不抛异常 int a=1/c;浮点数除0不抛异常 最佳实践:int b=0;int a=0;if(b!0)...

基础资源监控

配置报警规则时,选择 资源范围 为 容器组Pod,选择命 名空间 为对应应用所在命名空间,选择 容器组Pod 为 全部,则当该命名空间下的任一Pod出现规则描述中的指标异常时,则触发报警。应用指标水位状况预警,针对对应集群下指定命名空间的...

工作负载推荐配置

在ACK集群中配置工作负载(Deployment、StatefulSet、DaemonSet、Job、CronJob等)时,您需考虑多种因素,以确保应用可以稳定、可靠地运行。...如果您的应用Pod运行出现问题,请先参见 Pod异常问题排查、应用FAQ 进行自排查。

如何查看应用级别的日志?

您可以通过监控大盘,查看应用的实例分组下各Pod的实时日志。当应用出现异常情况时,可以通过查看Pod的实时日志来排查问题。更多信息,请参见 查看实时日志。

Pod异常问题排查

本文介绍关于Pod异常问题的诊断流程、排查方法、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod...

Pod异常问题排查

本文介绍关于Pod异常问题的诊断流程、排查方法、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod...

Pod演练场景

Kubernetes集群中Pod资源故障场景,包含删除PodPod网络异常场景。每个Pod场景下都包含通用的Pod筛选参数,用于查找目标Pod。通用参数 参数名称 参数说明 Pod资源名称 Pod资源名称,多个资源名称之间使用逗号分隔,表示选择多个PodPod...

Pod诊断

Pod发生OOM异常Pod容器异常退出。Pod ConfigMap或Secret配置异常Pod健康检查失败。Pod PVC配置异常Pod镜像拉取异常。诊断流程 集群诊断收集部分集群信息并识别其中的异常,然后根据识别到的异常进行深入的异常诊断。诊断融合了基于...

Pod诊断

Pod发生OOM异常Pod容器异常退出。Pod ConfigMap或Secret配置异常Pod健康检查失败。Pod PVC配置异常Pod镜像拉取异常。诊断流程 集群诊断收集部分集群信息并识别其中的异常,然后根据识别到的异常进行深入的异常诊断。诊断融合了基于...

演练场景说明

Pod演练场景 Kubernetes集群中Pod资源故障场景,包含删除PodPod网络异常场景。每个Pod场景下都包含通用的Pod筛选参数,用于查找目标Pod。Container演练场景 Kubernetes集群中Pod资源下的容器故障场景,目前包含删除容器以及容器内故障...

sandboxed-container-helper

检测安全沙箱节点上是否有泄露的存储、容器或者Orphan Pod,并且向 kube-apiserver 上报异常事件。您可以在 ACK 集群中安装ack-node-problem-detector来采集和监控对应的事件,详细介绍请参见 事件监控。使用说明 sandboxed-container-...

资源调度概述

为了解决这个问题,ACS提供Gang Scheduling功能,保障同一个作业下的所有Pod能够同时启动,防止因部分Pod异常而导致整个作业阻塞。使用Gang Scheduling Capacity Scheduling ACS通过Kubernetes原生的ResourceQuota机制 限制和控制命名...

ossfs异常问题排查

出现此类事件的原因:CSI组件在拉起ossfs容器时,ossfs异常退出,导致Pod CrashLoopBackOff。OSS连通性检查出错(例如Bucket不存在和权限配置错误等)、OSS挂载路径不存在、无读写权限等初始化检查的错误均可能导致此问题。解决方案 执行...

修复漏洞CVE-2020-8557的公告

kubelet的驱逐管理器(eviction manager)中没有包含对Pod中挂载的/etc/hosts 文件的临时存储占用量...在集群节点上执行以下命令,可以发现运行在该节点上的Pod存在异常大小的 etc-hosts 文件。find/var/lib/kubelet/pods/*/etc-hosts-size+1M

管理容器组(Pod

容器组(Pod)是Kubernetes中最小的可部署单元。Pod代表了Kubernetes中一个独立的应用程序运行实例,...相关文档 如遇Pod状态异常,相关处理方法请参见 Pod异常问题排查。关于Pod调度的最佳实践,请参见 实现ECI Pod可用区打散以及亲和调度。

容器防护设置

容器K8s威胁检测项 类型 检测项 容器集群异常 K8s API Server执行异常指令 Pod异常目录挂载 K8s Service Account横向移动 恶意镜像Pod启动 异常网络连接 反弹Shell网络外连 可疑网络外连 疑似内网横向移动 恶意进程(云查杀)DDoS木马 可疑...

集群巡检项及解决方案

Ingress就绪Pod百分比 异常影响:检查Ingress Deployment已就绪的Pod百分比,小于100表明Ingress Pod可能出现问题,无法正常启动或健康检查失败。解决方案:通过Pod诊断或Ingress异常排查文档查找问题Pod。关于异常问题排查,请参见 Nginx ...

集群巡检项及解决方案

Ingress就绪Pod百分比 异常影响:检查Ingress Deployment已就绪的Pod百分比,小于100表明Ingress Pod可能出现问题,无法正常启动或健康检查失败。解决方案:通过Pod诊断或Ingress异常排查文档查找问题Pod。关于异常问题排查,请参见 Nginx ...

集群巡检项及解决方案

Ingress就绪Pod百分比 异常影响:检查Ingress Deployment已就绪的Pod百分比,小于100表明Ingress Pod可能出现问题,无法正常启动或健康检查失败。解决方案:通过Pod诊断或Ingress异常排查文档查找问题Pod。关于异常问题排查,请参见 Nginx ...

查看实时日志

查看实时日志 当应用出现异常情况的时候,可以通过查看实时日志来排查容器(Pod)相关问题。登录 EDAS控制台。在左侧导航栏选择 应用管理>应用列表。在 应用列表 页面选择 地域 和 命名空间,在 集群类型 下拉列表中选择 容器服务/...

查看实时日志

当应用出现异常情况时,您可以通过 SAE 控制台或者SLS控制台查看Pod的实时日志,以便定位问题。在SAE控制台查看实时日志 登录 SAE控制台。在左侧导航栏,选择 应用管理>应用列表,在顶部菜单栏选择地域,然后单击具体应用名称。在应用详情...

查看实时日志

操作步骤 当应用出现异常情况的时候,可以通过查看实时日志来排查容器(Pod)相关问题。登录 EDAS控制台。在左侧导航栏,单击 应用管理>应用列表,在顶部菜单栏选择地域并在页面上方选择微服务空间,在 集群类型 下拉列表中选择 K8s集群,...

使用ACK Net Exporter定位网络问题

以tcp_reset探针为例,当出现Pod收到了一个访问未知端口的正常报文时,ACK Net Exporter会捕获以下事件信息。type=TCPRESET_NOSOCK pod=storage-monitor-5775dfdc77-fj767 namespace=kube-system protocol=TCP saddr=100.103.42.233 sport=...

存储FAQ-Flexvolume

Pod异常退出,导致数据卷挂载点在卸载过程中没有清理干净,最终导致Pod无法删除。Kubelet的GC流程对数据卷垃圾回收实现并不完善,目前需要手动或脚本自动化实现垃圾挂载点的清理工作。您需要在问题节点运行以下脚本,对垃圾挂载点进行清理...

存储FAQ-Flexvolume

Pod异常退出,导致数据卷挂载点在卸载过程中没有清理干净,最终导致Pod无法删除。Kubelet的GC流程对数据卷垃圾回收实现并不完善,目前需要手动或脚本自动化实现垃圾挂载点的清理工作。您需要在问题节点运行以下脚本,对垃圾挂载点进行清理...

数据处理状态查询API

CHUNK_TEXT_SERVER_INVOKE_ERROR(120005,"切分文本服务调用出现异常"),CHUNK_TEXT_READ_LAYOUT_ERROR(120006,"读取文件layout出现异常"),CHUNK_TEXT_PARSE_LAYOUT_ERROR(120007,"解析文件layout出现异常"),CHUNK_TEXT_PARSE_ERROR(120008,...

使用 Capacity Scheduling

kubectl-n test scale deploy test-app-replicas 5 查看对应的 ReplicaSet,发现 DESIRED 是 5,但 CURRENT 是4,证明有个 Pod异常。kubectl-n test get rs NAME DESIRED CURRENT READY AGE test-app-5ddc68c994 5 4 4 3m10s 查看 ...

云盘存储卷FAQ

启动挂载了云盘的Pod时提示 had volume node affinity conflict 问题现象 在启动挂载云盘的Pod的时候,出现Pod无法启动的情况并报错 had volume node affinity conflict。问题原因 所有的PV中都存在 nodeaffinity 属性,当PV中 ...

节点伸缩概述

节点运维:对于开发者来说,在扩缩容过程中,相关异常都可以通过Pod事件同步,他们只需管理Pod的生命周期。功能拓展:支持扩展机制,例如结合 Descheduler 准备弹性资源。节点即时弹性 支持无侵入式地将资源供给策略、节点生命周期管理与您...

H5 性能

JS 异常监控 实时监控并展示出现 JS 异常的 H5 页面、异常最近上报时间以及上报次数,帮助您快速定位 JS 错误位置。可查看所有或指定异常页面的所有 JS 异常,同时支持按异常上报时间对异常页面进行排序。如需异常页面数据,单击列表右上方...

概览

实例消息堆积量 消息堆积量 Topic消息堆积量 高于上边界 连接数过高、连接数波动较大或连接数持续峰值 系统负载过高、TCP连接池不足、应用程序或服务出现异常、某些应用程序或服务在某些时候进行了大量的TCP连接操作。实例公网TCP连接的...

在边缘场景无缝运行使用InClusterConfig的业务Pod

背景信息 当需要把原生Kubernetes中,通过InClusterConfig(即Kubernetes Service)访问kube-apiserver的业务Pod部署到边缘环境中,会出现以下问题:问题一:Pod通过InClusterConfig地址访问kube-apiserver,节点上默认网络规则(iptables/...

将报警配置功能接入注册集群

报警配置功能提供容器场景报警能力的统一管理,包括容器服务异常事件报警,以及容器场景指标报警...event pod-failed sls.app.ack.pod.failed 集群镜像拉取失败事件 集群容器副本Pod出现镜像拉取失败事件。event image-pull-back-off sls.app....

OSS存储卷FAQ

类型 问题 挂载问题 OSS存储卷挂载时间延长 OSS存储挂载权限问题 OSS静态卷挂载失败 使用问题 OSS静态卷访问Bucket过慢 OSS控制台看到文件大小为0 文件目录挂载后,显示为文件对象 OSS服务端监控到大量异常请求流量 通过OSS存储卷写入的...

容器服务报警管理

event pod-failed sls.app.ack.pod.failed 集群镜像拉取失败事件 集群容器副本Pod出现镜像拉取失败事件。event image-pull-back-off sls.app.ack.image.pull_back_off cluster-ops-err集群管控运维异常报警规则集 无可用LoadBalancer 集群...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
威胁情报服务 云监控 Web应用防火墙 数据安全中心 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用