如果未配置的话,Pod有被调度到资源紧张的节点上的风险,可能会出现容器内进程运行缓慢的情况。修改Pod Spec,增加 resources.requests.cpu 字段。示例:cpuLimitsMissing 通过检查Workload的Pod Spec中是否未配置 resources.limits.cpu ...
如果未配置的话,Pod有被调度到资源紧张的节点上的风险,可能会出现容器内进程运行缓慢的情况。修改Pod Spec,增加 resources.requests.cpu 字段。示例:cpuLimitsMissing 通过检查Workload的Pod Spec中是否未配置 resources.limits.cpu ...
自动触发构建失败 问题现象:容器镜像服务构建系统会依靠您的源代码平台发送的Webhook请求来匹配构建规则,进而触发镜像构建,此时会出现构建失败问题。解决方法:代码仓库下的Webhook被误删除:需要您重建Webhook。您代码仓库中NameSpace...
ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的排查方法 容器服务ACK应用故障排查 如何升级集群?排查故障的...
本文介绍关于Pod异常问题的诊断流程、排查方法、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查...如果该进程是容器的阻塞进程,OOM终止后容器会重启...
自愈:托管节点池会监控节点的运行状态,如果节点超过10分钟未上报节点状态,或者状态为NotReady,容器服务会尝试通过重启故障节点来恢复潜在的故障。因此,节点上的Pod会被重启。托管节点池与普通节点池的区别 ACK提供普通节点池和托管...
如果攻击者能够利用应用程序中的漏洞并获得正在运行的容器的Shell访问权限,这可能会出现安全问题。您可以通过多种方式缓解此类风险。一种方式是,通过从容器镜像中删除Shell。另一种方式是,将USER指令添加到您的Dockerfile或以非root用户...
常见排查方法 节点故障诊断 当节点出现故障时,您可以使用容器服务ACK提供的故障诊断功能,一键诊断节点异常。登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...
常见排查方法 节点故障诊断 当节点出现故障时,您可以使用容器服务ACK提供的故障诊断功能,一键诊断节点异常。登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...
在任务(Job)中声明.spec.completionMode 为 Indexed,即可在运行的容器组(Pod)的中得到一个新注解(Annotation)batch.kubernetes.io/job-completion-index,同时容器会被注入一个新的环境变量(Environment Variable)JOB_COMPLETION_...
在任务(Job)中声明.spec.completionMode 为 Indexed,即可在运行的容器组(Pod)的中得到一个新注解(Annotation)batch.kubernetes.io/job-completion-index,同时容器会被注入一个新的环境变量(Environment Variable)JOB_COMPLETION_...
问题现象 在Alibaba Cloud Linux 3上执行 systemctl daemon-reload、systemctl daemon-reexec 等操作后,在GPU容器内部无法正常使用GPU设备,具体表现为在GPU容器内部执行 nvidia-smi 会出现如下报错。sudo nvidia-smi Failed to ...
本文介绍ECI Pod(即ECI...一般在InitContainer运行时,应用容器会处于Waiting状态,直到InitContainer退出。运行中(Running)容器已经成功创建,并且正在运行。运行终止(Terminated)容器运行终止并退出,包括运行成功终止和运行失败终止。
本文介绍ECI Pod(即ECI...一般在InitContainer运行时,应用容器会处于Waiting状态,直到InitContainer退出。运行中(Running)容器已经成功创建,并且正在运行。运行终止(Terminated)容器运行终止并退出,包括运行成功终止和运行失败终止。
本文介绍ECI实例的生命...一般在InitContainer运行时,应用容器会处于Waiting状态,直到InitContainer退出。运行中(Running)容器已经成功创建,并且正在运行。运行终止(Terminated)容器运行终止并退出,包括运行成功终止和运行失败终止。
故障排查索引 集群类型 相关文档 托管版与专有版容器集群ACK 使用OpenAPI诊断工具进行故障排查 Service异常问题排查 Nginx Ingress异常问题排查 DNS解析异常问题排查 使用DNSTAP Analyser诊断异常 Pod异常问题排查 节点异常问题排查 存储...
在维护过程中,个人版创建、更新、删除等功能将会禁止使用,容器镜像推送可能出现异常,容器镜像拉取不受影响。建议您提前规划产品使用计划,如遇异常,请在升级维护结束后进行重试。给您带来的不便敬请谅解,若您遇到任何问题,可以通过...
虽然目前开源版本的facechain下载后即可配置使用,但存在以下问题:训练和推理的过程中会直接从模型Hub下载模型,整个应用涉及多个模型,大小约25 GB,导致整体耗时长,并且直接通过公网下载模型对带宽和网络稳定性要求很高,一旦无法下载...
使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...
当您采用Sidecar容器的形式实现类似DaemonSet的效果时,可能会出现Job类Pod无法运行完成的情况,此时可以通过设置环境变量的方式,为Sidecar容器标记容器类型,并设置忽略Sidecar容器的退出码,以保证Job可以正常运行完成。功能说明 在ACK ...
在某些场景下,您可能会不希望Sidecar容器状态影响整个Pod状态,例如:使用Sidecar容器用于收集日志,但日志容器出现问题,不应该影响业务容器对外提供服务。针对上述场景,ECI支持了忽略容器NotReady状态的功能。如果您不希望某一容器的...
背景信息 容器出现网络异常时,您可能需要抓取网络报文来分析定位问题,但实际操作时可能会碰到以下问题:抓包需要使用exec进入容器,但网络异常时,容器不一定处于运行状态,您可能无法使用exec进入容器。抓包需要使用tcpdump工具,但容器...
在线类型应用的管理员:更关注容器在混合部署后的干扰问题,因为混部会更容易产生资源竞争,应用的响应时间往往会出现长尾现象(即总有一部分请求的延迟显著地高于平均值,通常表现为响应时间的90或99分位值大幅高于平均值),导致应用服务...
2023-12-29 不涉及 忽略Sidecar容器的NotReady状态 等待ClusterIP同步完成后再创建ECI Pod 由于ECI Pod和负责同步Service的组件是并行启动运行的,当集群中存在大量Service和Endpoint时,可能会出现因ClusterIp未同步而导致Pod访问超时的...
如果您在使用 ACK Serverless集群 时出现故障,可根据以下故障分类匹配故障场景和解决方案,帮助您快速排查问题,提升运维效率。分类 相关文档 集群资源和集群组件异常问题排查 集群检查项及修复方案(包括升级集群、迁移集群、安装组件、...
问题原因:升级集群重启kubelet时,由于容器网络会重启,导致OSSFS进程重启,主机与容器目录映射失效。解决方法:需要重启容器,或重建Pod。您可以通过配置健康检查实现容器或Pod的自动重启。关于使用OSS存储的更多信息,请参见 OSS存储卷...
为解决因容器引擎层的不透明性而导致的故障排查困难问题,阿里云 容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)团队推出操作系统内核层的容器监控可观测能力,为您提供更可靠、透明的容器引擎层,助力您更顺利地进行...
本文介绍关于Pod异常问题的诊断流程、排查方法、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的...如果该进程是容器的阻塞进程,OOM终止后容器会重启。通过Pod内存监控查看内存增长曲线,...
Pod内包含两个容器,c1容器的启动优先级高于c2容器,且c1容器配置了Readiness Probe,c2容器会在c1容器准备就绪后才启动。apiVersion:apps/v1 kind:Deployment metadata:name:test-launch labels:app:test spec:replicas:1 selector:...
调用 CreateContainerGroup 接口创建ECI实例所采用的参数示例如下,实例内包含两个容器,c1容器的启动优先级高于c2容器,且c1容器配置了Readiness Probe,c2容器会在c1容器准备就绪后才启动。{"RegionId":"cn-beijing","SecurityGroupId":...
自动结束Sidecar容器 对于Job类Pod,Sidecar容器可能会导致业务容器完成后Job无法退出的情况,您可以通过 强制终止Sidecar容器并忽略容器退出码 来解决问题。升级Sidecar容器 使用Sidecar模式后,您可能会有Sidecar容器升级等运维需求。您...
自动结束Sidecar容器 对于Job类Pod,Sidecar容器可能会导致业务容器完成后Job无法退出的情况,您可以通过 强制终止Sidecar容器并忽略容器退出码 来解决问题。升级Sidecar容器 使用Sidecar模式后,您可能会有Sidecar容器升级等运维需求。您...
故障诊断 在容器组列表页面,您可以单击目标容器组右侧的 操作 列的 诊断,对该容器组进行故障诊断。更多信息,请参见 使用集群诊断。设置容器的CPU和内存资源上下限 应用创建完成后,您可以根据业务需求调整容器的CPU和内存资源上下限,...
因此,跨跃不同分组节点的Service流量,会大概率出现访问不可达、或者访问效率低下的问题。节点池管理方案 针对以上场景,容器服务 Edge 版 提出了如下图所示解决方案。节点池节点管理:针对节点分组抽象了节点池的概念,以节点池视角对...
容器服务ACK提供安全概览功能,支持对节点、容器镜像、容器运行时、工作负载配置进行风险识别及安全加固,可以帮助您提升云上资源和业务应用的安全治理效率。本文介绍如何使用容器服务ACK的安全概览功能。使用说明 安全概览功能仅支持ACK...
容器服务ACK提供安全概览功能,支持对节点、容器镜像、容器运行时、工作负载配置进行风险识别及安全加固,可以帮助您提升云上资源和业务应用的安全治理效率。本文介绍如何使用容器服务ACK的安全概览功能。使用说明 安全概览功能仅支持ACK...
网络相关 注册集群接入您自建或其他云厂商的Kubernetes集群时,请确保目标集群与阿里云之间的网络稳定性,自建的Kubernetes集群通过公网访问阿里云资源时,可能会出现超时等不稳定性问题。注册集群不支持创建和使用LoadBalancer类型的服务...
容器服务ACK AI助手(后文简称“ACK AI助手”)是阿里云容器服务团队提供的基于大模型的新型助手功能。基于阿里云容器服务团队在Kubernetes和云原生领域沉淀的知识经验、阿里云容器服务运维体系的观测以及ACK技术专家诊断的经验,ACK AI...
本文介绍使用容器服务ACK过程中涉及的规划及使用方案等常见问题。容器服务ACK中使用容器运行应用的大致流程是什么?容器服务ACK与阿里云其他产品一起使用的推荐方案是什么?如何选择容器服务ACK的集群类型?如何规划集群容量?ECS服务器...
配置示例 在以下示例中,配置了terminationMessagePath字段为/tmp/termination-log,则容器会把终止消息写入/tmp/termination-log 给Kubernetes接收。apiVersion:v1 kind:Pod metadata:name:msg-path-demo spec:containers:name:msg-path-...