使用配置巡检检查集群工作负载

如果未配置的话,Pod有被调度到资源紧张的节点上的风险,可能会出现容器内进程运行缓慢的情况。修改Pod Spec,增加 resources.requests.cpu 字段。示例:cpuLimitsMissing 通过检查Workload的Pod Spec中是否未配置 resources.limits.cpu ...

使用配置巡检功能检查注册集群Workload安全隐患

如果未配置的话,Pod有被调度到资源紧张的节点上的风险,可能会出现容器内进程运行缓慢的情况。修改Pod Spec,增加 resources.requests.cpu 字段。示例:cpuLimitsMissing 通过检查Workload的Pod Spec中是否未配置 resources.limits.cpu ...

容器镜像仓库构建服务失败问题排查

自动触发构建失败 问题现象:容器镜像服务构建系统会依靠您的源代码平台发送的Webhook请求来匹配构建规则,进而触发镜像构建,此时会出现构建失败问题。解决方法:代码仓库下的Webhook被误删除:需要您重建Webhook。您代码仓库中NameSpace...

故障排查

ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的排查方法 容器服务ACK应用故障排查 如何升级集群?排查故障的...

Pod异常问题排查

本文介绍关于Pod异常问题的诊断流程、排查方法、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查...如果该进程是容器的阻塞进程,OOM终止后容器会重启...

托管节点池概述

自愈:托管节点池监控节点的运行状态,如果节点超过10分钟未上报节点状态,或者状态为NotReady,容器服务尝试通过重启故障节点来恢复潜在的故障。因此,节点上的Pod被重启。托管节点池与普通节点池的区别 ACK提供普通节点池和托管...

Pod安全

如果攻击者能够利用应用程序中的漏洞并获得正在运行的容器的Shell访问权限,这可能会出现安全问题。您可以通过多种方式缓解此类风险。一种方式是,通过从容器镜像中删除Shell。另一种方式是,将USER指令添加到您的Dockerfile或以非root用户...

节点异常问题排查

常见排查方法 节点故障诊断 当节点出现故障时,您可以使用容器服务ACK提供的故障诊断功能,一键诊断节点异常。登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...

节点异常问题排查

常见排查方法 节点故障诊断 当节点出现故障时,您可以使用容器服务ACK提供的故障诊断功能,一键诊断节点异常。登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...

(停止维护)ACK发布Kubernetes 1.22版本说明

在任务(Job)中声明.spec.completionMode 为 Indexed,即可在运行的容器组(Pod)的中得到一个新注解(Annotation)batch.kubernetes.io/job-completion-index,同时容器会被注入一个新的环境变量(Environment Variable)JOB_COMPLETION_...

ACK灵骏发布Kubernetes 1.22版本说明

在任务(Job)中声明.spec.completionMode 为 Indexed,即可在运行的容器组(Pod)的中得到一个新注解(Annotation)batch.kubernetes.io/job-completion-index,同时容器会被注入一个新的环境变量(Environment Variable)JOB_COMPLETION_...

GPU FAQ

问题现象 在Alibaba Cloud Linux 3上执行 systemctl daemon-reload、systemctl daemon-reexec 等操作后,在GPU容器内部无法正常使用GPU设备,具体表现为在GPU容器内部执行 nvidia-smi 会出现如下报错。sudo nvidia-smi Failed to ...

ECI Pod生命周期

本文介绍ECI Pod(即ECI...一般在InitContainer运行时,应用容器会处于Waiting状态,直到InitContainer退出。运行中(Running)容器已经成功创建,并且正在运行。运行终止(Terminated)容器运行终止并退出,包括运行成功终止和运行失败终止。

ECI Pod生命周期

本文介绍ECI Pod(即ECI...一般在InitContainer运行时,应用容器会处于Waiting状态,直到InitContainer退出。运行中(Running)容器已经成功创建,并且正在运行。运行终止(Terminated)容器运行终止并退出,包括运行成功终止和运行失败终止。

ECI实例生命周期介绍

本文介绍ECI实例的生命...一般在InitContainer运行时,应用容器会处于Waiting状态,直到InitContainer退出。运行中(Running)容器已经成功创建,并且正在运行。运行终止(Terminated)容器运行终止并退出,包括运行成功终止和运行失败终止。

故障排查与常见问题

故障排查索引 集群类型 相关文档 托管版与专有版容器集群ACK 使用OpenAPI诊断工具进行故障排查 Service异常问题排查 Nginx Ingress异常问题排查 DNS解析异常问题排查 使用DNSTAP Analyser诊断异常 Pod异常问题排查 节点异常问题排查 存储...

容器镜像服务ACR个人版产品升级维护公告

在维护过程中,个人版创建、更新、删除等功能将禁止使用,容器镜像推送可能出现异常,容器镜像拉取不受影响。建议您提前规划产品使用计划,如遇异常,请在升级维护结束后进行重试。给您带来的不便敬请谅解,若您遇到任何问题,可以通过...

搭建类似妙鸭相机的应用

虽然目前开源版本的facechain下载后即可配置使用,但存在以下问题:训练和推理的过程中直接从模型Hub下载模型,整个应用涉及多个模型,大小约25 GB,导致整体耗时长,并且直接通过公网下载模型对带宽和网络稳定性要求很高,一旦无法下载...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...

强制终止Sidecar容器并忽略容器退出码

当您采用Sidecar容器的形式实现类似DaemonSet的效果时,可能会出现Job类Pod无法运行完成的情况,此时可以通过设置环境变量的方式,为Sidecar容器标记容器类型,并设置忽略Sidecar容器的退出码,以保证Job可以正常运行完成。功能说明 在ACK ...

忽略Sidecar容器的NotReady状态

在某些场景下,您可能不希望Sidecar容器状态影响整个Pod状态,例如:使用Sidecar容器用于收集日志,但日志容器出现问题,不应该影响业务容器对外提供服务。针对上述场景,ECI支持了忽略容器NotReady状态的功能。如果您不希望某一容器的...

使用tcpdump抓包分析网络问题

背景信息 容器出现网络异常时,您可能需要抓取网络报文来分析定位问题,但实际操作时可能碰到以下问题:抓包需要使用exec进入容器,但网络异常时,容器不一定处于运行状态,您可能无法使用exec进入容器。抓包需要使用tcpdump工具,但容器...

在离线混部概述

在线类型应用的管理员:更关注容器在混合部署后的干扰问题,因为混部会更容易产生资源竞争,应用的响应时间往往会出现长尾现象(即总有一部分请求的延迟显著地高于平均值,通常表现为响应时间的90或99分位值大幅高于平均值),导致应用服务...

功能发布记录

2023-12-29 不涉及 忽略Sidecar容器的NotReady状态 等待ClusterIP同步完成后再创建ECI Pod 由于ECI Pod和负责同步Service的组件是并行启动运行的,当集群中存在大量Service和Endpoint时,可能会出现因ClusterIp未同步而导致Pod访问超时的...

故障排查

如果您在使用 ACK Serverless集群 时出现故障,可根据以下故障分类匹配故障场景和解决方案,帮助您快速排查问题,提升运维效率。分类 相关文档 集群资源和集群组件异常问题排查 集群检查项及修复方案(包括升级集群、迁移集群、安装组件、...

OSS存储卷FAQ

问题原因:升级集群重启kubelet时,由于容器网络重启,导致OSSFS进程重启,主机与容器目录映射失效。解决方法:需要重启容器,或重建Pod。您可以通过配置健康检查实现容器或Pod的自动重启。关于使用OSS存储的更多信息,请参见 OSS存储卷...

使用SysOM定位容器内存问题

为解决因容器引擎层的不透明性而导致的故障排查困难问题,阿里云 容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)团队推出操作系统内核层的容器监控可观测能力,为您提供更可靠、透明的容器引擎层,助力您更顺利地进行...

Pod异常问题排查

本文介绍关于Pod异常问题的诊断流程、排查方法、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的...如果该进程是容器的阻塞进程,OOM终止后容器会重启。通过Pod内存监控查看内存增长曲线,...

设置容器启动和退出顺序

Pod内包含两个容器,c1容器的启动优先级高于c2容器,且c1容器配置了Readiness Probe,c2容器会在c1容器准备就绪后才启动。apiVersion:apps/v1 kind:Deployment metadata:name:test-launch labels:app:test spec:replicas:1 selector:...

设置容器启动和退出顺序

调用 CreateContainerGroup 接口创建ECI实例所采用的参数示例如下,实例内包含两个容器,c1容器的启动优先级高于c2容器,且c1容器配置了Readiness Probe,c2容器会在c1容器准备就绪后才启动。{"RegionId":"cn-beijing","SecurityGroupId":...

向虚拟节点Pod注入Sidecar容器

自动结束Sidecar容器 对于Job类Pod,Sidecar容器可能导致业务容器完成后Job无法退出的情况,您可以通过 强制终止Sidecar容器并忽略容器退出码 来解决问题。升级Sidecar容器 使用Sidecar模式后,您可能有Sidecar容器升级等运维需求。您...

向虚拟节点Pod注入Sidecar容器

自动结束Sidecar容器 对于Job类Pod,Sidecar容器可能导致业务容器完成后Job无法退出的情况,您可以通过 强制终止Sidecar容器并忽略容器退出码 来解决问题。升级Sidecar容器 使用Sidecar模式后,您可能有Sidecar容器升级等运维需求。您...

管理容器组(Pod)

故障诊断 在容器组列表页面,您可以单击目标容器组右侧的 操作 列的 诊断,对该容器组进行故障诊断。更多信息,请参见 使用集群诊断。设置容器的CPU和内存资源上下限 应用创建完成后,您可以根据业务需求调整容器的CPU和内存资源上下限,...

边缘节点池管理概述

因此,跨跃不同分组节点的Service流量,大概率出现访问不可达、或者访问效率低下的问题。节点池管理方案 针对以上场景,容器服务 Edge 版 提出了如下图所示解决方案。节点池节点管理:针对节点分组抽象了节点池的概念,以节点池视角对...

安全概览

容器服务ACK提供安全概览功能,支持对节点、容器镜像、容器运行时、工作负载配置进行风险识别及安全加固,可以帮助您提升云上资源和业务应用的安全治理效率。本文介绍如何使用容器服务ACK的安全概览功能。使用说明 安全概览功能仅支持ACK...

安全概览

容器服务ACK提供安全概览功能,支持对节点、容器镜像、容器运行时、工作负载配置进行风险识别及安全加固,可以帮助您提升云上资源和业务应用的安全治理效率。本文介绍如何使用容器服务ACK的安全概览功能。使用说明 安全概览功能仅支持ACK...

使用前必读

网络相关 注册集群接入您自建或其他云厂商的Kubernetes集群时,请确保目标集群与阿里云之间的网络稳定性,自建的Kubernetes集群通过公网访问阿里云资源时,可能会出现超时等不稳定性问题。注册集群不支持创建和使用LoadBalancer类型的服务...

使用ACK AI助手进行故障排查和智能问答

容器服务ACK AI助手(后文简称“ACK AI助手”)是阿里云容器服务团队提供的基于大模型的新型助手功能。基于阿里云容器服务团队在Kubernetes和云原生领域沉淀的知识经验、阿里云容器服务运维体系的观测以及ACK技术专家诊断的经验,ACK AI...

方案规划

本文介绍使用容器服务ACK过程中涉及的规划及使用方案等常见问题容器服务ACK中使用容器运行应用的大致流程是什么容器服务ACK与阿里云其他产品一起使用的推荐方案是什么?如何选择容器服务ACK的集群类型?如何规划集群容量?ECS服务器...

设置容器终止消息

配置示例 在以下示例中,配置了terminationMessagePath字段为/tmp/termination-log,则容器会把终止消息写入/tmp/termination-log 给Kubernetes接收。apiVersion:v1 kind:Pod metadata:name:msg-path-demo spec:containers:name:msg-path-...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
容器镜像服务 弹性容器实例 容器服务 Kubernetes 版 ACK 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用