本文介绍节点自动恢复的应用场景和处理流程。前提条件 已创建托管节点池或开启托管节点池。具体操作,请参见 管理托管节点池。已开启事件中心。具体操作,请参见 事件监控。触发条件 重要 当您打开了 当节点故障时重启节点 开关,节点自动...
名称 类型 描述 示例值 object 支持的 kubelet 配置 registryPullQPS long 镜像仓库的 QPS 上限。5 registryBurst long 突发性镜像拉取的个数上限。10 eventRecordQPS long 每秒可生成的事件数量。5 eventBurst long 事件记录的个数的突发...
名称 类型 描述 示例值 object 支持的 kubelet 配置 registryPullQPS long 镜像仓库的 QPS 上限。5 registryBurst long 突发性镜像拉取的个数上限。10 eventRecordQPS long 每秒可生成的事件数量。5 eventBurst long 事件记录的个数的突发...
在旧节点池的 节点 页面,批量对原有节点进行调度设置和排水操作,将旧节点池的应用逐步迁移至新节点池。在 节点 页面,选中旧节点池中的所有节点,单击 排水/设置不可调度,然后选中 设置为不可调度,并单击 确定。在 节点 页面,选中旧...
名称 类型 描述 示例值 object 支持的 kubelet 配置 registryPullQPS long 镜像仓库的 QPS 上限。5 registryBurst long 突发性镜像拉取的个数上限。10 eventRecordQPS long 每秒可生成的事件数量。5 eventBurst long 事件记录的个数的突发...
如果您希望对已存在节点应用自定义资源预留策略,您可以将已有节点移除出集群,然后重新添加节点。新添加的节点会默认执行自定义资源预留策略。移除节点和添加节点的标准操作及带来的影响,请参见 移除节点、添加已有节点。
CVE-2020-13401漏洞源于IPv6动态...以下kubelet版本都包含了kubernetes-cni服务,所以都会受到该漏洞影响:kubelet v1.18.0~v1.18.3 kubelet v1.17.0~v1.17.6 kubelet注意 由于ACK未开启IPv6,所有ACK集群不受该漏洞影响,您无需做任何操作。
affinity:nodeAffinity:preferredDuringSchedulingIgnoredDuringExecution:preference:matchExpressions:key:type operator:In values:virtual-kubelet weight:20-preference:matchExpressions:key:mykey4pod operator:In values:...
affinity:nodeAffinity:preferredDuringSchedulingIgnoredDuringExecution:preference:matchExpressions:key:type operator:In values:virtual-kubelet weight:20-preference:matchExpressions:key:mykey4pod operator:In values:...
apiserver-slos KubeAPIErrorBudgetBurn critical kube-apiserver-slos KubeAPIErrorBudgetBurn critical kube-apiserver-slos KubeAPIErrorBudgetBurn warning kube-apiserver-slos KubeAPIErrorBudgetBurn warning kube-state-metrics ...
当kubelet参数默认配置无法满足业务需求、您希望对集群节点进行个性化调整时,您可以在节点池维度自定义节点的kubelet参数配置,调整节点行为。例如,您可以调整集群资源预留以调配资源用量、自定义节点压力驱逐阈值以缓解集群资源不足、...
如果您希望将节点进行分组纳管,同时降低节点的运维负担,例如操作系统(OS)CVE漏洞自动修复、kubelet自动升级、节点故障时重启节点等,您可以启用托管节点池。托管节点池是ACK推出的自动化运维型节点池,在普通节点池的基础上支持多种...
在 应用市场 页面单击 应用目录 页签,选中 ack-kubernetes-elastic-workload 应用。在 ack-kubernetes-elastic-workload 页面,单击 一键部署。在 创建 面板中,选择集群和命名空间,然后单击 下一步。在 参数配置 页面,设置相应参数,...
共享GPU的隔离能力依赖Docker 19.03.5以及与其对应的Nvidia-container-...执行以下命令,在该GPU节点重新启动GPU安装程序。sudo docker ps|grep cgpu-installer|awk '{print$1}'|xargs docker rm-f 相关文档 共享GPU调度概述 安装共享GPU组件
告警项说明 kubelet 相关 报警名称 报警解析 KubeNodeNotReady 节点不是就绪状态 KubeNodeUnreachable 节点状态为 Unreachable KubeletTooManyPods 节点运行过多pod KubeNodeReadinessFlapping 查看集群内节点状态改变的频率 ...
步骤二:创建ECI Pod应用 说明 创建ECI Pod应用后,ASM可以通过Sidecar对ECI Pod应用进行数据平面化管理。方式一:通过配置Pod标签的方式创建ECI Pod应用 给Pod添加 alibabacloud.com/eci=true 的标签,Pod将以ECI方式运行,并且所在的节点...
步骤二:创建ECI Pod应用 说明 创建ECI Pod应用后,ASM可以通过Sidecar对ECI Pod应用进行数据平面化管理。方式一:通过配置Pod标签的方式创建ECI Pod应用 给Pod添加 alibabacloud.com/eci=true 的标签,Pod将以ECI方式运行,并且所在的节点...
then sed-i"s@KUBELET_EXTRA_ARGS=KUBELET_EXTRA_ARGS=${option}=${ALIBABA_CLOUD_LABELS}@g"$KUBELET_CONFIG_FILE else sed-i"/^\[Service\]/a\Environment=\"KUBELET_EXTRA_ARGS=${option}=${ALIBABA_CLOUD_LABELS}\""$KUBELET_CONFIG_...
使用elastic-workload 假设:有一个应用经过容量规划,预计最多有4个副本运行在ECS上,平时低峰时保留2个副本,超过4个副本时弹性伸缩到虚拟节点,防止干扰其他正常容量规划的应用。在Kubernetes中,任何一种负载都要解决两个问题,一个是...
grace-period=120-ignore-daemonsets=true#设置120秒钟的宽限期限,让任务优雅的关闭 预期输出:There are pending nodes to be drained:步骤二:卸载GPU节点旧版本驱动 登录节点,执行以下命令,关闭节点上的kubelet和containerd服务...
应用发布或扩容过程中,设置应用Pod被调度到不同类型节点资源的顺序。同时,在缩容过程中按照原调度顺序逆序缩容。支持 支持(能力增强:支持按原调度顺序逆序缩容)推荐。自定义弹性资源优先级调度 UnitedDeployment 将Deployment副本分组...
问题原因:若您在应用模板中配置了 securityContext.fsgroup 参数,kubelet在存储卷挂载完成后会执行 chmod 或 chown 操作,导致挂载时间延长。解决方法:若应用模板中配置了 securityContext.fsgroup 参数,请删除 securityContext 下的 ...
使用ECI时,您无需购买和管理底层ECS服务器,可以更加关注容器应用而非底层基础设施的维护工作,且仅为实际使用的资源付费。前提条件 已 基于ACK创建Ray Cluster。(可选)已了解如何在Ray Cluster中提交一个Job,例如 提交Ray Job。已部署...
Runtime安全为运行中的容器提供主动防护,主要实现方法是检测并阻止容器内发生恶意活动,减少应用程序的攻击面。通过Seccomp等手段限制容器应用对内核进行系统调用 配置容器或Pod以使用Seccomp配置文件 Linux操作系统有几百个系统调用,但...
在ACK集群中,节点是集群中的物理或虚拟机器,用于运行容器化应用程序。节点池是一组具有相同配置和用途的节点,例如节点规格、可用区、标签、污点等,便于对集群中的节点进行分组管理和运维。您可以在创建节点池时指定节点属性,也可以...
索引 插件区别 使用场景 注意事项 准备工作 步骤一:查看集群存储状态 步骤二:创建CSI类型OSS静态存储的PVC和PV 步骤三:更新应用关联的PVC 步骤四:卸载Flexvolume插件 步骤五:使用OpenAPI安装CSI插件 步骤六:修改现有节点配置 插件...
索引 插件区别 使用场景 注意事项 准备工作 步骤一:查看集群存储情况 步骤二:创建CSI类型NAS静态存储的PVC和PV 步骤三:更新应用关联的PVC 步骤四:卸载Flexvolume插件 步骤五:使用OpenAPI安装CSI插件 步骤六:修改现有节点配置 插件...
cat>/usr/lib/systemd/system/kubelet.service[Unit]Description=Kubernetes Kubelet After=docker.service Requires=docker.service[Service]ExecStart=data0/kubernetes/bin/kubelet \\-node-ip=${ALIBABA_CLOUD_NODE_NAME} \\-hostname-...
使用kubelet Configuration配置文件来管理kubelet的启动参数。支持指定节点上系统组件镜像的下载来源(公网或内网)。更新了添加节点时需要访问的公网地址列表。新增支持Red Hat Enterprise Linux 8.8操作系统。新增边缘节点接入参数。更多...
ack-onepilot 接入应用实时监控服务ARMS,实现自动发现应用拓扑、自动生成3D拓扑、自动发现并监控接口、捕获异常事务和慢事务,大幅提升线上问题诊断的效率。ack-prometheus-operator 对接开源Prometheus生态,支持类型丰富的组件监控,...
入门FAQ 方案规划 容器服务ACK中使用容器运行应用的大致流程是什么?容器服务ACK与阿里云其他产品一起使用的推荐方案是什么?如何选择容器服务ACK的集群类型?如何规划集群容量?ECS服务器怎么选型?如何选择阿里云容器镜像服务ACR个人版和...
通过部署CSI插件,您可以通过PV和PVC方式...timeout=150s-enable-leader-election=true-leader-election-type=leases-retry-interval-start=500ms-v=5 env:name:ADDRESS value:/var/lib/kubelet/csi-provisioner/dbfsplugin.csi.alibabacloud....
随着业务发展和应用数据增长,当云盘使用空间不足时,您可以通过云盘扩容来解决磁盘容量不足的问题。但容器服务Kubernetes 1.16之前的旧版本不支持云盘自动扩容,您需要手动扩容云盘。本文介绍如何通过手动扩容云盘增加云盘空间。使用说明 ...
随着业务发展和应用数据增长,当云盘使用空间不足时,您可以通过云盘扩容来解决磁盘容量不足的问题。但容器服务Kubernetes 1.16之前的旧版本不支持云盘自动扩容,您需要手动扩容云盘。本文介绍如何通过手动扩容云盘增加云盘空间。使用说明 ...
csi-compatible-controller组件支持在Flexvolume类型的集群中安装和使用CSI组件,让Flexvolume组件和CSI组件共存于一个集群内,通过安装该组件并依次切换Flexvolume集群中应用挂载的存储类型,使Flexvolume类型的存储逐渐过渡到CSI存储。...
问题原因 在 服务网格 开启mTLS后,kubelet向Pod发送的健康检查请求被Sidecar拦截,而kubelet没有对应的TLS证书,导致健康检查失败。解决方案 配置端口健康检查流量免于经过Sidecar代理,具体操作步骤如下:配置端口健康检查流量免于经过...
找到 ack-virtual-kubelet-autoscaler 应用,然后单击该应用。在应用详情页面,单击右上角的 一键部署。在 创建 面板,完成基本信息和参数配置。选择目标集群、命名空间和发布名称,然后单击 下一步。根据需要配置参数,然后单击 确定。...
Kubernetes集群中DNS域名解析原理 ACS集群中kubelet的启动参数有-cluster-dns=和-cluster-domain=,这两个参数分别被用来设置集群DNS服务器的IP地址和主域名后缀。ACS集群默认部署了一套CoreDNS工作负载,并通过 kube-dns 的服务名暴露DNS...
容忍度:容忍度(Toleration)应用于Pod上。容忍度允许调度器将该Pod调度到带有对应污点的Node。在ACK集群中,需要配置以下Toleration来容忍污点 virtual-kubelet.io/provider=alibabacloud:NoSchedule,才能让Pod使用ECI资源。tolerations...
近日Kubernetes社区披露了安全漏洞CVE-2022-3294,攻击者可以通过修改Node对象并向其发送代理请求,利用kube-apiserver中的缺陷绕过关于节点代理地址的校验,并访问APIServer所在私有网络内可能的服务端点。CVE-2022-3294漏洞被评估为中危...