使用负载感知调度

ACK集群Pro版 调度器的负载感知调度功能会根据节点的实际负载情况,将Pod优先调度到负载较低的节点,以实现节点负载均衡,降低节点故障风险。前提条件 已安装ack-koordinator组件,且版本为1.1.1-ack.1及以上。具体操作,请参见 ack-...

容器网络FAQ

问题现象 Pod无法访问自己暴露的服务,存在时好时坏或者调度到自己就出问题的现象。问题原因 Flannel集群可能未开启回环访问。说明 低于v0.15.1.4-e02c8f12-aliyun版本的Flannel不允许回环访问。升级版本后,仍默认不允许回环访问,但可以...

升级ACK灵骏集群

为避免过期版本集群存在的安全和稳定性风险,同时保证您业务的连贯性,容器服务ACK采用原地升级的方式升级 ACK灵骏集群 版本。您可以通过控制台升级集群的Kubernetes版本,也可以独立升级控制面和节点池,灵活控制升级节奏。本文介绍集群...

历史功能发布记录(2023年)

全部 使用SysOM定位容器内存问题 支持单独运行集群检查 新增OpenAPI RunClusterCheck支持单独发起集群检查,支持集群升级前置检查,您可随时发起集群升级检查任务,并根据结果安排集群升级计划。全部 发起集群检查 备份中心组件migrate-...

集群管理常见问题

本文汇总了集群管理的常见问题。EMR支持哪些地域?EMR集群是否支持升级版本?高可用集群什么部署3个Master节点?如何开启磁盘加密?开启后有什么影响?如何清理创建失败的集群?创建集群时报错“ECS库存不足”,该如何处理?是否支持磁盘...

启用节点自动伸缩

集群的容量规划无法满足应用Pod调度时,您可以使用 节点自动伸缩 方案实现节点的自动扩缩。节点自动伸缩 适用于扩容规模较小(例如开启弹性的节点池数量少于20,或对应节点池中的节点数量少于100),工作负载批次较为稳定,以单次伸缩为...

使用负载热点打散重调度

ack-koordinator组件提供负载热点打散重调度能力,可以感知集群内节点负载的变化,自动地优化超过负载水位安全阈值的节点,防止出现负载极端不均衡的情况。本文介绍如何使用负载热点打散重调度及其高级配置参数。使用限制 仅支持ACK Pro版...

历史功能发布记录(2022年)

全部 创建集群 ACK Serverless支持集群故障诊断和集群巡检 ACK Serverless集群 巡检可以定时扫描集群运行状况,发现集群中潜在的风险,如云资源配额余量、Kuberrnetes集群关键资源水位等。ACK Serverless集群 故障诊断包括Pod诊断、网络...

历史功能发布记录(2020年及之前)

全部 热迁移ACK标准版集群至ACK Pro版集群 集群访问SLB支持选择规格 集群创建时API Server访问的入口SLB实例已支持自选规格,您可根据自身需求选择不同规格的SLB实例,满足对API Server的不同访问压力。全部 创建ACK Pro版集群 节点池支持...

常见问题

当然系统计算的行列是保障正常运行的资源要求,即当用户需要加速时,可以增加行列,或者当集群资源不够时,可以减少行列,这些都需要根据自己所在MaxCompute Project的情况具体分析,包括下述 如何加速任务的运行速度?均是提供一个通用的...

节点与节点池FAQ

修复GPU节点容器启动问题 添加Kubernetes集群节点的常见问题 移除节点时提示”drain-node job execute timeout”错误 ACK集群中kubelet目录路径是什么?支持自定义吗?如何更换节点池OS镜像?更换节点池OS镜像的方法与升级节点池的方法一致...

成本洞察功能说明

您可以通过ACK成本洞察功能查看集群、命名空间、节点池和应用等成本可视化大盘。本文介绍如何查看集群洞察分析及成本可视化大盘。前提条件 确保Kubernetes集群的版本为1.18.8及以上,否则请升级集群。具体操作,请参见 升级ACK集群K8s版本...

创建Kubernetes托管版集群

创建Kubernetes托管版集群时,您只需创建节点,无需维护控制面板。控制面板由阿里云容器服务创建并托管,降低了运维成本,帮助您聚焦业务应用。本文介绍如何通过容器服务控制台创建Kubernetes托管版集群。索引 前提条件 使用限制 计费相关 ...

弹性伸缩FAQ

spec:containers:name:nginx image:nginx:1.7.9#Replace it with your exactly<image_name:tags>.ports:containerPort:80 常见问题什么节点自动伸缩组件无法弹节点?请检查是否存在如下几种场景:配置伸缩组的实例类型无法满足Pod的...

常见问题

Q:什么情况下会导致复制延迟增大?A:出现如下情况时会导致复制延迟增大:主节点写入负载高,产生了过多的Redo日志,导致只读节点来不及应用。只读节点负载过高,抢占了过多原本属于应用Redo日志的资源。I/O出现瓶颈,导致读写Redo日志过...

手动升级集群

为避免过期版本集群存在的安全和稳定性风险,同时保证您业务的连贯性,容器服务ACK采用原地升级的方式升级ACK集群版本。您可以通过控制台升级集群的Kubernetes版本,也可以独立升级控制面和节点池,灵活控制升级节奏。本文介绍集群升级前后...

弹性伸缩FAQ

k8s.io/cluster-autoscaler/node-template/resource/{资源名}:{资源大小} 示例:k8s.io/cluster-autoscaler/node-template/resource/hugepages-1Gi:2Gi 为什么Pod无法调度到节点自动伸缩组件弹节点?受底层资源占用计算精度约束,自动...

创建加密计算托管集群

本文介绍如何在控制台创建阿里云容器服务安全加密计算托管集群(Alibaba Cloud Container Service for Kubernetes-Trusted Execution Environment,简称ACK-TEE)。索引 前提条件 使用限制 步骤一:登录容器服务管理控制台 步骤二:配置...

功能特性

扩容专属集群节点磁盘空间 共享集群专属集群互迁 支持修改实例运行的集群,即将实例从专属集群迁移到公共集群,或者从公共集群迁移到专属集群。专属集群与公共集群实例间的迁移 专属集群实例管理 支持对专属集群进行手动续费、变更节点配置...

创建有状态工作负载StatefulSet

虚拟集群IP:即ClusterIP,指通过集群的内部IP暴露服务,选择该值,服务只能够在集群内部可以访问,这也是默认的ServiceType。说明 您的服务类型为 虚拟集群IP 时,才能设置 实例间发现服务(Headless Service)。节点端口:即NodePort,...

创建无状态工作负载Deployment

虚拟集群IP:即ClusterIP,指通过集群的内部IP暴露服务,选择该值,服务只能够在集群内部可以访问,这也是默认的ServiceType。说明 您的服务类型为 虚拟集群IP 时,才能设置 实例间发现服务(Headless Service)。节点端口:即NodePort,...

在ACK集群部署多租户任务调度管理

在ACK集群中,企业可以通过AI套件中的任务管理工具Arena、队列调度管理系统Kube Queue、配额管理工具ElasticQuotaTree以及Prometheus监控打造企业级任务调度系统。本文将从实际案例出发自底而上地介绍如何基于ACK集群构建一个任务调度系统...

调度至Arm虚拟节点

集群调度器默认优先调度到ECS节点,ECS节点资源不足时调度到虚拟节点。在不修改调度器计分插件权重的情况下,如集群中存在资源充足的x86 ECS节点,即使通过nodeAffinity配置了优先调度到Arm架构的节点,Pod也可能会被调度到x86架构的ECS...

调度至Arm虚拟节点

集群调度器默认优先调度到ECS节点,ECS节点资源不足时调度到虚拟节点。在不修改调度器计分插件权重的情况下,如集群中存在资源充足的x86 ECS节点,即使通过nodeAffinity配置了优先调度到Arm架构的节点,Pod也可能会被调度到x86架构的ECS...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...

事件监控

您可以通过使用NPD结合SLS的Kubernetes事件中心、配置NPD集群检查项以及异常事件离线功能、使用钉钉、使用SLS离线Kubernetes事件及使用EventBridge离线Kubernetes事件,实时监控集群的异常与问题。费用说明 ACK事件监控功能默认上报集群...

使用Gang scheduling

ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度问题。本文介绍如何使用Gang scheduling。重要提示 请预留足够资源:使用弹性节点池时请保证弹性节点池的最大资源量以及节点...

使用Gang scheduling

ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度问题。本文介绍如何使用Gang scheduling。重要提示 请预留足够资源:使用弹性节点池时请保证弹性节点池的最大资源量以及节点...

时间属性配置说明

重跑说明 用于定义节点生成的实例是否可以重跑,即从数据幂等性考虑,任务是否可以重跑,或者在什么情况下可以重跑。生效日期 用于定义节点正常自动调度运行的时间范围,该时间范围外,节点将不再自动调度。使用说明 调度任务的时间属性...

常见问题

集群相关 为什么某些地域无法创建E-HPC集群?如果您在E-HPC支持的地域和可用区下,不能创建E-HPC集群。可能是由于该地域不支持创建集群所需的相关资源,或者资源库存不足。例如:该地域不支持创建NAS文件系统,或者NAS文件系统的库存不足,...

Hadoop集群迁移至DataLake集群

本文将详细阐述如何将您已有的旧版数据湖集群(Hadoop),高效地迁移至数据湖集群(DataLake),以下分别简称“旧集群”和“新集群”。迁移过程将充分考虑旧集群的版本、元数据类型以及存储方式,并针对这些因素,提供适应新集群的迁移策略...

计算资源优化

基于云基础设施的操作系统优化 阿里云提供了Alibaba Cloud Linux操作系统镜像,是阿里云基于龙蜥社区(OpenAnolis)的龙蜥操作系统(Anolis OS)打造的操作系统发行版,在兼容RHEL/CentOS生态的同时,为云上应用程序提供安全、稳定、高性能...

历史功能发布记录(2021年)

全部 创建节点池 ACK新配额管理 ACK加强配额展示和申请功能,细化增加了ACK托管集群、ACK专有集群、ACK Serverless集群、ACK Edge集群、注册集群等各项配额在控制台的展示以及在配额中心的申请入口。全部 使用限制 ACK Serverless集群 支持...

依赖关系

本文为您介绍依赖关系的相关问题。配置调度依赖前您需先了解以下内容 什么调度依赖 为什么要设置调度依赖 DataWorks上如何设置调度依赖?哪些场景不支持设置调度依赖?不需要依赖的表如何删除?调度依赖配置常见问题 提交节点报错:当前...

快速使用EMR Workflow

常见问题 报错“The bucket you access does not belong to you”问题 相关文档 EMR Workflow的更多介绍,请参见 什么是EMR Workflow。更多任务类型的详细信息,请参见 任务类型。工作流相关的操作,请参见 管理工作流。

手工缩容节点组

服务组件Decommission 如果您的集群安装了以下服务,请在删除ECS前对已安装的这些服务组件先进行Decommission操作,否则可能会导致任务调度失败以及数据安全的问题。YARN NodeManager Decommission HDFS DataNode Decommission SmartData ...

常见问题

本文介绍自建Kubernetes集群部署VNode来使用ECI的常见问题。网络相关问题 云上服务如何访问线下IDC的Pod IP?线下IDC服务如何访问云上的Pod IP?内网域名无法解析怎么办?线下IDC服务如何访问云上服务?镜像拉取相关问题 使用自建的容器...

节点伸缩概述

集群的容量规划无法满足应用Pod调度时,您可以使用ACK提供的节点伸缩功能,自动扩缩节点资源以进行调度容量的补充。ACK目前提供 节点自动伸缩 与 节点即时弹性 两种弹性方案,后者相较于前者有着更快的弹性速度、更高的交付效率和更低的...

阿里云Elasticsearch实例FAQ

本文列举了阿里云Elasticsearch(ES)相关的常见问题,包括购买、退订、配置、访问、查询、写入、插件、分词、日志、重启、负载或状态异常、备份与恢复、监控报警等相关问题。常见问题概览 购买或退订实例问题 购买ES实例时选错配置,如何...

配置集群巡检

E-HPC支持集群巡检功能,可以定时检查集群运行环境,帮助您了解集群状态,及时发现集群问题。功能介绍 集群巡检是E-HPC提供的集群运维功能,可以通过云助手在集群各节点中执行相关脚本,用于检查集群运行环境是否正常,包括检查集群各项...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库专属集群 负载均衡 云安全中心 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用