ACK集群运行中节点安装云监控插件

ACK集群运行中节点安装了云监控插件,且监控运行状态正常,视为“合规”。应用场景 当您创建、变更、删除在ACK集群节点部署的应用时,插件会自动同步应用元数据到云监控,实现应用的容器监控与报警。风险等级 默认风险等级:高风险。当您...

验证SAP HANA节点

您可以使用验证SAP HANA节点功能,根据集群的变化,对ECS备份客户端进行安装或卸载。前提条件 已完成SAP HANA实例注册。更多信息,请参见 注册SAP HANA实例。背景信息 验证SAP HANA节点功能可以自动发现SAP HANA集群的节点变化以及不属于...

通过OSS URL自定义节点GPU驱动

如果您使用的CUDA库需要匹配更高版本的NVIDIA驱动,需要自定义安装节点的NVIDIA驱动。本文介绍如何基于节点池标签通过OSS URL自定义GPU节点的NVIDIA驱动版本。注意事项 对于GPU驱动版本与您业务应用的兼容性(GPU驱动版本与CDUA库版本的...

手动升级GPU节点驱动

如果您使用的CUDA库需要匹配更高版本的NVIDIA驱动,请升级节点的NVIDIA驱动,即卸载旧版本驱动,然后安装新版本驱动。本文介绍如何手动升级GPU节点驱动。前提条件 获取集群KubeConfig并通过kubectl工具连接集群 操作步骤 步骤一:下线 节点...

升级GPU节点的Docker

共享GPU的隔离能力依赖Docker 19.03.5以及与其对应的Nvidia-container-runtime版本,如果Kubernetes集群节点安装的Docker版本低于19.03.5,您需要将其升级至19.03.5。本文介绍如何升级Docker以及与其对应的Nvidia-container-runtime,从而...

灵骏常见问题

不同操作系统的灵骏节点实例,查看GPU显卡信息的操作有所区别,具体说明如下:如果您的灵骏节点安装了Linux操作系统,您可以执行命令nvidia-smi,查询GPU显卡的详细信息。如果您需要了解GPU显卡的空闲率、使用率、温度以及功率等信息,可以...

部署隐私计算节点

NETWORK ID NAME DRIVER SCOPE vdqud8syxxxx nueva-exchange overlay swarm 节点的配置与安装 以下是安装节点的操作步骤。当您首次部署节点时,请参考本章内容安装节点。登录节点客户端,解压节点部署软件包。进入解压后的目录,执行以下...

常见问题

在计算节点独立安装软件后,您可以使用该节点制作的自定义镜像来扩容节点,实现自动化安装。存储相关 如何配置NAS远程挂载目录?创建集群时需要指定NAS的挂载点和远程目录,假如您的集群配置信息如下:ClusterId=ehpc-mrZSoWf*#E-HPC集群ID...

ACK集群节点安装云监控插件

ACK集群节点均已安装云监控插件,且插件运行状态正常,视为“合规”。应用场景 当您创建、变更、删除在ACK集群节点部署的应用时,插件会自动同步应用元数据到云监控,帮助您实现应用的容器监控与报警。风险等级 默认风险等级:高风险。当您...

边缘节点

边缘节点模块主要提供边缘节点的管理运维功能,如添加边缘节点,停用/启动边缘节点,为边缘节点部署应用等。边缘节点的界面如下图所示,显示已添加的边缘节点列表,以及节点的相关信息(包括:节点名称、节点IP地址、实例状态、主机名、...

查看节点健康状态

节点健康状态展示了当前节点的运行状态是否正常,它是由多个健康检查项结果汇总而成的。本文将介绍如何查看节点的健康状态和相关的健康检查项。前提条件 已创建集群,详情请参见 创建集群。使用限制 仅适用于DataLake、Dataflow、OLAP、...

GPU节点调度属性标签

安装云原生AI套件的调度组件ack-ai-installer之后,您可以为GPU节点打上调度属性标签,帮助GPU节点启用共享GPU调度、GPU拓扑感知调度等能力。本文介绍GPU节点调度属性标签及如何切换标签的值。GPU节点调度属性标签说明 标签ack.node.gpu....

升级节点cGPU版本

通过命令升级节点cGPU版本 cgpu-installer的DaemonSet用于在节点安装cGPU驱动模块。在升级cGPU时,需要将cgpu-installer的镜像版本修改为待升级的版本。目前支持的cGPU镜像版本如下:v0.8.10 v0.8.12 v0.8.13 说明 升级节点cGPU版本过程...

为K8s应用配置虚拟节点

本文介绍部署在K8s集群上的应用如何使用虚拟节点(Virtual Node)以及弹性容器实例(ECI)。前提条件 已登录 弹性容器实例控制台 开通弹性容器实例服务。确认集群所在区域在ECI支持的地域列表内。您可以登录 弹性容器实例控制台 查看已支持...

基本概念

节点池类型 描述 节点节点池是集群中具有相同配置的一组节点节点池可以包含一个或多个节点节点池与弹性伸缩组实例一比一对应。当对节点池进行扩容和缩容时,ACK通过弹性伸缩服务下发扩容和移除节点的操作。您可以根据自己的需要创建...

扩容集群

云监控插件:选择是否在 ECS 节点安装云监控插件,安装后可以在云监控控制台查看所创建 ECS 实例的监控信息。标签:为节点绑定标签,可通过标签来筛选节点。输入键和对应的值,单击 添加一行数据,在弹出框中输入 key 和 value。污点...

集群扩容

集群扩容即扩容集群内的节点资源。通过容器应用服务控制台,您可以根据实际业务需要对集群的节点进行扩容。若节点资源不足,会导致创建工作负载等操作失败。您可以通过以下两种方式进行扩容:创建新节点 添加已有节点 前提条件 已创建集群...

自动伸缩最佳实践

队列中节点数量随作业运行有如下变化:当集群有作业运行时,可以看到节点列表中自动扩容了一个计算节点安装中,几分钟后,计算节点状态变为 运行中,此时作业开始在当前low队列的3个节点上运行。当集群没有新的作业运行时,6分钟之后,...

nodepool

cms_enabled boolean 是否在 ECS 节点安装云监控,安装后可以在云监控控制台查看所创建 ECS 实例的监控信息,推荐开启。取值:true:在 ECS 节点安装云监控。false:不在 ECS 节点安装云监控。默认值:false。true cpu_policy string...

nodepool

cms_enabled boolean 是否在 ECS 节点安装云监控,安装后可以在云监控控制台查看所创建 ECS 实例的监控信息,推荐开启。取值:true:在 ECS 节点安装云监控。false:不在 ECS 节点安装云监控。默认值:false。true cpu_policy string...

nodepool

cms_enabled boolean 是否在 ECS 节点安装云监控,安装后可以在云监控控制台查看所创建 ECS 实例的监控信息,推荐开启。取值:true:在 ECS 节点安装云监控。false:不在 ECS 节点安装云监控。默认值:false。true cpu_policy string...

安装共享GPU调度组件

本文介绍如何在GPU节点安装共享GPU组件和GPU资源查询工具,实现GPU的调度和隔离能力。前提条件 共享GPU调度目前已实行收费。在使用共享GPU调度前,需开通云原生AI套件。具体收费信息,请参见 云原生AI套件计费说明。关于云原生AI套件的更...

ModifyClusterNodePool-修改节点池配置

您可以根据节点池ID,调用ModifyClusterNodePool接口更新目标节点池的配置。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的...

ModifyClusterNodePool-修改节点池配置

您可以根据节点池ID,调用ModifyClusterNodePool接口更新目标节点池的配置。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的...

常见问题

安装 Kubernetes 软件某个步骤失败 解决办法:单击查看节点安装详情,单击重试节点执行任务即可。通过镜像发布服务,容器地址会改变 在以下两种情况下,容器地址改变属于正常现象:将无状态应用修改成 有状态应用,如下图所示:升级模式...

启用节点自动伸缩

阅读前提示 为了让您更好地使用 节点自动伸缩 功能,建议您在阅读本文档前,已阅读 节点伸缩概述 并了解以下内容:节点自动伸缩 的工作原理与功能特性 哪些业务场景下,节点自动伸缩 可以满足您的业务诉求 使用 节点自动伸缩 前需要了解的...

监控面板说明

NVIDIA Driver Version 表示节点安装的GPU驱动版本。Allocated GPUs 表示节点已分配GPU个数和总的GPU个数。GPU Utilization 表示节点上的GPU的平均利用率,即节点上所有卡的GPU利用率算平均值。Allocated GPU Memory 表示节点已分配的GPU...

启用节点即时弹性

节点即时弹性 关键事件介绍 节点即时弹性 涉及到以下关键事件(Event),以便查看 节点即时弹性 发生时内部的状态信息。事件名称 事件对象 说明 ProvisionNode pod 节点即时弹性 触发Pod扩容成功。ProvisionNodeFailed pod 节点即时弹性 ...

CreateClusterNodePool-创建节点

通过节点池,您可以更方便地对节点进行分组管理,例如节点运维、节点配置、开启节点自动弹性伸缩、批量管理、指定调度等。您可以调用CreateClusterNodePool为集群创建节点池。推荐您使用托管节点池,以帮助您自动完成部分节点运维操作,...

CreateClusterNodePool-创建节点

通过节点池,您可以更方便地对节点进行分组管理,例如节点运维、节点配置、开启节点自动弹性伸缩、批量管理、指定调度等。您可以调用CreateClusterNodePool为集群创建节点池。推荐您使用托管节点池,以帮助您自动完成部分节点运维操作,...

升级、卸载或删除备份客户端

SAP HANA实例注册后,您可以查看SAP HANA实例中各个节点的备份客户端安装状态,确保需要备份的节点已经成功安装了ECS备份客户端。结合业务场景,您可以升级、卸载或删除备份客户端,支持批量升级。前提条件 已完成SAP HANA注册。更多信息,...

DescribeClusterNodePoolDetail-查询节点池配置

您可以根据节点池ID,调用DescribeClusterNodePoolDetail接口查询集群中目标节点池的配置。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 ...

DescribeClusterNodePoolDetail-查询节点池配置

您可以根据节点池ID,调用DescribeClusterNodePoolDetail接口查询集群中目标节点池的配置。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 ...

DescribeClusterNodePools-查询节点池列表

额外节点数=额外节点数比例×节点数,例如,设置额外节点数比例为 50%,存在的节点数为 6,那么将产生的额外节点数=50%×6,也就是将生产 3 个额外节点数。50 max_unavailable long 最大不可用节点数量,取值范围:[1,1000]默认值:1。1 ...

DescribeClusterNodePools-查询节点池列表

额外节点数=额外节点数比例×节点数,例如,设置额外节点数比例为 50%,存在的节点数为 6,那么将产生的额外节点数=50%×6,也就是将生产 3 个额外节点数。50 max_unavailable long 最大不可用节点数量,取值范围:[1,1000]默认值:1。1 ...

混合云主控模式最佳实践

混合云主控模式集群的管理节点为云上新增集群的管理节点,计算节点由线下已有计算节点和云上新增计算节点组成。本文以E-HPC云上集群将线下已有计算节点纳入管理的场景为例,介绍混合云主控模式集群(SGE调度器)的部署方案。重要 本文的...

节点节点池FAQ

本文为您介绍节点节点池常见问题。例如,如何更改节点的Pod数量,如何更换节点池的OS镜像,如何解决节点相关timeout问题等。如何更换节点池OS镜像?是否支持关闭期望节点数功能?开启期望节点数与未开启期望节点数的节点池有什么不同?...

GPU FAQ

sudo reboot 重新登录GPU节点安装对应的Kernel Devel。sudo yum install-y kernel-devel-$(uname-r)请到NVIDIA官网下载和安装您需要的NVIDIA驱动。本文以410.79为例。sudo cd/tmp/sudo curl-O ...

使用向导创建集群

节点类型包括:调度器节点 域账号节点 登录节点 计算节点 说明 如果选中了计算节点,后续扩容的计算节点会自动绑定此处配置的RAM角色。资源组配置 资源组 集群节点所在资源组。您可以使用资源组对您账号下多种集群节点进行集中的分组管理。...

安装脚本配置说明

集群所有节点启动并安装好自动部署的软件后,会自动下载并执行安装脚本。本文介绍安装脚本中配置参数说明。使用场景 使用系统镜像创建集群后,需要在创建集群后安装自定义软件或配置软件环境。使用自定义镜像创建集群,需要在创建集群后...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网平台 CDN 边缘节点服务 ENS 安全加速 SCDN (文档停止维护) 钉钉会议 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用