[帮助文档] ACK集群节点伸缩概述
当集群的容量规划无法满足应用Pod调度时,您可以使用ACK提供的节点伸缩功能,自动扩缩节点资源以进行调度容量的补充。ACK目前提供节点自动伸缩与节点即时弹性两种弹性方案,后者相较于前者有着更快的弹性速度、更高的交付效率和更低的使用门槛。
[帮助文档] 如何在ACK上的eRDMA节点运行GDR应用
GPU Direct RDMA(GDR)是NVIDIA提出的一项应用于高性能计算和深度学习的技术。它允许GPU直接与其他支持RDMA(远程直接内存访问)的设备(如其他GPU或某些加速器)进行数据交换,而无需通过CPU中转。本文介绍如何在ACK中的eRDMA节点上运行GDR应用。
[帮助文档] 如何在ACK上的eRDMA节点运行gRPC+Verbs应用
在eRDMA环境下,您可以使用基于RDMA的通信(可能是gRPC+Verbs协议)来替代传统的只使用gRPC的通信方式。这样做可以有效地进行网络传输,减少参数服务器和工作节点之间通信的延迟,从而加速整个分布式训练过程。
[帮助文档] 如何将eRDMA机型的节点加入ACK中
本文介绍如何将eRDMA机型的节点加入ACK中。
[帮助文档] 结合Ray autoscaler实现ECI节点的弹性伸缩
结合Ray autoscaler能力,您可以在ACK集群中创建Ray Cluster并配置在Ray Cluster内自动弹出ECI节点,以享用免运维、强隔离、能快速启动的容器运行环境。使用ECI时,您无需购买和管理底层ECS服务器,可以更加关注容器应用而非底层基础设施的维护工作,且仅为实际使用的资源...
容器服务ACK目前集群中,有没有办法,在节点动态伸缩时,原先的三个节点,不参与节点的动态伸缩操作?
容器服务ACK目前集群中,有三个节点,但由于部分的服务是有状态的。 有没有办法,在节点动态伸缩时,原先的三个节点,不参与节点的动态伸缩操作?(参与的,都是新增的节点池)
容器监控服务节点自动伸缩
为了满足应用在不同负载下的需求,容器服务不仅提供了容器级别的弹性伸缩,还提供了节点级别的自动伸缩,即通过监测节点的资源占用情况自动调整节点数量。 [backcolor=transparent]节点伸缩采取的策略: 当监测指标值超过所设定的扩容条件,以用户设定的扩容步长增加节点数量。当监测指标值低于所...
利用阿里云容器服务实现自定义节点伸缩
简介 阿里云容器服务很早就提供了基于集群CPU/内存的平均使用量触发节点自动伸缩功能,帮助许多客户自如应对业务压力的弹性变化。其原理是利用阿里云的云监控能力,在资源使用(cpu和memory)达到阈值时,触发节点伸缩。 同时还有一些企业级用户希望根据自身的监控数据和逻辑判断是否进行扩容和缩容操作,甚...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。