[帮助文档] ACK集群节点伸缩概述

当集群的容量规划无法满足应用Pod调度时,您可以使用ACK提供的节点伸缩功能,自动扩缩节点资源以进行调度容量的补充。ACK目前提供节点自动伸缩与节点即时弹性两种弹性方案,后者相较于前者有着更快的弹性速度、更高的交付效率和更低的使用门槛。

[帮助文档] 如何在ACK上的eRDMA节点运行GDR应用

GPU Direct RDMA(GDR)是NVIDIA提出的一项应用于高性能计算和深度学习的技术。它允许GPU直接与其他支持RDMA(远程直接内存访问)的设备(如其他GPU或某些加速器)进行数据交换,而无需通过CPU中转。本文介绍如何在ACK中的eRDMA节点上运行GDR应用。

使用ASK容器化部署大语言模型FastChat

1 课时 |
16 人已学 |
免费

如何在 ACK 中使用 MSE Ingress

1 课时 |
114 人已学 |
免费

从概念、部署到优化,Kubernetes Ingress 网关的落地实践

1 课时 |
188 人已学 |
免费
开发者课程背景图

[帮助文档] 如何在ACK上的eRDMA节点运行gRPC+Verbs应用

在eRDMA环境下,您可以使用基于RDMA的通信(可能是gRPC+Verbs协议)来替代传统的只使用gRPC的通信方式。这样做可以有效地进行网络传输,减少参数服务器和工作节点之间通信的延迟,从而加速整个分布式训练过程。

[帮助文档] 如何将eRDMA机型的节点加入ACK中

本文介绍如何将eRDMA机型的节点加入ACK中。

[帮助文档] 结合Ray autoscaler实现ECI节点的弹性伸缩_云原生AI套件_容器服务Kubernetes版(ACK)

结合Ray autoscaler能力,您可以在ACK集群中创建Ray Cluster并配置在Ray Cluster内自动弹出ECI节点,以享用免运维、强隔离、能快速启动的容器运行环境。使用ECI时,您无需购买和管理底层ECS服务器,可以更加关注容器应用而非底层基础设施的维护工作,且仅为实际使用的资源...

K8S从懵圈到熟练:读懂这一篇,集群节点不下线

K8S从懵圈到熟练:读懂这一篇,集群节点不下线

作者:shengdong 排查完全陌生的问题,完全不熟悉的系统组件,是售后工程师的一大工作乐趣,当然也是挑战。今天借这篇文章,跟大家分析一例这样的问题。排查过程中,需要理解一些自己完全陌生的组件,比如systemd和dbus。但是排查问题的思路和方法基本上还是可以复用了,希望对大家有所帮助。 问题一...

K8S从懵圈到熟练 - 节点下线姊妹篇

K8S从懵圈到熟练 - 节点下线姊妹篇

作者:shengdong 之前分享过一例集群节点NotReady的问题。在那个问题中,我们的排查路劲,从K8S集群到容器运行时,再到sdbus和systemd,不可谓不复杂。那个问题目前已经在systemd中做了修复,所以基本上能看到那个问题的几率是越来越低了。 但是,集群节点就绪问题还是有的,然而...

K8S 从懵圈到熟练:读懂此文,集群节点不下线!

阿里妹导读:排查完全陌生的问题、不熟悉的系统组件,对许多工程师来说是无与伦比的工作乐趣,当然也是一大挑战。今天,阿里巴巴售后技术专家声东跟大家分享一例 Kubernetes 集群上的问题。这个问题影响范围较广,或许某天你也会遇到。更重要的是,作者在问题排查过程中的思路和方法,也会让你有所启发。 关于...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云容器服务 ACK
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
234772+人已加入
加入
相关电子书
更多
智算时代,基于 Kubernetes 落地云原生 AI
容器服务 ACK 加速企业应用现代化升级
容器服务 ACK – 智算时代的现代化应用平台
立即下载 立即下载 立即下载
相关镜像

容器服务Kubernetes版节点相关内容