[帮助文档] 如何在ACK上的eRDMA节点运行GDR应用

GPU Direct RDMA(GDR)是NVIDIA提出的一项应用于高性能计算和深度学习的技术。它允许GPU直接与其他支持RDMA(远程直接内存访问)的设备(如其他GPU或某些加速器)进行数据交换,而无需通过CPU中转。本文介绍如何在ACK中的eRDMA节点上运行GDR应用。

[帮助文档] 如何在ACK上的eRDMA节点运行gRPC+Verbs应用

在eRDMA环境下,您可以使用基于RDMA的通信(可能是gRPC+Verbs协议)来替代传统的只使用gRPC的通信方式。这样做可以有效地进行网络传输,减少参数服务器和工作节点之间通信的延迟,从而加速整个分布式训练过程。

使用ASK容器化部署大语言模型FastChat

1 课时 |
16 人已学 |
免费

手把手基于阿里云 ACK 环境创建 Kubernetes 集群及部署应用

1 课时 |
463 人已学 |
免费

体验-K8S API 基础及Pod 基本应用

1 课时 |
948 人已学 |
免费
开发者课程背景图

[帮助文档] Gitops应用使用HPA

由于Argo CD会定时同步Git仓库和集群中应用的状态,会和通过容器水平伸缩(HPA)来控制Pod副本数的行为发生冲突。因此对于使用GitOps发布的应用,如果使用容器水平伸缩控制Pod副本数,您需要对应用进行相应配置避免产生冲突。配置方式按照副本数分为默认1个副本和默认多个副本两种场景。

[帮助文档] 使用钉钉机器人通知GitOps应用变更

使用GitOps发布应用时,可以配置多种通知服务(例如Email、钉钉等)用于接收应用的重要变化。例如,当应用发布异常时您可以快速收到通知提醒,并及时排查异常原因。本文以发送钉钉消息为例,介绍如何在GitOps中发送通知。

[帮助文档] 实现应用Pod与缓存数据之间的亲和性调度

通过Fluid提供的数据缓存亲和性调度优化能力,您可以设置应用Pod上的亲和性配置,让应用Pod优先访问同节点、同可用区节点或同地域节点的缓存数据,从而提高应用Pod访问数据的效率。

从零开始入门 K8s | 应用编排与管理:Job & DaemonSet

一、Job 需求来源 Job 背景问题 首先我们来看一下 Job 的需求来源。我们知道 K8s 里面,最小的调度单元是 Pod,我们可以直接通过 Pod 来运行任务进程。这样做将会产生以下几种问题: 我们如何保证 Pod 内进程正确的结束? 如何保证进程运行失败后重试? 如何管理多个任务,且任务之间...

从零开始入门 K8s | 应用编排与管理

一、需求来源 背景问题 首先来看一下背景问题。如下图所示:如果我们直接管理集群中所有的 Pod,应用 A、B、C 的 Pod,其实是散乱地分布在集群中。现在有以下的问题: 首先,如何保证集群内可用 Pod 的数量?也就是说我们应用 A 四个 Pod 如果出现了一些宿主机故障,或者一些网络问题,如何能...

从零开始入门 K8s| K8s 的应用编排与管理

作者 | 张振 阿里巴巴高级技术专家 一、资源元信息 1. Kubernetes 资源对象 我们知道,Kubernetes 的资源对象组成:主要包括了 Spec、Status 两部分。其中 Spec 部分用来描述期望的状态,Status 部分用来描述观测到的状态。今天我们将为大家介绍 K8s 的另外...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云容器服务 ACK
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
234772+人已加入
加入
相关电子书
更多
智算时代,基于 Kubernetes 落地云原生 AI
容器服务 ACK – 智算时代的现代化应用平台
深耕云原生技术– Kubernetes应用渐入佳境
立即下载 立即下载 立即下载
相关镜像

容器服务Kubernetes版应用相关内容