[帮助文档] 如何在ACK上的eRDMA节点运行GDR应用

GPU Direct RDMA(GDR)是NVIDIA提出的一项应用于高性能计算和深度学习的技术。它允许GPU直接与其他支持RDMA(远程直接内存访问)的设备(如其他GPU或某些加速器)进行数据交换,而无需通过CPU中转。本文介绍如何在ACK中的eRDMA节点上运行GDR应用。

[帮助文档] 如何在ACK上的eRDMA节点运行gRPC+Verbs应用

在eRDMA环境下,您可以使用基于RDMA的通信(可能是gRPC+Verbs协议)来替代传统的只使用gRPC的通信方式。这样做可以有效地进行网络传输,减少参数服务器和工作节点之间通信的延迟,从而加速整个分布式训练过程。

使用ASK容器化部署大语言模型FastChat

1 课时 |
16 人已学 |
免费

手把手基于阿里云 ACK 环境创建 Kubernetes 集群及部署应用

1 课时 |
463 人已学 |
免费

体验-K8S API 基础及Pod 基本应用

1 课时 |
948 人已学 |
免费
开发者课程背景图

[帮助文档] Gitops应用使用HPA

由于Argo CD会定时同步Git仓库和集群中应用的状态,会和通过容器水平伸缩(HPA)来控制Pod副本数的行为发生冲突。因此对于使用GitOps发布的应用,如果使用容器水平伸缩控制Pod副本数,您需要对应用进行相应配置避免产生冲突。配置方式按照副本数分为默认1个副本和默认多个副本两种场景。

[帮助文档] 使用钉钉机器人通知GitOps应用变更_分布式云容器平台 ACK One_容器服务Kubernetes版(ACK)

使用GitOps发布应用时,可以配置多种通知服务(例如Email、钉钉等)用于接收应用的重要变化。例如,当应用发布异常时您可以快速收到通知提醒,并及时排查异常原因。本文以发送钉钉消息为例,介绍如何在GitOps中发送通知。

[帮助文档] 实现应用Pod与缓存数据之间的亲和性调度_云原生AI套件_容器服务Kubernetes版(ACK)

通过Fluid提供的数据缓存亲和性调度优化能力,您可以设置应用Pod上的亲和性配置,让应用Pod优先访问同节点、同可用区节点或同地域节点的缓存数据,从而提高应用Pod访问数据的效率。

使用 Kustomize 帮你管理 kubernetes 应用(五):配合 kubedog 完善 CI/CD 的最后一步

在以往的 pipeline 中,使用 kubectl 进行部署 Deployment 后无法检查 Deployment 是否部署成功,只能通过使用命令/脚本来手动检查 Deployment 状态,而 kubedog 这个小工具完美解决了这个问题,完善了 CI/CD 流水线的最后一步。 KubeDog...

使用 Kustomize 帮你管理 kubernetes 应用(三):将 Kustomize 应用于 CI/CD

前言 首先明确软件版本,我这里使用的是 Jenkins ver. 2.121.3 ,这个版本比较老,其上安装 Kubernetes 插件所使用 kubectl 版本也比较老,无法使用 Kustomize 的 yaml 文件需要的 apiVersion: apps/v1 ,直接使用生成 deploy....

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云容器服务 ACK
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
234772+人已加入
加入
相关电子书
更多
智算时代,基于 Kubernetes 落地云原生 AI
容器服务 ACK – 智算时代的现代化应用平台
深耕云原生技术– Kubernetes应用渐入佳境
立即下载 立即下载 立即下载
相关镜像

容器服务Kubernetes版应用相关内容