[帮助文档] 如何在ACK上的eRDMA节点运行GDR应用

GPU Direct RDMA(GDR)是NVIDIA提出的一项应用于高性能计算和深度学习的技术。它允许GPU直接与其他支持RDMA(远程直接内存访问)的设备(如其他GPU或某些加速器)进行数据交换,而无需通过CPU中转。本文介绍如何在ACK中的eRDMA节点上运行GDR应用。

[帮助文档] 如何在ACK上的eRDMA节点运行gRPC+Verbs应用

在eRDMA环境下,您可以使用基于RDMA的通信(可能是gRPC+Verbs协议)来替代传统的只使用gRPC的通信方式。这样做可以有效地进行网络传输,减少参数服务器和工作节点之间通信的延迟,从而加速整个分布式训练过程。

容器应用的高弹性架构

9 课时 |
31 人已学 |
免费

容器应用更新与灰度发布

9 课时 |
47 人已学 |
免费

Serverless容器入门和实践案例

1 课时 |
41 人已学 |
免费
开发者课程背景图

[帮助文档] 使用GitOps高可用模式运行Argo CD

ACK One GitOps提供高可用模式运行Argo CD。默认模式只启动1个单副本Deployment;高可用模式会运行4个Deployment(其中argocd-server为2副本),确保Argo CD各组件资源充足,并对各组件参数进行调优。本文为您介绍如何使用GitOps的高可用模式。

[帮助文档] 使用ECI运行TensorFlow训练任务

您可以将AI训练任务所需的软件环境容器化,然后在ECI上执行训练任务,在解决环境搭建复杂问题的同时,可以只为运行时间付费,从而降低成本,提升效率。本文以一个Github上基于GPU的TensorFlow训练任务为例,介绍如何基于ACK Serverless集群,使用ECI来运行训练任务。

[帮助文档] 上传文件至OSS以触发工作流运行

本文介绍如何集成阿里云对象存储OSS与阿里云消息服务MNS,通过将数据上传文件至对象存储OSS中,自动触发工作流运行文件,并生成结果。

一个已经Pending的节点不会接受和调度任何请求,并且已经在其上运行的容器组也会删除。

一个已经Pending的节点不会接受和调度任何请求,并且已经在其上 运行的容器组也会删除。 正确 错误

Swarm 集群  节点管理  查看节点上运行的容器

您可以通过节点列表页面查看运行在某个节点上的容器。 操作步骤 登录容器服务管理控制台。在 Swarm 菜单下,单击左侧导航栏中的节点。选择节点所在的集群。选择所需的节点,单击节点的 ID。 下一步 通过该列表,您可以查看容器的标签(Labels),查看容器的镜像并查看镜像的 sha256,查看容器的...

节点管理查看节点上运行的容器

您可以通过节点列表页面查看运行在某个节点上的容器。 操作步骤 登录 容器服务管理控制台。单击左侧导航栏中的 [backcolor=transparent]节点。选择节点所在的集群。选择所需的节点,单击节点的 ID。 您可以看到运行在该节点上的容器的列表。 更多操作 通过该列表,您可以查看容器的标签(...

节点管理如何查看节点上运行的容器

您可以通过节点列表页面查看运行在某个节点上的容器。 操作步骤 登录 容器服务管理控制台。单击左侧导航栏中的 [backcolor=transparent]节点。选择节点所在的集群。选择所需的节点,单击节点的 ID。 您可以看到运行在该节点上的容器的列表。 更多操作 通过该列表,您可以查看容器的标签(...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云容器服务 ACK
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
234772+人已加入
加入
相关电子书
更多
多租户Kubernetes实践:从容器运行时到SDN
运用新技术解决有状态应用的冷热迁移挑战 迁移策略+新容器运行时
多租户Kubernetes实践-从容器运行时到SDN
立即下载 立即下载 立即下载