什么是AI通信加速库Deepnccl

多机优化 多机优化体现在通信算子编译优化、TCP多流优化、多机CPU-Reduce优化三个方面,具体说明如下:通信算子编译优化:针对阿里云上不同机型,以及网卡与GPU的不同拓扑连接等特点,相比较基于全局拓扑结构实现的Allreduce、Allgather或...

什么是Deepytorch Training(训练加速)

多机优化 多机优化体现在通信算子编译优化、TCP多流优化、多机CPU-Reduce优化三个方面,具体说明如下:通信算子编译优化:针对阿里云上不同机型,以及网卡与GPU的不同拓扑连接等特点,相比较基于全局拓扑结构实现的Allreduce、Allgather或...

什么是AI分布式训练通信优化库AIACC-ACSpeed

AIACC-ACSpeed优化原理 场景说明 使用单机多卡或多机多卡进行AI分布式训练时,分布式通信的线性度可作为单卡训练扩展到多卡的性能指标,线性度的计算方式如下:单机内部扩展性:线性度=多卡性能/单卡性能/单机卡数 多机之间扩展性:线性度=...

基于eRDMA增强型实例部署AI训练集群

在NCCL底层通信链接上,有多种不同的传输方式,例如单机内部多卡P2P通信以及多机上的传统socket通信(如VPC网络)和高性能的InfiniBand(IB)通信,其中eRDMA是一种基于RDMA的传输方式,具有极低的延迟,并且在性能上接近RDMA网络的优势。...

领域模型概述

一对多通信:基于独立身份的设计,同一个主题内的消息可以被个订阅组处理,每个订阅组都可以拿到全量消息。因此发布订阅模型可以实现一对多通信。传输模型对比 点对点模型和发布订阅模型各有优势,点对点模型更为简单,而发布订阅模型的...

云边通信组件Raven概述

边缘云场景中,计算设备往往分布在个隔离的地域和网络域。因此,集群中的边缘设备往往采用分组管理,导致了不同分组的节点之间以及其下应用之间网络不互通等隔离性问题。为提升云边运维和监控能力,ACK Edge集群 引入了云边通信组件Raven...

安装ACCL库

ACCL(Alibaba Collective Communication Library)是一款高性能通信库,提供了AllReduce、AllToAllV、Broadcast等常用集合操作接口以及点到点Send/Recv接口,为多机多卡训练提供高效的通信支持。本文为您介绍如何安装ACCL库。背景信息 ...

VPC通信常见问题

同一VPC内不同交换可以通信么?不同VPC之间能否内网互通?VPC是否支持专线接入?VPC是否提供VPN功能?VPC可以访问公网服务么?公网可以访问VPC中的云服务么?VPC是否可以直接与经典网络通信?同一VPC内不同交换可以通信么?只要安全组...

查询网络通信距离(NCD)

使用NCD的原因 存在的问题 在特定物理网络拓扑下,不同GPU节点之间的通信时延和可能产生的跨跳交换转发引发的哈希不均,都可能导致不同GPU节点之间的通信性能存在较大差异,进而进一步影响模型训练的吞吐差异。解决方法 如上图所示,...

按用户组授权主机

堡垒提供按用户组授权主机的功能。当您新建用户组之后,您可以为该用户组授权主机。授权后用户组内的用户即可使用堡垒运维已授权的主机。本文介绍如何为用户组授权主机。授权主机 登录堡垒系统。具体操作,请参见 登录系统。在左侧...

按用户授权主机

堡垒提供按用户授权主机的功能。当您新建用户之后,您可以为该用户授权主机。授权后该用户即可使用堡垒运维已授权的主机。本文介绍如何为用户授权主机。授权主机 为用户授权主机,具体操作请参见以下步骤:登录堡垒系统。具体操作,...

清除主机指纹

批量清除主机指纹 如果需要清除台主机的主机指纹,您可以参考以下步骤进行操作。登录 堡垒控制台,在顶部菜单栏,选择堡垒所在的地域。在堡垒实例列表,定位到目标实例,单击 管理。在左侧导航栏,选择 资产管理>主机。在 主机 ...

步骤1:同步阿里云ECS资产

登录堡垒系统。具体操作,请参见 登录系统。在左侧导航栏,选择 资产管理>主机。在 主机 页面,单击 导入ECS实例。在 选择区域 对话框中,选中需要同步的ECS实例所属的区域,单击 确定。在 导入ECS实例 对话框,选中需要导入的ECS实例,...

修改主机的服务端口

批量修改主机的服务端口 如果个主机的同一协议使用的是相同的端口号,您可以通过以下步骤批量修改主机的服务端口:登录堡垒系统,具体操作请参见 登录堡垒系统。在左侧导航栏单击 资产管理>主机。在 主机 页面,选中需要批量修改服务...

管理主机账户

本文将介绍如何在堡垒中进行主机账户的新建、修改和删除操作。新建主机账户 登录堡垒系统。具体操作,请参见 登录系统。在左侧导航栏,选择 资产管理>主机。在 主机 页面,为目标主机新建主机账户。为一个主机新建主机账户 单击目标...

共享账户

个主机的管理账户的登录名、密码/密钥相同时,通过关联共享账户可以节约配置时间。新建共享账户 参照以下步骤新建共享账户:登录 云盾堡垒Web管理页。在左侧导航栏选择 资产>共享账户。在 共享账户 页面,单击 新建共享账户。在 新建...

概览

本文指导您在开通V3.2版本堡垒实例后,如何快速使用堡垒实现安全运维,并通过堡垒审计运维会话。在使用V3.2版本堡垒时,您可以按照以下步骤进行操作。任务 描述 步骤1:同步阿里云ECS资产 在使用堡垒进行运维前,管理员需要在...

共享密钥

堡垒提供共享密钥功能。您可以创建私钥并将私钥批量关联到主机账户中,提高管理主机账户的效率。您也可以更改私钥的基本信息,增删关联主机账户,更好地满足运维需求。本文介绍如何创建和编辑私钥。背景信息 如果需要堡垒使用密钥对...

消息通知

堡垒提供消息通知功能,支持多种通知类型,您可以通过设置相关配置项,通过短信、邮箱、站内信向管理员或运维员发送消息通知,及时了解业务情况。本文介绍如何使用消息通知功能。登录 堡垒控制台,在顶部菜单栏,选择堡垒所在的地域...

售卖、试用、规格相关问题

本文介绍试用、购买堡垒以及选择堡垒规格的相关问题及解决方案。如何参加堡垒试用活动?是否能延长堡垒7天试用时间?试用堡垒结束后如何购买堡垒?堡垒是否需要购买带宽扩展包?堡垒是否需要购买存储扩展包?如果资产规格...

最佳实践概览

应用场景 最佳实践文档 公网 建立高可用的IPsec-VPN连接 IPsec-VPN联合物理专线实现主备链路上云(绑定转发路由器)建立条公网IPsec-VPN连接实现流量的负载分担 私网 通过私网IPsec-VPN连接实现私网流量加密通信 建立条私有IPsec-...

产品优势

与共享宿主机(租户环境)相比,DDH为您提供一种依托阿里云虚拟化服务的单租户运行环境,能让您独享一台云主机所有物理资源,同时还兼具灵活性、低成本等优势。安全性 使用DDH可以确保单租户独占物理,独享CPU、内存、网卡等物理资源,...

使用云边通信Raven组件

在 ACK Edge集群 中,跨网络域通信组件Raven提供了基础的地域网络通信能力,以实现云边运维能力。您可以配置Raven组件,选择云边通信模式(代理模式、隧道模式),也可以增删访问控制白名单条目,放行边缘网关节点以使其与云上构建隧道。...

网络最大传输单元MTU

理论上MTU越大,可在单个数据包中传递的数据越,网络通信越高效。本文介绍巨型帧相关功能以及如何修改ECS实例网卡的MTU。巨型帧(Jumbo frames)巨型帧是指有效负载超过IEEE 802.3标准所限制的1500字节的以太网帧,增大的有效载荷百分比...

实例管理常见问题

KMS帮助您建设KMS实例的私网通信链路时,需要消耗交换内的一个IP,而您选择的交换中可用IP数量为0。说明 您可以登录 专有网络管理控制台,在 交换 页面单击目标交换,在详情页面查看可用IP数。更换要绑定的交换,并确保交换的...

2.1 门禁对讲一体对接方案介绍

蓝牙门禁 云端平台管理蓝牙卡权限,通过边缘服务器,下发蓝牙卡白名单到门禁,门禁通过蓝牙通信标准协议与手机APP通信,判断通行权限,设备需要开发对接边缘服务器卡权限和事件接口,蓝牙通信标准。可视对讲 设备端开发对接云端平台和...

Kubernetes集群网络规划

一个VPC下,可以创建个交换,但交换网段不能重叠。虚拟交换和Pod虚拟交换需要在一个可用区下。Pod虚拟交换 Pod地址从该交换分配,用于Pod网络通信。Pod是Kubernetes内的概念,每个Pod具有一个IP地址。在VPC里创建交换时...

Kubernetes集群网络规划

一个VPC下,可以创建个交换,但交换网段不能重叠。虚拟交换和Pod虚拟交换需要在一个可用区下。Pod虚拟交换 Pod地址从该交换分配,用于Pod网络通信。Pod是Kubernetes内的概念,每个Pod具有一个IP地址。在VPC里创建交换时...

DDH常见问题

弹性裸金属服务器(ECS Bare Metal Instance,简称为EBM)是一款同时兼具虚拟弹性和物理性能及特性的新型计算类产品,是基于阿里云完全自主研发的下一代虚拟化技术而打造的新型计算类服务器产品。EBM详情,请参见 弹性裸金属服务器概述...

组播概述

资源 默认配额 申请更配额 每个转发路由器支持创建的组播域的数量 20个 无法调整 每个转发路由器下单个组播组支持的组播成员的数量 15个 每个转发路由器下单个组播域支持关联的交换的数量 10个 每个转发路由器下单个组播组支持的组播源...

审计SCP命令操作的最佳实践

当个人电脑配置ProxyJump后,您在使用SCP命令上传或文件操作时,SSH客户端会先与堡垒建立安全连接,然后再通过堡垒与目标主机通信,从而实现堡垒对SCP命令的审计。前提条件 请确保本地客户端与堡垒网络连接正常且可以正常登录堡垒...

常见问题

VPC通信FAQ 同一VPC内不同交换下的ECS实例可以通信么?不同VPC之间能否内网互通?VPC是否支持专线接入?VPC可以访问公网服务么?公网可以访问VPC中的云服务么?VPC是否可以直接与经典网络通信?高可用虚拟IP FAQ HaVip是否支持广播和组播...

搭建IPv6专有网络

如果您需要在VPC中进行IPv6私网通信,您可以在开通了IPv6网段的VPC和交换下创建带有IPv6地址的ECS实例,同一个VPC下的ECS实例能够通过IPv6地址相互通信。IPv6网关支持的地域 区域 地域 中国 华北1(青岛)、华北2(北京)、华北3(张家口...

搭建IPv6专有网络

如果您需要在VPC中进行IPv6私网通信,您可以在开通了IPv6网段的VPC和交换下创建带有IPv6地址的ECS实例,同一个VPC下的ECS实例能够通过IPv6地址相互通信。IPv6网关支持的地域 区域 地域 中国 华北1(青岛)、华北2(北京)、华北3(张家口...

专有网络FAQ

VPC通信FAQ 同一VPC内不同交换下的ECS实例可以通信么?不同VPC之间能否内网互通?VPC是否支持专线接入?VPC可以访问公网服务么?公网可以访问VPC中的云服务么?VPC是否可以直接与经典网络通信?什么是CIDR?无类域间路由CIDR(Classless ...

网络规划

当您需要使用专有网络 VPC 和交换来部署您的云上网络时,您可以结合具体的业务来规划 VPC、交换的数量及IP地址的分配。同时还需要注意 VPC 与 VPC 或本地数据中心互通的要求。应该使用几个VPC?一个VPC 如果您没有地域部署系统的要求...

启动方式与环境变量说明

整合了不同的底层通讯设施和多种训练模式,同时兼容了分布式训练与弹性训练,新旧启动方式升级如下所示:启动方式如下:单机 默认使用gloo的backend,启动命令如下:perseusrun-np NP[-H localhost:N]-COMMAND[ARG[ARG.]]多机 以使用MPI为...

Android

RTC SDK 提供了网络质量监控的功能,您可以在网络状况变化时通过回调获取网络质量,设置对应的音视频规格,以确保基础通信体验。通过阅读本文,您可以了解获取网络质量及设置音视频规格的方法。功能简介 在网络质量不理想的情况下,音视频...

iOS

RTC SDK 提供了网络质量监控的功能,您可以在网络状况变化时通过回调获取网络质量,设置对应的音视频规格,以确保基础通信体验。通过阅读本文,您可以了解获取网络质量及设置音视频规格的方法。功能简介 在网络质量不理想的情况下,音视频...

系统设置

网络设置 启用网络通信:设置指令系统与授权主机之间的通信状态,启用网络通信服务。授权地址:设置网络通信后端服务地址。服务主机:设置网络通信后端服务主机。服务路径:网络通信后端服务路径。消息设置 启用消息通信:启动网络消息通信...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 运维安全中心(堡垒机) 物联网无线连接服务 云虚拟主机 边缘网络加速 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用