什么是AI分布式训练通信优化库AIACC-ACSpeed

AIACC-ACSpeed优化原理 场景说明 使用单机多卡或多机多卡进行AI分布式训练时,分布式通信的线性度可作为单卡训练扩展到多卡的性能指标,线性度的计算方式如下:单机内部扩展性:线性度=多卡性能/单卡性能/单机卡数 多机之间扩展性:线性度=...

新建资源组并购买灵骏智算资源

功能简介 资源类型 灵骏智算类型的资源,是阿里云自主研发的新一代智能计算资源,提供:RDMA高速网络架构 高性能通信库 高性能加速软件 GPU虚拟化的技术方案 可以更好地满足高性能算力需求。资源组类型 阿里云PAI为您提供全托管的灵骏智算...

什么是AI通信加速库Deepnccl

Deepnccl是为阿里云神龙异构产品开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。本文主要介绍Deepnccl的架构、优化原理和性能说明。产品简介 Deepnccl基于NCCL(NVIDIA Collective ...

安装ACCL库

ACCL(Alibaba Collective Communication Library)是一款高性能通信库,提供了AllReduce、AllToAllV、Broadcast等常用集合操作接口以及点到点Send/Recv接口,为多机多卡训练提供高效的通信支持。本文为您介绍如何安装ACCL库。背景信息 ...

功能特性

灵骏满足AI、HPC等计算密集场景需要的高性能算力,可实现高性能、大规模的池化算力,满足自动驾驶、科研、金融、生物制药等多行业的异构算力需求。本文为您介绍灵骏的功能特性。高速RDMA网络架构 阿里巴巴2016年开始投入专项研究RDMA...

分布式训练DLC 算力健康检测发布

在检测完成后,会给出有关GPU算力以及通信性能的检测报告,可以帮助识别和定位可能导致任务训练性能下降的问题元素,整体提升问题诊断的效率。目前仅支持在华北6(乌兰察布)地域,使用灵骏智算资源提交的DLC训练任务,开启健康检测功能。...

实践教程概览

使用IMB软件和MPI通信库测试E-HPC通信性能 IMB(Intel MPI Benchmarks)用于评估HPC集群在不同消息粒度下节点间点对点、全局通信的效率。MPI(Message Passing Interface)是支持多编程语言的并行计算通信库,具有高性能、大规模性、可移植...

使用IMB软件和MPI通信库测试集群通信性能

本文以IMB软件和MPI通信库为例介绍如何测试E-HPC集群的通信性能。背景信息 IMB(Intel MPI Benchmarks)用于评估HPC集群在不同消息粒度下节点间点对点、全局通信的效率。MPI(Message Passing Interface)是支持多编程语言编程的并行计算...

基础设施安全

在检测完成后,会给出有关GPU算力以及通信性能的检测报告,可以帮助识别和定位可能导致任务训练性能下降的问题元素,整体提升问题诊断的效率。详细使用说明请参见 SanityCheck:算力健康检测。基础设施监控 支持接入云监控,构建并巩固您的...

eRDMA

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA),是阿里云提供的低延迟、大吞吐、高弹性的高性能RDMA网络服务。eRDMA的能力实现需要基于支持eRDMA能力的实例规格,创建挂载支持弹性RDMA能力的网卡,才能够实现具有大规模RDMA...

eRDMA概述

众多应用都是基于TCP/IP构建的,但随着数据中心相关的业务蓬勃发展,应用对于网络的性能需求(如延迟、吞吐)越来越高,受限于TCP/IP的局限性(如拷贝开销大、协议栈处理厚、CC算法复杂、上下文切换频繁等),TCP/IP的网络通信性能已经成为...

SanityCheck:算力健康检测

此外,在检测完成后,会给出有关GPU算力以及通信性能的检测报告,可以帮助识别和定位可能导致任务训练性能下降的问题元素,整体提升问题诊断的效率。使用限制 仅支持在华北6(乌兰察布)地域,使用灵骏智算资源提交的DLC训练任务,开启健康...

查询网络通信距离(NCD)

PAI灵骏提供了统一的网络通信距离NCD(Network Communication Distance)查询接口,供您对GPU节点(或网卡)间的通信距离进行查询,以实现更优的任务调度,获得最佳的训练性能。本文为您介绍NCD的基本概念、使用NCD的原因以及如何使用NCD。...

PAI灵骏智算服务概述

PAI灵骏 是一种大规模高密度计算服务,全称“PAI灵骏智算服务”,提供高性能AI训练、高性能计算所需的异构计算算力服务。PAI灵骏 主要面向图形图像识别、自然语言处理、搜索广告推荐、通用大模型等大规模分布式的AI研发场景,适用于自动...

AIACC-ACSpeed体验示例

AIACC-ACSpeed(简称ACSpeed)作为阿里云自研的AI训练加速器,在提高训练效率的同时能够降低使用成本,可以实现无感的分布式通信性能优化。ACSpeed软件包中已为您提供了适配DDP的示例代码,您可以参考本文快速体验使用ACSpeed进行模型分布...

Netpila

因此,该场景下Pod间的网络通信拥有比默认VXLAN模式更高的通信性能。变更记录 2024年2月 组件名称 版本号 镜像地址 变更时间 变更内容 变更影响 netpila-agent 3.2.3 registry-vpc....

功能发布记录

2022年11月 更新事项 描述 AI Earth 地球科学云平台正式发布 平台集公开数据检索、在线处理分析(工具箱模式+开发者模式)、遥感AI模型训练为一体,为广大科研用户和政企用户提供便捷高效的一式遥感云计算服务。2022年08月 更新事项 描述...

安全类

服务器数据盘使用整盘加密,服务器之间仅允许内网通信,并在系统层面限制特定内网 IP 才允许通信,保证用户数据在服务器端的安全。网站全站通信采用 256 位 HTTPS 加密,保证用户数据在服务器和浏览器之间传输的安全。数据库采用 Replica ...

使用Terway网络插件

功能说明 不同于默认的Terway的网络模式,IPvlan模式主要在Pod网络、Service、网络策略(NetworkPolicy)做了性能优化:Pod的网络直接通过ENI网卡的IPvlan L2的子接口实现,简化了网络在宿主机上的转发流程,让Pod的网络性能几乎与宿主机的...

服务等级协议

性能计算 弹性高性能计算服务等级协议 批量计算服务等级协议 Serverless Serverless应用引擎服务等级协议 函数计算服务等级协议 无影 图形工作服务等级协议 无影云电脑服务等级协议 边缘计算 边缘网络加速(ENA)服务等级协议 边缘网络...

支持的云服务

PCDN Pcdn 2020年前 PCDN的审计事件 全加速 DCDN 2020-02-13 全加速DCDN的审计事件 边缘节点服务ENS ENS 2020-02-27 边缘节点服务ENS的审计事件 视频监控 VideoSurveillanceSystem 2021-06-10 视频监控的审计事件 智能媒体中台 IMP ...

建立gRPC连接

gRPC具有高性能的特点,能有效减少带宽使用、降低网络延迟。gRPC的 作用与 优势 高效通信:利用HTTP/2的多路复用特性,gRPC能够在一个TCP连接上并发执行多个请求,提高了通信效率和性能。跨语言互操作性:gRPC支持多种主流编程语言,允许...

阿里云CDN的五大竞争力

可靠性:可以配置主备源,阿里云CDN能够持续监测主备源的状态,在主出现故障的时候能够及时切换到备。价格竞争力 性能和技术强大的同时,阿里云CDN的价格同样很有竞争力:计费方式灵活多样,详细信息,请参见 计费概述。预付费...

GPU计算型

GPU计算型实例具有高性能、高并行计算能力,适用于大规模并行计算场景,可以为您的业务提供更好的计算性能和效率。本文为您介绍云服务器ECS GPU计算型实例规格族的特点,并列出了具体的实例规格。主售(推荐类型)GPU计算型实例规格族gn7e ...

网络最大传输单元MTU

重要 对于超过链路最大MTU限制的数据包,阿里云转发组件会依据RFC标准对报文进行分片或协商,但是这只能保证连通性,不能保证网络通信性能。因此在链路最大MTU为1500的通信场景下,尽量避免使用巨型帧进行UDP、ICMP通信。对于阿里云上...

合作伙伴及开源生态

主要工具:网络通信框架 SOFABolt、生产级高性能 Java 实现 SOFAJRaft、自动化测试框架 SOFAActs、轻量级类隔离容器 SOFAArk。生态项目:高性能可扩展安全网络代理 MOSN、简单可扩展自治事务框架 Seata。同时,SOFAStack 也积极参与了多个...

GPU计算型和GPU虚拟化型实例概述

网络:支持IPv6 实例网络性能与计算规格对应(规格越高网络性能越强)适用场景:配备高性能CPU、内存、GPU,可以处理更多并发AI推理任务,适用于图像识别、语音识别、行为识别业务 支持RTX功能,搭配高主频CPU,提供高性能的3D图形虚拟化...

弹性裸金属服务器概述

Y N Y 物理机和虚拟机之间相互冷迁移 Y N Y 免操作系统安装 Y N Y 免本地RAID,提供更高云盘数据保护 Y N Y 网络 完全兼容专有网络VPC Y N Y 完全兼容经典网络 Y N Y 物理机集群和虚拟机集群间VPC无通信瓶颈 Y N Y 管控 完全兼容ECS现有...

实例规格族

小规格实例云盘IOPS和云盘带宽具备突发能力 实例存储I/O性能与计算规格对应(规格越高存储I/O性能越强)说明 全新一代企业级实例规格族的存储I/O性能表,请参见 存储I/O性能。网络:支持IPv4、IPv6 支持ERI(Elastic RDMA Interface)说明 ...

网络优化

整体来看高速通道建立了高速、稳定、安全的私网通信,从性能层面无疑是最佳选择,但由于几种方案适用的场景差异性比较大,简单地横向比较在实践中的意义并不大,具体情况还是需要结合具体场景进行选择。作为连接 IDC 与云上专有网络 VPC 的...

在容器(Docker)中配置eRDMA

eRDMA(Elastic Remote Direct Memory Access)是一种高性能网络通信技术,将eRDMA功能引入容器(Docker)环境可以实现容器应用程序绕过操作系统内核直接访问主机的物理eRDMA设备,从而提供更快的数据传输和通信效率,适用于在容器中需要大...

安装Sidecar代理

Sidecar代理通常是一个专门的透明网络代理(如Envoy),用于拦截并处理应用容器的入和出流量,实现对底层网络功能的抽象化管理,例如负载均衡、服务发现、流量控制、重试和超时处理等。Sidecar代理与控制平面组件相互通信,控制平面...

DDH上的ECS实例常见问题

同一台DDH和不同DDH内创建的ECS实例间的网络通信区别?在DDH和共享宿主机上创建的ECS实例有什么区别?DDH上的ECS实例和共享宿主机上的ECS实例存在以下区别:功能方面:DDH不支持创建经典网络ECS实例。其他功能差异,请参见 宿主机上ECS...

在企业级实例上配置eRDMA

为支持eRDMA能力的企业级ECS实例配置eRDMA,实现在不需要修改现有网络架构的情况下,体验超低延迟、大吞吐、高弹性的高性能RDMA网络服务。本文介绍如何在企业级ECS实例上配置eRDMA,以充分利用高效可扩展的RDMA能力,从而提升您的网络性能...

WebSocket配置

如果您的源需要支持 ws:/或 wss:/类型的WebSocket协议请求,需要在DCDN上开启Websocket功能,DCDN可以通过WebSocket协议与源进行通信,实现实时的数据传输和更新。背景信息 WebSocket协议是一种基于TCP的持久化协议,实现客户端与...

已停售的实例规格

本文所列实例规格在中国已全部停售,其中,sn2、sn1、n1、n2和e3在国际(International)仍然在售。存储增强型实例规格族g5se 通用型实例规格族sn2 RDMA增强型实例规格族c7re 计算型实例规格族sn1 高主频计算型实例规格族c4、ce4、cm4 ...

产品优势

背景信息 云原生多模数据库 Lindorm 兼容HBase、Cassandra、S3、TSDB、HDFS、Solr等多种标准接口,支持宽表、时序、对象、文本、队列、空间等多种数据模型,适用于日志、账单、标签等多种数据的存储及分析,具有高性能、低成本等特点。...

搭建高性能网络ACK集群

阿里云托管版容器服务ACK集群,支持自研的Terway网络插件,该插件可以有效减少因容器而引入的网络性能下降,可以基本达到服务器之间直接通信的网络性能。本最佳实践主要是一个性能测试方面的实践,指导客户进行POC测试等。解决问题 Pod之间...

设备接入引导

SL 651:建议采用TLS方式接入,支持使用服务端单向认证、设备端和服务端证书OCSP能力、设备和服务端双向安全认证等能力,适用于遥测设备与阿里云企业物联网平台之间的通信,用于水文监测数据采集与传输。云端开发流程如下:接入中国电信...

网络

功能介绍 配置项 功能描述 IPv6访问 IPv4的网络地址资源不足严重制约了互联网的发展,而IPv6的引入使得该问题得以解决,阿里云 全加速 DCDN 长期致力于互联网技术的健康、可持续发展。我们默认为您的站点免费开启IPv6服务,客户端可根据...
共有99条 < 1 2 3 4 ... 99 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 高速通道 语音服务 物联网无线连接服务 边缘网络加速 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用