安装ACCL库

ACCL(Alibaba Collective Communication Library)是一款高性能通信库,提供了AllReduce、AllToAllV、Broadcast等常用集合操作接口以及点到点Send/Recv接口,为多机多卡训练提供高效的通信支持。本文为您介绍如何安装ACCL库。背景信息 ...

什么是AI分布式训练通信优化库AIACC-ACSpeed

AIACC-ACSpeed优化原理 场景说明 使用单机多卡或多机多卡进行AI分布式训练时,分布式通信的线性度可作为单卡训练扩展到多卡的性能指标,线性度的计算方式如下:单机内部扩展性:线性度=多卡性能/单卡性能/单机卡数 多机之间扩展性:线性度=...

建立gRPC连接

gRPC具有高性能的特点,能有效减少带宽使用、降低网络延迟。gRPC的 作用与 优势 高效通信:利用HTTP/2的多路复用特性,gRPC能够在一个TCP连接上并发执行多个请求,提高了通信效率和性能。跨语言互操作性:gRPC支持多种主流编程语言,允许...

搭建高性能网络ACK集群

阿里云托管版容器服务ACK集群,支持自研的Terway网络插件,该插件可以有效减少因容器而引入的网络性能下降,可以基本达到服务器之间直接通信的网络性能。本最佳实践主要是一个性能测试方面的实践,指导客户进行POC测试等。解决问题 Pod之间...

网络优化

整体来看高速通道建立了高速、稳定、安全的私网通信,从性能层面无疑是最佳选择,但由于几种方案适用的场景差异性比较大,简单地横向比较在实践中的意义并不大,具体情况还是需要结合具体场景进行选择。作为连接 IDC 与云上专有网络 VPC 的...

性能参数模板

PolarDB MySQL版 支持高性能参数模板功能。本章节详细介绍 PolarDB MySQL版 支持的高性能参数模板中的参数设置情况,以及如何开启高性能参数模板和开启高性能模板...在达到256并发数后,高性能参数模板的性能是默认参数模板的2倍甚至更高。

突发性能实例概述

基准性能 突发性能实例的基准性能由实例规格决定,基准性能是实例可以持续稳定地提供的CPU性能。您可以从实例规格指标数据的 平均基准CPU计算性能 列查看不同实例规格的基准性能。CPU积分 CPU积分可以视为您持有的计算能力,决定突发性能...

概述

全局一致性(高性能模式)在高并发场景下,性能是RW模式的1.7倍左右。全局一致性(高性能模式)RO读扩展性能 在读写比例较高的场景中,比如Sysbench标准的oltp_read_write,通过扩展RO节点可以进一步提升集群的性能。更重要的是,扩展RO...

性能监控概念

什么是性能监控,以及性能监控的对象有哪些。伴随着突发流量、系统变更或代码腐化等因素,性能退化随时会发生。如在周年庆大促期间由于访问量暴涨导致请求超时无法下单;应用发布变更后,页面频繁卡顿导致客诉上升;线上系统运行一段时间后...

查看集群性能

E-HPC优化器是性能监控与剖析平台,支持集群性能指标、查看集群性能历史记录、分析进程级的性能热点。您可以根据E-HPC优化器展示的性能大盘及性能数据优化集群性能。查看性能大盘 登录 弹性高性能计算控制台。在顶部菜单栏左上角处,选择...

控制面核心组件

Pilot 落地实践 在开始落地实践部分之前,先引入 Istio 的架构图:出于性能等方面的综合考虑,在落地过程中,蚂蚁团队将控制面的组件精简为 Pilot 和 Citadel 两个组件,不使用因性能问题争议不断的 Mixer,不引入 Galley 来避免多一跳的...

ESSD AutoPL云盘

云盘特点 ESSD AutoPL云盘的性能是基准性能、预配置性能以及性能突发之和,其中基准性能与ESSD云盘的PL1级别保持一致,预配置性能和性能突发是该云盘的主要特点,最大可以支持100万IOPS、4 GB/s吞吐量和1,000 IOPS/GB的性能密度。...

产品优势

本文介绍Link WAN网管核心与自建核心能力间的差异以及D2D通信技术。能力差异 能力 Link WAN(LoRaWAN)其他LoRa平台 LoRaWAN国际标准 遵循LoRaWAN国际标准协议。标准纷乱,彼此互不相通,系统维护成本高。技术 阿里云自主迭代,跟随联盟...

PTS压测快速入门

其中PTS压测作为容量规划阶段重要的环节,可模拟海量用户的真实业务场景,全方位验证业务站点的性能、容量和稳定性。本文介绍阿里云的高可用架构和PTS的压测流程。高可用架构 为了更全面系统的提升业务高可用性,阿里云从规划、线上管控、...

概述

性能度量了系统在单元环境内承载工作负载的效率,系统性能通常可以由 QPS、并发和RT(响应时间)等典型指标来衡量。在传统 IT 环境中,系统的容量评估和规划是系统设计的重要环节,通常会基于系统对峰值负载表现出来的性能承载能力来给系统...

功能发布记录

2022年11月 更新事项 描述 AI Earth 地球科学云平台正式发布 平台集公开数据检索、在线处理分析(工具箱模式+开发者模式)、遥感AI模型训练为一体,为广大科研用户和政企用户提供便捷高效的一式遥感云计算服务。2022年08月 更新事项 描述...

网络

功能介绍 配置项 功能描述 IPv6访问 IPv4的网络地址资源不足严重制约了互联网的发展,而IPv6的引入使得该问题得以解决,阿里云 全加速 DCDN 长期致力于互联网技术的健康、可持续发展。我们默认为您的站点免费开启IPv6服务,客户端可根据...

功能特性

PTS压测可模拟海量用户的真实业务场景,全方位验证业务站点的性能、容量和稳定性。创建压测场景 SLA管理 服务等级定义SLA(Service Level Agreement)是判定压测是否异常的重要依据。压测过程中,通过监控核心服务状态的SLA指标数据,可以...

云资源监控

性能测试过程中,往往需要实时观察各项指标是否正常,包括PTS本身已经具备的强大的客户端指标,以及应用服务器、数据库、中间件、网络入口等方面的指标。更重要的是,监控的过程是发现系统瓶颈的过程,监控数据是性能基线管理、容量规划...

GetCloudMetricProfiling-获取集群任务性能剖析结果

调用GetCloudMetricProfiling获取集群任务性能剖析结果。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在...

授权信息

本文为您介绍 性能测试(PTS)为RAM权限策略定义的操作(Action)、资源(Resource)和条件(Condition)。性能测试(PTS)的RAM代码(RamCode)为 pts,支持的授权粒度为 OPERATION。权限策略通用结构 权限策略支持JSON格式,其通用结构...

设备接入引导

SL 651:建议采用TLS方式接入,支持使用服务端单向认证、设备端和服务端证书OCSP能力、设备和服务端双向安全认证等能力,适用于遥测设备与阿里云企业物联网平台之间的通信,用于水文监测数据采集与传输。云端开发流程如下:接入中国电信...

CLB实例FAQ

性能共享型实例与性能保障型实例区别如下:特性 性能共享型实例 性能保障型实例 资源分配 资源共享 资源独享 可用性SLA 不提供 99.95%IPv6×✔ 支持SNI多证书×✔ 支持黑白名单×✔ 支持绑定弹性网卡ENI×✔ 添加ECS弹性网卡ENI的辅助IP×...

如何发起实时数仓Hologres性能压测

本文为您介绍如何通过阿里云性能测试PTS对Hologres的性能进行压测,帮助您快速验证Hologres的性能。背景信息 Hologres是兼容PostgreSQL协议的实时交互式分析引擎,可以使用pgbench工具对其进行性能测试,详情请参见 测试方案介绍。但测试...

如何发起实时数仓Hologres性能压测

本文为您介绍如何通过阿里云性能测试PTS对Hologres的性能进行压测,帮助您快速验证Hologres的性能。背景信息 Hologres是兼容PostgreSQL协议的实时交互式分析引擎,可以使用pgbench工具对其进行性能测试,详情请参见 测试方案介绍。但测试...

性能监控概述

场景 单机性能采集 持续性能采集 对比某服务在测试环境与生产环境的性能差异 不支持 支持 对比某服务版本1.0与版本2.0的性能差异 不支持 支持 对比某服务在ARM服务器与AMD服务器的性能差异 不支持 支持 对比某服务在北京地域与杭州地域服务...

基于eRDMA增强型实例部署AI训练集群

在NCCL底层通信链接上,有多种不同的传输方式,例如单机内部多卡P2P通信以及多机上的传统socket通信(如VPC网络)和高性能的InfiniBand(IB)通信,其中eRDMA是一种基于RDMA的传输方式,具有极低的延迟,并且在性能上接近RDMA网络的优势。...

实践教程概览

使用IMB软件和MPI通信库测试E-HPC通信性能 IMB(Intel MPI Benchmarks)用于评估HPC集群在不同消息粒度下节点间点对点、全局通信的效率。MPI(Message Passing Interface)是支持多编程语言的并行计算通信库,具有高性能、大规模性、可移植...

使用IMB软件和MPI通信库测试集群通信性能

本文以IMB软件和MPI通信库为例介绍如何测试E-HPC集群的通信性能。背景信息 IMB(Intel MPI Benchmarks)用于评估HPC集群在不同消息粒度下节点间点对点、全局通信的效率。MPI(Message Passing Interface)是支持多编程语言编程的并行计算...

并发用户、RPS、TPS的解读

如何评价系统的性能 针对服务器端的性能,以TPS为主来衡量系统的性能,并发用户数为辅来衡量系统的性能,如果必须要用并发用户数来衡量的话,需要一个前提,那就是交易在多长时间内完成,因为在系统负载不高的情况下,将思考时间(思考时间...

什么是Deepytorch Training(训练加速)

产品优势 训练性能显著提升 Deepytorch Training通过整合分布式通信和计算图编译的性能特点,可以实现端到端训练性能的显著提升,使得模型训练迭代速度更快,不仅减少了资源的使用成本,还缩短了迭代的时间成本,为您带来低成本体验。...

通信授权服务使用流程

通信授权服务,是指阿里云为企业提供的一种用户与企业之间的通信许可服务。通过该服务,可以方便用户管理自己跟企业之间的通讯许可关系。通过该服务的接入,可以方便用户管理企业对自己的通信触达需求。如果您想使用通信授权服务,可以参考...

什么是AI通信加速库Deepnccl

Deepnccl是为阿里云神龙异构产品开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。本文主要介绍Deepnccl的架构、优化原理和性能说明。产品简介 Deepnccl基于NCCL(NVIDIA Collective ...

功能特性

灵骏满足AI、HPC等计算密集场景需要的高性能算力,可实现高性能、大规模的池化算力,满足自动驾驶、科研、金融、生物制药等多行业的异构算力需求。本文为您介绍灵骏的功能特性。高速RDMA网络架构 阿里巴巴2016年开始投入专项研究RDMA...

eRDMA

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA),是阿里云提供的低延迟、大吞吐、高弹性的高性能RDMA网络服务。eRDMA的能力实现需要基于支持eRDMA能力的实例规格,创建挂载支持弹性RDMA能力的网卡,才能够实现具有大规模RDMA...

地球球体层

本文介绍 地球球体层 的图标样式和各配置项的含义。图表样式 地球球体层是3D球形地图的子组件,支持自定义地球贴图和大气层配置。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索配置 面板中输入您需要搜索的配置项名称,...

eRDMA概述

众多应用都是基于TCP/IP构建的,但随着数据中心相关的业务蓬勃发展,应用对于网络的性能需求(如延迟、吞吐)越来越高,受限于TCP/IP的局限性(如拷贝开销大、协议栈处理厚、CC算法复杂、上下文切换频繁等),TCP/IP的网络通信性能已经成为...

地球容器

地球容器是3D地球中用于承载地图本身和各子组件的容器,支持添加球体层、大气层、飞线层等子组件,支持配置地图的渲染模式、背景、视点位置等,能够以3D立体的形式,多角度、多形式地渲染全世界地理位置的实时数据。本文介绍3D地球容器各...

地球容器

本文介绍3D地球组件地图容器的图标样式和各配置项的含义。图表样式 地球容器是3D地球中用于承载地图本身和各子组件的容器,支持添加球体层、大气层、飞线层等子组件,支持配置地图的渲染模式、背景、视点位置等,能够以3D立体的形式,多...

性能洞察

数据库自治服务DAS 为 RDS SQL Server 提供性能洞察功能,专注于实例负载监控、关联分析、性能调优的利器,以简单直观的方式帮助用户迅速评估数据库负载,找到性能问题的源头,提升数据库的稳定性。前提条件 当前不支持 RDS SQL Server ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 云数据库 Redis 版 物联网无线连接服务 边缘网络加速 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用