安装ACCL库

ACCL(Alibaba Collective Communication Library)是一款高性能通信库,提供了AllReduce、AllToAllV、Broadcast等常用集合操作接口以及点到点Send/Recv接口,为多机多卡训练提供高效的通信支持。本文为您介绍如何安装ACCL库。背景信息 ...

分布式训练DLC 算力健康检测发布

在检测完成后,会给出有关GPU算力以及通信性能的检测报告,可以帮助识别和定位可能导致任务训练性能下降的问题元素,整体提升问题诊断的效率。目前仅支持在华北6(乌兰察布)地域,使用灵骏智算资源提交的DLC训练任务,开启健康检测功能。...

功能特性

灵骏满足AI、HPC等计算密集场景需要的高性能算力,可实现高性能、大规模的池化算力,满足自动驾驶、科研、金融、生物制药等多行业的异构算力需求。本文为您介绍灵骏的功能特性。高速RDMA网络架构 阿里巴巴2016年开始投入专项研究RDMA...

使用IMB软件和MPI通信库测试集群通信性能

本文以IMB软件和MPI通信库为例介绍如何测试E-HPC集群的通信性能。背景信息 IMB(Intel MPI Benchmarks)用于评估HPC集群在不同消息粒度下节点间点对点、全局通信的效率。MPI(Message Passing Interface)是支持多编程语言编程的并行计算...

基础设施安全

在检测完成后,会给出有关GPU算力以及通信性能的检测报告,可以帮助识别和定位可能导致任务训练性能下降的问题元素,整体提升问题诊断的效率。详细使用说明请参见 SanityCheck:算力健康检测。基础设施监控 支持接入云监控,构建并巩固您的...

eRDMA

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA),是阿里云提供的低延迟、大吞吐、高弹性的高性能RDMA网络服务。eRDMA的能力实现需要基于支持eRDMA能力的实例规格,创建挂载支持弹性RDMA能力的网卡,才能够实现具有大规模RDMA...

网络优化

云企业网通过 转发路由器 TR(TransitRouter)在跨地域专有网络之间,专有网络与本地数据中心间搭建私网通信通道,支持在地域内定义灵活的互通、隔离、引流策略,帮助您打造一张灵活、可靠、大规模的企业级云上网络。企业版转发路由器实例...

eRDMA概述

众多应用都是基于TCP/IP构建的,但随着数据中心相关的业务蓬勃发展,应用对于网络的性能需求(如延迟、吞吐)越来越高,受限于TCP/IP的局限性(如拷贝开销大、协议栈处理厚、CC算法复杂、上下文切换频繁等),TCP/IP的网络通信性能已经成为...

查询网络通信距离(NCD)

PAI灵骏提供了统一的网络通信距离NCD(Network Communication Distance)查询接口,供您对GPU节点(或网卡)间的通信距离进行查询,以实现更优的任务调度,获得最佳的训练性能。本文为您介绍NCD的基本概念、使用NCD的原因以及如何使用NCD。...

PAI灵骏智算服务概述

PAI灵骏 是一种大规模高密度计算服务,全称“PAI灵骏智算服务”,提供高性能AI训练、高性能计算所需的异构计算算力服务。PAI灵骏 主要面向图形图像识别、自然语言处理、搜索广告推荐、通用大模型等大规模分布式的AI研发场景,适用于自动...

AIACC-ACSpeed体验示例

AIACC-ACSpeed(简称ACSpeed)作为阿里云自研的AI训练加速器,在提高训练效率的同时能够降低使用成本,可以实现无感的分布式通信性能优化。ACSpeed软件包中已为您提供了适配DDP的示例代码,您可以参考本文快速体验使用ACSpeed进行模型分布...

安全类

服务器数据盘使用整盘加密,服务器之间仅允许内网通信,并在系统层面限制特定内网 IP 才允许通信,保证用户数据在服务器端的安全。网站全站通信采用 256 位 HTTPS 加密,保证用户数据在服务器和浏览器之间传输的安全。数据库采用 Replica ...

使用Terway网络插件

由于不需要使用VxLAN等隧道技术封装报文,因此Terway模式网络具有较高的通信性能。Terway提供共享ENI多IP模式和独占ENI模式,以下介绍两种方式的实现原理和存在的差异。Terway共享ENI多IP模式 在共享ENI(弹性网络接口)多IP模式下,多个...

功能发布记录

2022年11月 更新事项 描述 AI Earth 地球科学云平台正式发布 平台集公开数据检索、在线处理分析(工具箱模式+开发者模式)、遥感AI模型训练为一体,为广大科研用户和政企用户提供便捷高效的一式遥感云计算服务。2022年08月 更新事项 描述...

免费试用阿里云产品

领域 云产品 免费试用教程 计算 云服务器 ECS 部署并使用Docker 部署LNMP环境(CentOS 7)函数计算 FC 使用Serverless搭建性能网盘 无影云电脑 开通并登录无影云电脑 容器 容器镜像服务 ACR 在Dockerfile中使用构建打包镜像并运行 容器...

产品优势

本文介绍Link WAN网管核心与自建核心能力间的差异以及D2D通信技术。能力差异 能力 Link WAN(LoRaWAN)其他LoRa平台 LoRaWAN国际标准 遵循LoRaWAN国际标准协议。标准纷乱,彼此互不相通,系统维护成本高。技术 阿里云自主迭代,跟随联盟...

一小时快速搭建网站

本文旨在介绍如何在一小时之内使用云速成美快速搭建网站。

什么是云联络中心

网络业务 一式:支持电话通信、网络IM、网络音视频等全渠道,一式管理、服务、数据分析平台,便于企业统一管理。易部署:轻量化自定义生成网络插件,自定义风格样式,一键部署。灵活配置:完善的路由分配策略与营业时间配置,服务管理...

性能监控最佳实践

建设一体化性能监控平台 随着互联网技术的不断发展,企业的业务规模和复杂度也在不断增加。为了保证业务的稳定性和可靠性,企业需要对其系统进行全面的性能监控。而一体化性能监控就是一种集成了多种监控工具和技术的综合性监控方案,可以...

数据概览

语音业务提供客户服务联络中心通信服务平台,满足企业呼叫中心电话呼入呼出的服务,同时协同阿里云通信和第三方号码号线即买即开即用服务,帮助企业以更低的成本快速搭建客户联络中心 产品优势 1.一式:支持网络IM、网络音视频等全渠道,...

GPU计算型

GPU计算型实例具有高性能、高并行计算能力,适用于大规模并行计算场景,可以为您的业务提供更好的计算性能和效率。本文为您介绍云服务器ECS GPU计算型实例规格族的特点,并列出了具体的实例规格。主售(推荐类型)GPU计算型实例规格族gn7e ...

弹性裸金属服务器概述

兼容多种专有云 弹性裸金属服务器可以进一步解决您对高性能计算的强需求,更好地帮助您搭建新型混合云。弹性裸金属服务器不仅具有虚拟机的灵活性和弹性,同时具备物理机的一切特性和优势,因此也具备再次虚拟化的能力,线下的私有云均可...

应用场景

性能:提供基于事件驱动的架构以及私有通信协议,轻松搭建低延迟、高吞吐的服务。可扩展性强:支持无限水平扩展,无性能、容量瓶颈,在蚂蚁金融科技内部已支撑数万个节点规模的分布式应用架构。可视化管理:在分布式系统中,面对爆发式...

产品优势

阿里云游戏平台基于阿里云的技术底座,同时具备低门槛、高质量、生态支持三大优势,帮助游戏行业客户快速搭建云游戏方案,实现业务升级。低门槛 阿里云游戏平台结合云服务特性与云游戏PaaS平台开发能力,通过技术能力大大降低客户接入、...

设备接入引导

SL 651:建议采用TLS方式接入,支持使用服务端单向认证、设备端和服务端证书OCSP能力、设备和服务端双向安全认证等能力,适用于遥测设备与阿里云企业物联网平台之间的通信,用于水文监测数据采集与传输。云端开发流程如下:接入中国电信...

阿里云电子政务云产品全家福

阿里云电子政务云平台价格是华北2公共云同等配置的2倍 弹性裸金属服务器(神龙)弹性裸金属服务器(ECS Bare Metal Instance)是一种可弹性伸缩的高性能计算服务,计算性能与传统物理机无差别,具有安全物理隔离的特点,分钟级的交付周期将...

如何选择私网类产品?

云企业网 云企业网帮助您在VPC间建立私网通信通道,通过自动路由分发及学习,提高网络的快速收敛和跨网络通信的质量和安全性,实现全网资源的互通,帮助您打造一张具有企业级规模和通信能力的互联网络。更多信息,请参见以下文档:使用云...

产品优势

背景信息 云原生多模数据库 Lindorm 兼容HBase、Cassandra、S3、TSDB、HDFS、Solr等多种标准接口,支持宽表、时序、对象、文本、队列、空间等多种数据模型,适用于日志、账单、标签等多种数据的存储及分析,具有高性能、低成本等特点。...

实例规格族

小规格实例云盘IOPS和云盘带宽具备突发能力 实例存储I/O性能与计算规格对应(规格越高存储I/O性能越强)说明 全新一代企业级实例规格族的存储I/O性能表,请参见 存储I/O性能。网络:支持IPv4、IPv6 支持ERI(Elastic RDMA Interface)说明 ...

服务等级协议

性能计算 弹性高性能计算服务等级协议 批量计算服务等级协议 Serverless Serverless应用引擎服务等级协议 函数计算服务等级协议 无影 图形工作服务等级协议 无影云电脑服务等级协议 边缘计算 边缘网络加速(ENA)服务等级协议 边缘网络...

应用场景

性能 提供基于事件驱动的架构以及自研二进制通信协议,轻松搭建低延迟、高吞吐的服务。可扩展性强 支持无限水平扩展,无性能、容量瓶颈,在蚂蚁金服已支撑数万个节点规模的分布式应用架构。可视化管理 在分布式系统中,面对爆发式增长的...

搭建性能网络ACK集群

本文介绍搭建性能网络ACK集群的场景描述、解决问题、架构图及操作参考链接。场景描述 容器的网络协议栈实现方式,导致容器之间的网络性能,相比服务器之间直接通信方式,会有一 定程度的下降。阿里云托管版容器服务ACK集群,支持自研的...

发布记录

权限管理 2021年5月 序号 说明 发布时间 发布地域 相关文档 1 更新系统搭建中绑定基站的步骤,用户可以自己进行基站绑定和激活 2021-05-12 中国 系统搭建 2 更新价签基站管理章节,新增激活基站操作步骤 2021-05-12 中国 价签基站管理 ...

网络FAQ

网络性能问题 不同地域内的ECS实例通过公网通信通信丢包概率如何?如果相同地域下的ECS实例通过内网通信,网络延迟性能如何?没有明确标注连接数规格的实例,如何保障连接数性能?在ECS实例上UDP PPS测试或者TCP带宽测试时性能不稳定,...

OpenSearch产品选型

场景与优势 商品版本 目标场景 版本优势 行业算法版 对搜索效果有更高的要求,可快速一搭建行业智能搜索系统,需要 行业最佳实践、行业查询分析算法、行业排序模型、定制调优模型的企业及开发者建议接入此类型;目前重点覆盖行业:电商...

搭建电商平台网站流程

搭建电商平台,享受科技带来的效率。无需担心各类资质办理,阿里云专业服务人员全程代办。专业平台云·速成美搭建网站就和做PPT一样简单。参考如下流程,建设属于自己的电商平台网站吧。网站建设流程.aliware-img-container { position...

实现选项

云治理中心为企业提供一搭建Landing Zone、一式治理的平台。集成了阿里云多账号身份、权限、网络、合规以及安全等管理能力,可以自动化地部署Landing Zone安全合规的多账号环境;帮助企业客户高效的构建云上管理治理框架,在可管可控...

什么是AI分布式训练通信优化库AIACC-ACSpeed

因此,基于PCIe-topo机型搭建的多机训练环境下,您可以将单机CPU-Reduce扩展到多机,充分释放单机的性能,同时解决以Socket连接为主的跨机通信的扩展性问题。优化方法 多机CPU-Reduce的实现继承了单机CPU-Reduce高效的异步流水线,将跨机...

应用场景

电商零售智能搜索、内容社区智能搜索、游戏智能搜索、教育搜题等 适用客户:开箱即用,适合有智能搜索诉求的中小企业及开发者 高性能检索版 版本特性:大数据检索性能深度优化,实现秒级响应,实时查询能力,支持一式快速搭建订单、优惠...

如何搭建CDN镜像源服务

本文介绍如何通过源OFFLAOD搭建CDN镜像源服务,实现一次回源或备源能力。前提条件 请确保您已经开通源OFFLOAD服务(仅对邀测用户开放)。请确保您已经开通OSS服务/或ENS存储服务(ENS存储服务需要申请,请通过您的商务或者TAM进行...
共有155条 < 1 2 3 4 ... 155 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
音视频通信 短信服务 性能测试 边缘网络加速 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用