PAI灵骏智算服务概述

PAI灵骏 的底层硬件核心组件由磐久服务器和高性能RDMA网络两部分组成:服务器采用阿里云自研的磐久服务器,在核心配置上进行多项优化,充分保证硬件的性能释放。网络支持常见的Fat-Tree网络拓扑,支持TCP/IP和RDMA等多种通信协议。其中,...

突发性能实例概述

性能约束模式适用于负载稳定,CPU使用率不会长时间超过基准性能,偶尔需要提高计算性能完成工作的场景,例如轻量级的Web服务器、开发测试环境、中低性能数据库等。无性能约束模式 在无性能约束模式下,突发性能实例可以突破可用CPU积分的...

什么是Deepytorch Training(训练加速)

针对PCIe互连拓扑的通信优化,可以采用基于流水线的PS(Parameters Server:参数服务器)模式梯度规约算法CPU-Reduce来降低通信耗时,该算法按照GPU到CPU再到GPU的顺序构建流水线,将梯度规约的计算分散到多个设备上运行,来减少通信瓶颈。...

什么是AI通信加速库Deepnccl

针对PCIe互连拓扑的通信优化特点,理论上,可以采用基于流水线的PS(Parameters Server:参数服务器)模式梯度规约算法CPU-Reduce大幅降低通信耗时。该算法按照GPU到CPU再到GPU的顺序构建流水线,将梯度规约的计算分散到多个设备上运行,来...

常见问题

x86架构:1 vCPU 2 GiB 1 vCPU 4 GiB 2 vCPU 2 GiB 2 vCPU 4 GiB 突发性能实例t6 突发性能实例t5 2 vCPU 8 GiB ARM64架构:实例规格 vCPU 内存(GiB)ecs.c6r.large 2 4 ecs.g6r.large 2 8 ecs.c6r.xlarge 4 8 ecs.g6r.xlarge 4 16 ecs.c6r...

监控、诊断和故障排除

监视性能 监控服务提供了以下监控项来监控性能相关的指标:平均延时,包括E2E平均延时和服务器平均延时 延时指标显示API操作类型处理请求所需的平均和最大时间。其中E2E延时是端到端延迟指标,除了包括处理请求所需的时间外,还包括读取...

计算型

超高网络收发包PPS能力 小规格实例网络带宽具备突发能力 实例网络性能与计算规格对应(规格越高网络性能越强)安全 支持vTPM特性,依托TPM/TCM芯片,实现从物理服务器到实例的启动链可信度量,提供超高安全能力 支持基于AMD安全加密虚拟化...

超级计算集群概述

超级计算集群SCC(Super Computing Cluster)在弹性裸金属服务器基础上,加入高速RDMA(Remote Direct Memory Access)互联支持,大幅提升网络性能,提高大规模集群加速比。因此SCC在提供高带宽、低延迟优质网络的同时,还具备弹性裸金属...

通用型

小规格实例网络带宽具备突发能力 实例网络性能与计算规格对应(规格越高网络性能越强)安全 支持vTPM特性,依托TPM/TCM芯片,实现从物理服务器到实例的启动链可信度量,提供超高安全能力 采用英特尔TME(Total Memory Encryption)运行内存...

阿里云VPC内网压测

PTS的阿里云VPC内网压测模式是指施压机与被压测服务器在相同地域,通过阿里云VPC内网进行压测。本文介绍如何使用阿里云VPC内网进行单机或多机的压测。限制条件 阿里云VPC内网压测目前存在以下限制。资源限制:VPC不同地域支持的压测能力不...

内存型

超高网络收发包PPS能力 小规格实例网络带宽具备突发能力 实例网络性能与计算规格对应(规格越高网络性能越强)安全 支持vTPM特性,依托TPM/TCM芯片,实现从物理服务器到实例的启动链可信度量,提供超高安全能力 支持基于AMD安全加密虚拟化...

测试指标

本文介绍性能测试的各种测试指标。编写目的和适用对象 本指标适用于使用性能测试进行性能测试项目技术质量评价依据,规范技术测试结果评价,统一性能测试技术测试质量度量。应用系统技术质量度量指标范围广泛,本文难以涵盖全部。预期读者...

阿里云VPC内网压测

PTS的阿里云VPC内网压测模式是指施压机与被压测服务器在相同地域,通过阿里云VPC内网进行压测。本文介绍如何使用阿里云VPC内网进行单机或多机的压测。限制条件 阿里云VPC内网压测目前存在以下限制。资源限制:VPC不同地域支持的压测能力不...

挑战和注意事项

成本:性能与成本的关系通常不是线性的,各瓶颈点的性能突破往往意味着阶梯式的成本增加,而不同产品或产品类型之间成本可能差别巨大,需要从规格、产品组合、业务特征等方面综合权衡选择合适的方案,避免单方面的追求某一方面导致整体设计...

标准架构

高可用采用主从架构,提供高性能的缓存服务,且支持数据高可靠。单副本采用单节点架构,适用于数据可靠性要求不高的纯缓存业务场景,性价比高。高可用 标准架构高可用类型采用主从(master-replica)架构搭建。主节点提供日常服务访问,从...

Windows实例中CPU使用率较高问题的排查及解决方法

通过尝试升配实例规格的方式,使用更多核数或内存的规格来解决资源瓶颈问题。更多信息,请参见 升级配置。若自身服务器配置较高,再去升级配置已无太大意义。架构方面也并非是服务器配置越高就越好。此时,您需要尝试进行应用分离,通过...

常见报错

请检查后端服务器的健康状况,或者网络连接层是否存在瓶颈。org.apache.http.ConnectionClosedException:Connection closed 表示连接异常关闭,服务端主动关闭了连接。org.apache.hc.core5....

常见报错

请检查后端服务器的健康状况,或者网络连接层是否存在瓶颈。org.apache.http.ConnectionClosedException:Connection closed 表示连接异常关闭,服务端主动关闭了连接。org.apache.hc.core5....

什么是应用型负载均衡ALB

ALB允许自定义可用区组合和在可用区间弹性伸缩,避免单可用区资源瓶颈。先进的协议支持 ALB支持HTTP、HTTPS和QUIC协议,具备超大规模的流量处理能力。在实时音视频、互动直播和游戏等移动互联网应用中,访问速度更快,传输链路更安全可靠。...

选择镜像

这些镜像通常经过优化和配置,以提供更好的性能和功能。本文旨在帮助您如何从众多镜像类型和操作系统中选择合适的镜像。选择镜像时,您需要考虑以下因素。地域 镜像类型 镜像费用 操作系统 内置软件(如镜像中是否安装了MySQL等应用软件)...

管理服务器

服务器资产接入云安全中心后,您可以在主机资产的服务器页签下同步最新资产信息、查看服务器信息、对服务器进行分组管理、修改服务器的保护状态等。本文介绍如何进行服务器管理。操作演示视频 以下视频为您演示了使用云安全中心管理...

NVMe协议介绍

机器学习 机器学习是另一个共享盘典型应用场景,在将样本标注写入后,会将数据拆分给多个节点进行神经网络的分布式计算,特别是在以GPU为计算资源的高性能机器学习场景,慢速存储很可能成为整个系统的瓶颈,此时利用NVMe共享云盘的高性能,...

采集企业内网服务器日志

本文以Nginx为例,介绍配置正向代理服务器以及通过代理模式将企业内网服务器日志采集到日志服务的解决方案。前提条件 已创建Project和Logstore。具体操作,请参见 创建项目Project 和 创建Logstore。已在服务器上安装Linux Logtail 1.5.0及...

添加QUIC监听

QUIC协议介绍 QUIC协议又被称为快速UDP互联网连接协议,提供与SSL相同的安全性,同时具备多路复用等多种优势,具有极佳的弱网性能,在丢包和网络延迟严重的情况下仍可提供可用的服务。QUIC协议在应用程序层面可以实现不同的拥塞控制算法,...

Windows系统ECS实例中CPU使用率较高问题的排查及解决...

通过尝试增配实例规格的方式,使用更多核数或内存的规格来解决资源瓶颈问题。更多信息,请参见 升降配方式概述。若自身服务器配置较高,再去升级配置已无太大意义。架构方面也并非是服务器配置越高就越好。此时,您需要尝试进行应用分离,...

基本概念

QUIC在应用程序层面就能实现不同的拥塞控制算法,不需要操作系统和内核支持,相比于传统的TCP协议,拥有更好的改造灵活性,非常适合在TCP协议优化遇到瓶颈的业务。HTTP状态码 HTTP状态码(英文:HTTP Status Code),是用来表示HTTP响应...

基本概念

QUIC在应用程序层面就能实现不同的拥塞控制算法,不需要操作系统和内核支持,相比于传统的TCP协议,拥有更好的改造灵活性,非常适合在TCP协议优化遇到瓶颈的业务。HTTP状态码 HTTP状态码(英文:HTTP Status Code),是用来表示HTTP响应...

推荐的性能设计模式

在设计从OSS上传和下载数据的应用程序时,请使用我们推荐的性能设计模式,使应用程序达到最佳性能。我们还提供性能优化指导原则,供您在规划应用程序架构时参考。对频繁访问的内容使用缓存 如果您的应用程序需要支持同一地区大量用户同时...

产品优势

对比项 X86服务器 手机农场 手机板卡 阿里云(ARM服务器虚拟化)性能 需要进行二进制指令翻译,性能损失大 与真机性能一致 性能不会超过真机 底层基于第三代神龙架构,可提供超越真机的性能 稳定性 开源软件实现,稳定性较差 消费级产品,...

添加TCP监听

当您的业务属于注重可靠性、对数据准确性要求高和速度可以相对较慢的场景,例如文件传输、发送或接收邮件和远程登录等,您可以为CLB实例添加一个TCP监听,在CLB实例上转发来自客户端的TCP协议请求至后端服务器进行处理。前提条件 您已经...

基于NVMe共享盘部署集群文件系统

背景信息 在当今的企业级数据中心和高性能计算环境中,存在着很多服务器对同一个设备并发读写的需求。例如在大规模数据分析中,大量服务器需要实时并行处理海量数据,这些服务器集群可能需要频繁地对同一份数据库或数据集进行并发的读写...

配置远程鉴权

如果您有自己的鉴权服务器,可以通过配置远程鉴权,将用户请求转发至您指定的鉴权服务器,由鉴权服务器对用户请求进行校验。功能介绍 远程鉴权和URL鉴权的作用一样,都用于保护资源,让资源只被授权成功的用户访问,非授权用户将无法访问。...

GPU计算型

主售(推荐类型)GPU计算型实例规格族gn7e GPU计算型实例规格族gn7i GPU计算型实例...服务器实例规格族ebmgn7ex GPU计算型弹性裸金属服务器实例规格族ebmgn7e GPU计算型弹性裸金属服务器实例规格族ebmgn7ix GPU计算型弹性裸金属服务器实例规格...

什么是AI分布式训练通信优化库AIACC-ACSpeed

AIACC-ACSpeed优化原理 场景说明 使用单机多卡或多机多卡进行AI分布式训练时,分布式通信的线性度可作为单卡训练扩展到多卡的性能指标,线性度的计算方式如下:单机内部扩展性:线性度=多卡性能/单卡性能/单机卡数 多机之间扩展性:线性度=...

ALB服务器组包含至少两台服务器

应用场景 ALB服务器组中包含多台服务器,可以组成高性能、高可用的服务器组,提升业务稳定性。风险等级 默认风险等级:高风险。当您使用该规则时,可以按照实际需求变更风险等级。检测逻辑 ALB服务器组中至少包含两台服务器,视为“合规”...

SLB实例默认服务器组包含至少两台服务器

应用场景 SLB实例的默认服务器组中包含多台服务器,可以组成高性能、高可用的服务器组,提升业务稳定性。风险等级 默认风险等级:高风险。当您使用该规则时,可以按照实际需求变更风险等级。检测逻辑 SLB实例的默认服务器组至少添加两台...

什么是性能测试PTS

基于整个压测场景的性能表现,定位性能问题、发现系统瓶颈。压测创建方式 PTS支持以下4种方式创建压测场景(或称压测用例),如下图所示:说明:方式一:PTS自研零编码可视化编排,使用自研强大引擎压测。方式二:使用PTS自研云端录制器,...

5分钟快速入门

服务器部署 Node.js 性能平台 a.安装 Node.js 性能平台所需组件#安装版本管理工具 tnvm,安装过程出错参考:https://github.com/aliyun-node/tnvm wget -O- https://raw.githubusercontent.com/aliyun-node/tnvm/master/install.sh |bash#...

后端服务器概述

后端服务器简介 负载均衡服务通过设置虚拟服务地址,将添加的同一地域的多台后端服务器虚拟成一个高性能、高可用的应用服务池。您也可以通过虚拟服务器组或主备服务器组管理后端服务器。不同的监听可以关联不同的服务器组,这样一个负载...

功能特性

Node.js 性能平台提供下列功能:性能监控 系统层面 针对服务器(物理机、虚拟机、Docker 等)级别,提供如下监控指标:内存使用 CPU 使用率 系统负载 系统 QPS 硬性性能指标 磁盘使用率 GC 统计 …… 进程层面 针对每个 Node.js 进程,提供...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 云服务器 ECS Web应用防火墙 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用