PAI-TF概述

PAI-TF是人工智能平台PAI为了追求更极致的深度学习训练效率,优化原生Tensorflow的内核并开发周边工具,推出的一款产品。PAI-TF拥有服务化、分布式调度、全局计算调度、GPU卡映射及模型在线预测等特点。警告 公共云GPU服务器即将过保下线,...

游戏行业最佳实践

背景信息 纵观全球,中国游戏产业腾飞,游戏玩家呈现指数级增长,快速、稳定、安全的用户体验成为游戏市场决胜的关键因素。同时,游戏跨国服务场景的增多,受全球复杂的网络环境影响,如何保证全球各地玩家享受稳定流畅的游戏体验成为挑战...

搭建高性能网络ACK集群

本文介绍搭建高性能网络ACK集群的场景描述、解决问题、架构图及操作参考链接。场景描述 容器的网络协议栈实现方式,导致容器之间的网络性能,相比服务器之间直接通信方式,会有一 定程度的下降。阿里云托管版容器服务ACK集群,支持自研的...

分布式通信框架gRPC+

警告 公共云GPU服务器即将过保下线,您可以继续提交CPU版本的TensorFlow任务。如需使用GPU进行模型训练,请前往DLC提交任务,具体操作请参见 创建训练任务。开启gRPC+分布式训练 使用gRPC+进行分布式训练,需要在 tf.train.Server 中添加 ...

GPU虚拟化型

GPU虚拟化型实例具有高性能图形处理和GPU加速计算能力,适用于图形加速/渲染场景或通用计算业务场景。本文介绍为您介绍云服务器ECS GPU虚拟化型实例规格族的特点,并列出了具体的实例规格。GPU虚拟化型实例规格族sgn7i-vws(共享CPU)GPU...

升级配置

随着业务的发展,已购买的服务器资源可能出现不再满足业务需求的情况。您可以根据本文的操作说明升级轻量应用服务器的配置。背景信息 建议您在升级前为轻量应用服务器云盘创建快照,做好数据备份。具体操作,请参见 创建快照。警告 升级...

安全能力概述

阿里云致力于通过技术手段(硬件加密、隔离、用户审计能力等)为您提供安全可靠的隔离计算环境,并在此基础上为您提供了不同等级的安全保护能力,以满足不同用户对安全和性能的要求。概述 当前阿里云主要提供默认内存加密、可信计算(vTPM...

EasyRec Processor(推荐打分服务)

通过联合优化特征工程和TensorFlow模型,EasyRec Processor能够实现高性能的打分服务。本文为您介绍如何部署及调用EasyRec模型服务。背景信息 基于EasyRec Processor的推荐引擎的架构图如下所示:其中EasyRec Processor主要包含以下模块:...

突发性能实例优势

突发性能实例是唯一采用CPU积分概念的一类实例,提供了一种打造性价比服务器的方案。本文为您介绍突发性能实例的具体优势。购置成本低 购买突发性能实例的成本更低,比同配置的共享型实例低10%~48%。说明 突发性能实例的实际性能和CPU...

2022年

2022-03-31 华北2(北京)华东1(杭州)华东2(上海)通用大模型平台 PAI-Blade新增支持TensorFlow2.7版本 PAI-Blade新增支持TensorFlow2.7版本,您可以自主选择TensorFlow版本。2022-03-27 全部地域 无 EAS 新增定时伸缩功能,支持GRPC或...

基于NVMe共享盘部署集群文件系统

背景信息 在当今的企业级数据中心和高性能计算环境中,存在着很多服务器对同一个设备并发读写的需求。例如在大规模数据分析中,大量服务器需要实时并行处理海量数据,这些服务器集群可能需要频繁地对同一份数据库或数据集进行并发的读写...

镜像使用说明

另外,镜像中还包含了一些常用的计算库,如Numpy和TensorFlow等,可以帮助您更轻松地编写高性能的代码。更简化的构建过程 您可以直接使用 函数计算 Serverless GPU基础镜像来构建自己的业务逻辑,无需手动配置NumPy、SciPy等相关环境。使用...

部署数据库

SQL Server SQL Server是美国Microsoft公司推出的一种关系型数据库系统,是一个可扩展的、高性能的、为分布式客户机和服务器计算所设计的数据库管理系统,实现了与WindowsNT的有机结合,提供了基于事务的企业级信息管理系统方案,SQL ...

镜像使用说明

另外,镜像中还包含了一些常用的计算库,如Numpy和TensorFlow等,可以帮助您更轻松地编写高性能的代码。更简化的构建过程 您可以直接使用函数计算Serverless GPU基础镜像来构建自己的业务逻辑,无需手动配置NumPy、SciPy等相关环境。使用...

基本概念

本文汇总使用弹性高性能计算E-HPC过程中涉及的基本概念,方便您查询和了解相关概念。使用弹性高性能计算涉及的相关概念如下表所示。概念 说明 集群 集群指运行高性能计算的节点集合,可以提供单节点不能提供的强大计算能力,拥有高性能、...

SDK简介

阿里云游戏平台SDK是为您提供对接阿里云游戏PaaS服务的客户端SDK,您可以基于SDK使用PaaS服务快速搭建自己的云游戏App。SDK能力说明 拉取云游戏Region列表&测速 获取您在云游戏PaaS平台部署的Region列表。测试到每个Region的RTT。游戏排队/...

应用场景

阿里云游戏平台面向游戏开发商、游戏运营商、通信运营商、视频网站等泛游戏客户提供不同客户场景的服务,助力客户能力升级。游戏开发商 背景 随着游戏内容和玩法丰富度的提高,游戏开发成本越来越,尤其当游戏需要支持跨端运行时,开发...

概述

PolarDB MySQL版 推出了全局一致性(高性能模式)服务。PolarTrans事务系统利用提交时间戳技术CTS和RDMA网络,在内核层面提供全局一致性(高性能模式)服务,保证发往集群任意副本的读请求都可以获得强一致性的结果。本文档介绍了全局一致...

突发性能实例概述

如果偶尔会出现计划外的高性能需求,您还可以选择为突发性能实例打开无性能约束模式。突发性能实例规格包括以下两类:突发性能实例规格族t6 突发性能实例规格族t5 说明 突发性能实例是一种特殊的共享型实例,其他共享型实例规格族,请参见 ...

测试环境

表格存储实例 本次测试使用了两个表格存储实例:高性能实例:位于华东1区域 容量型实例:位于华东1区域 说明 高性能实例与容量型实例的区别在于其磁盘类型不同,高性能实例使用了SSD磁盘,而容量型实例则混合使用了SSD磁盘和SATA磁盘。...

分布式训练框架StarServer

PAI-TF支持更大的训练规模和训练性能,针对典型业务场景,其训练性能比原生TensorFlow提升了数倍。其中,最大测试规模为3000 Worker时,PAI-TF达到近似线性扩展性。警告 公共云GPU服务器即将过保下线,您可以继续提交CPU版本的TensorFlow...

WAF连接源站服务器超时

原因二:后端ECS性能或源站服务器性能瓶颈 排查步骤如下:1.排查服务器是否存在CPU,负载高等问题;2.排查外网带宽跑满均可能导致访问异常。解决方案:检查后端ECS性能,解决性能瓶颈问题,如果是整体系统容量不够,可以通过扩容后端ECS ...

使用ALB实现gRPC协议的负载均衡

gRPC是一种高性能、开源的远程过程调用框架,当您使用gRPC进行后端服务通信时,您可使用应用型负载均衡ALB(Application Load Balancer)实现gRPC协议的负载均衡,统一流量入口。gRPC基于HTTP/2协议进行通信,目前ALB仅支持前端加密(通过...

在ECS实例内访问网站提示“Nginx 502 bad gateway”...

通常服务器性能越好,您可以设置的值越。如果PHP进程的执行时间超过了Nginx的等待时间,则您需要适当增加Nginx的/etc/nginx.conf 配置文件中 fastcgi_connect_timeout,fastcgi_send_timeout 和 fastcgi_read_timeout 参数的 timeout ...

NVMe协议介绍

机器学习 机器学习是另一个共享盘典型应用场景,在将样本标注写入后,会将数据拆分给多个节点进行神经网络的分布式计算,特别是在以GPU为计算资源的高性能机器学习场景,慢速存储很可能成为整个系统的瓶颈,此时利用NVMe共享云盘的高性能,...

测试SCC集群性能

超级计算集群SCC具有无虚拟化损耗、高带宽低延迟网络的优点,可以保证高性能计算和人工智能、机器学习等应用的高度并行需求。本文为您介绍如何创建SCC集群,并测试SCC集群的相关性能。背景信息 超级计算集群SCC(Super Computing Cluster)...

磁盘

磁盘即为云服务器 ECS 提供的数据块级别的块存储产品,具有低时延、高性能、持久性、高可靠等特点。磁盘类型 根据性能分类,磁盘分为以下几类:ESSD 云盘:基于新一代分布式块存储架构的超高性能云盘产品。更多详情,请参见 ESSD云盘。SSD ...

AI加速:使用EPL实现AI训练加速

您可以使用EPL实现低成本、高性能分布式模型训练。本文为您介绍如何在DLC中使用EPL高效地进行分布式TensorFlow训练。前提条件 在开始执行操作之前,请确认您已经完成以下准备工作:已为 DLC 服务关联角色授权,详情请参见 云产品依赖与授权...

应用场景

大规模分布式训练 高性能打造AI进化底座。超大规模GPU算力系统,全对等网络架构,全资源池化,可以搭配PAI(机器学习平台)使用,支持多种训练框架(Pytorch、TensorFlow、Caffe、Keras、Xgboost、Mxnet等),可以满足多种规模的AI训练和...

AI加速概述

EPL(大规模分布式训练框架)PAI-EPL是一款高效易用的分布式模型训练框架,可以实现低成本、高性能分布式模型训练。更多关于使用EPL实现训练加速的操作,请参见 AI加速:使用EPL实现AI训练加速。Rapidformer(Transformer训练加速)PAI-R...

创建RAID阵列(Linux)

(推荐)对文件系统的数据安全性和性能都有一定要求(数据安全性和性能适中)sudo mount/dev/md0/media/raid0 对文件系统的数据安全性要求较高(数据安全性较性能偏低)sudo mount-o rw,atime,sync,barrier,data=journal/dev/md0/media...

产品架构与功能特性

阿里云游戏平台利用阿里公共云能力优势,打造低延迟画质的PaaS平台,通过运营中心、内容中心、管控中心支持泛游戏客户的业务拓展。云游戏平台架构 阿里云游戏架构图如下图所示。阿里云游戏平台主要功能模块包括:管控中心:定位于游戏...

负载均衡调度算法介绍

缺点 服务器性能不能有较大差异:轮询算法无法区分服务器的实际负载情况,如果服务器性能不同,可能会导致某些服务器过载,而其他服务器处于空闲状态。连接可能被长时间占用:轮询算法无法考虑连接的持续时间,如果某些连接需要较长时间...

创建网络质量任务

自动:随机测试IPv4或者IPv6服务器性能。IPv4:指定测试IPv4服务器性能。IPv6:指定测试IPv6服务器性能。超时时间 任务执行的最长时间,默认为10000ms,超过该值将报超时相关错误。连接超时 默认为5000ms,即当该元素总下载时间超过5...

高性能

云数据库RDS提供高性能实例,包括参数优化、SQL优化建议等优点。参数优化 RDS的所有参数都经过阿里云数据库行业专家多年的生产实践和优化。在RDS实例的生命周期内,DBA持续对其进行优化,确保RDS实例一直基于最佳配置运行。SQL优化建议 ...

产品规格

为更好地匹配E-HPC的高性能计算特点,下文推荐了几种规格,建议您根据应用场景选择使用。关于ECS实例规格的更多信息,请参见 实例规格族 和 选型最佳实践。弹性裸金属服务器和超级计算集群(SCC)实例 如下实例无虚拟化损耗,同时提供VPC...

集群版-单副本

集群版-单副本采用代理(proxy)集群模式,数据分片为单节点架构,可为您提供高性能的存储服务。警告 单副本架构不能保障数据可用性和服务连续性,选用前请务必确认风险,不建议您在生产环境中使用该架构的实例。云数据库Redis版...

什么是GPU云服务器

其作为阿里云弹性计算家族的一员,结合了GPU计算力与CPU计算力,满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求,例如,在并行运算方面,使用GPU云服务器可显著提高计算效率。为什么选择GPU云服务器 阿里云GPU云服务器是...

创建和管理服务器

在使用 网络型负载均衡NLB(Network Load Balancer)服务前,您必须创建服务器组并至少添加一台后端服务器来接收 NLB 转发的客户端请求。默认情况下,NLB 使用您为服务器组指定的端口和协议将请求发送到对应的后端服务器。本文为您介绍如何...

管理服务器

服务器资产接入云安全中心后,您可以在主机资产的服务器页签下同步最新资产信息、查看服务器信息、对服务器进行分组管理、修改服务器的保护状态等。本文介绍如何进行服务器管理。操作演示视频 以下视频为您演示了使用云安全中心管理...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 云服务器 ECS Web应用防火墙 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用