启动方式与环境变量说明

在imagenet训练中使用MomentumSGD(训练优化)时,建议设置为0.9。PERSEUS_NCCL_ENABLE(特殊版本)0:关闭NCCL混合链路支持。1:启用NCCL混合链路支持。默认值为0。当使用SCC机型时,可以启用此feature,在训练时同时使用RDMA链路与VPC...

安装和使用AIACC-AGSpeed

AIACC-AGSpeed(简称AGSpeed)专注于优化PyTorch深度学习模型在阿里云GPU异构计算实例上的计算性能,相比原始的神龙AI加速引擎AIACC,可以实现无感的计算优化性能。本文为您介绍安装和使用AGSpeed的方法。前提条件 已创建阿里云GPU实例,且...

安装和使用Deepytorch Inference

Deepytorch Inference是阿里自研的AI推理加速,针对Torch模型,可提供显著的推理加速能力。本文主要介绍安装并使用Deepytorch Inference的操作方法,以及推理效果展示。背景信息 Deepytorch Inference通过调用 deepytorch_inference....

新功能发布记录

2022-07-12 部分 导入自定义镜像 镜像检测概述 通过阿里客户端连接实例 阿里客户端是由阿里官方推出的客户端工具,提供了对云服务器ECS、弹性容器实例ECI、轻量应用服务器、阿里托管实例的资源浏览、查找、远程连接等功能。...

弹性裸金属服务器概述

本地SSD型弹性裸金属服务器实例规格族ebmi2g GPU计算型:GPU计算型弹性裸金属服务器实例规格族ebmgn7ex GPU计算型弹性裸金属服务器实例规格族ebmgn7e GPU计算型弹性裸金属服务器实例规格族ebmgn7ix GPU计算型弹性裸金属服务器实例规格族...

ACK支持的GPU机型

GPU计算型gn4 NVIDIA M40 GPU计算型gn5i NVIDIA P4 GPU计算型gn5 NVIDIA P100 GPU计算型gn6e NVIDIA V100 GPU计算型gn6i NVIDIA T4 GPU计算型gn6v NVIDIA V100 GPU计算型gn7i NVIDIA A10 GPU计算型gn7s NVIDIA A30 GPU计算型弹性裸金属...

如何选用云服务器

在阿里电子政务上,云服务器有很多不同的规格型号,例如都是4核8G内存的云服务器,在不同应用场景下的性能跑分不同,价格也不同。本文为您介绍阿里云服务的常见参数类别,帮助您根据不同的业务需求选择合适的云服务。云服务器参数...

镜像商品的版本管理

可以不做设置,不设置代表该镜像运行可以支持1核及以上GPU云服务器 内存配置 不做设置 0.5 GiB – 1024 GiB 可以不做设置,不设置代表该镜像部署和运行可以支持0.5GiB及以上内存的云服务器 VPC专有网络是否支持多网卡 支持 支持和不支持...

什么是AI通信加速库DeepNCCL

DeepNCCL是为阿里神龙异构产品开发的一种用于多GPU互联的AI通信...相关文档 针对分布式训练或者多卡推理中的AI通信场景,在不同的GPU云服务器上安装DeepNCCL通信库,可以加速分布式训练或推理性能。具体操作,请参见 安装并使用Deepnccl。

常用操作导航

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的操作方式。在使用云服务器ECS时,您可能会遇到各种问题,例如远程连接、更换操作系统、扩容盘、升高或降低实例配置、使用快照或镜像等。本文介绍了云服务器ECS的常用操作,...

连接方式概述

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的连接方式。ECS支持通过多种方式连接实例,包括阿里提供的连接工具(例如Workbench、VNC等)和第三方客户端工具。您可以综合考虑目标实例的操作系统、本地设备的操作系统、...

使用限制

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的使用限制。本文介绍云服务器ECS在产品功能和服务性能上的不同限制,以及如何申请更高配额。限制概述 使用云服务器ECS有下列限制:仅弹性裸金属服务器和超级计算集群支持二次...

超级计算集群概述

SCC与阿里ECS、GPU云服务器等计算类产品一起,为 阿里弹性高性能计算平台E-HPC 提供了极高性能的并行计算资源,实现真正的上超算。机型对比 SCC与物理机、虚拟机的对比如下表所示。其中,Y表示支持,N表示不支持,N/A表示无数据。...

Serverless GPU概述

Serverless GPU是一种新兴的计算GPU服务,它采用了服务器无感知计算的理念,通过提供一种按需分配的GPU计算资源,有效地解决原有GPU长驻使用方式导致的低资源利用率、高使用成本和低弹性能力等痛点问题。本文介绍Serverless GPU的详细...

Serverless GPU概述

Serverless GPU是一种新兴的计算GPU服务,它采用了服务器无感知计算的理念,通过提供一种按需分配的GPU计算资源,有效地解决原有GPU长驻使用方式导致的低资源利用率、高使用成本和低弹性能力等痛点问题。本文介绍Serverless GPU的详细...

安装并使用DeepGPU-LLM

在处理大语言模型任务中,您可以根据实际业务部署情况,选择在不同环境(例如GPU云服务器环境或Docker环境)下安装推理引擎DeepGPU-LLM,然后通过使用DeepGPU-LLM工具实现大语言模型(例如Llama模型、ChatGLM模型、百川Baichuan模型或通义...

ECS选型最佳实践

本文主要介绍如何结合实际业务场景选购阿里云云服务器ECS。重要 本文主要介绍如何选择企业级实例规格族,不包括入门级(共享型)规格族。有关入门级实例选型,请参见 共享型 或 突发性能实例概述。了解实例规格族 实例规格清单:实例规格族...

使用限制

云服务器ECS在产品功能和服务性能上可能存在一些限制,建议您在实际使用之前了解相应的限制,提前规划并申请适合您需求的更高配额,以确保云服务器ECS能够满足您的业务需求。本文介绍云服务器ECS在产品功能和服务性能上存在的限制以及如何...

使用限制

限制概述 使用云服务器ECS有下列限制:仅弹性裸金属服务器和超级计算集群支持二次虚拟化,其他规格族不支持安装虚拟化软件和二次虚拟化。不支持声卡应用。不支持直接加载外接硬件设备(如硬件加密狗、U盘、外接硬盘、银行UKey等),您可以...

服务器迁移中心

服务器迁移中心(Server Migration Center,简称SMC)是阿里提供给您的迁移平台。专注于提供能力普惠、体验一致、效率至上的迁移服务,满足您在阿里的迁移需求。

轻量应用服务器

轻量应用服务器是面向单机应用场景的新一代计算服务,提供精品应用一键部署,支持一站式的域名、网站、安全、运维、应用管理等服务,极大优化搭建简单应用的体验,降低了入门级用户使用计算产品的门槛。

云服务器 ECS

云服务器ECS(Elastic Compute Service)是阿里提供的性能卓越、稳定可靠、弹性扩展的IaaS(Infrastructure as a Service)级别计算服务。云服务器ECS免去了您采购IT硬件的前期准备,让您像使用水、电、天然气等公共资源一样便捷、高效...

GPU自助诊断

ECS管理控制台支持配置 GPU设备健康检查 功能,通过该功能可以对当前实例的GPU卡状态或驱动状态进行全方位诊断,方便您自行诊断当前实例的GPU卡或驱动是否存在异常,帮助您及时发现和解决存在的常见问题。前提条件 已创建GPU实例且该实例...

什么是GPU容器共享技术cGPU

GPU容器共享技术cGPU是阿里基于内核虚拟GPU隔离的容器共享技术。即多个容器共享一张GPU卡,从而实现业务的安全隔离,提高GPU硬件资源的利用率并降低使用成本。为什么选择cGPU 兼容性好 不仅适配标准的Docker和Containerd工作方式,而且还...

支持的云服务

什么是弹性伸缩ESS 助手 助手是专为云服务器ECS打造的原生自动化运维工具,通过免密码、免登录、无需使用跳板机的形式,在ECS实例上实现批量运维、执行命令(Shell、PowerShell和Bat等)和发送文件等操作。典型的使用场景包括:安装卸...

常见问题

阿里云云安全中心结合阿里云云计算平台强大的数据分析能力,为您提供一站式安全服务,例如安全漏洞检测、网页木马检测、面向云服务器用户提供的主机入侵检测和防御DDoS流量攻击等。更多安全服务,请查看 安全产品 页面。如何检测服务器是否...

功能特性

使用自定义镜像创建服务器 在ECS控制台复制轻量应用服务器共享的镜像 阿里建议您在轻量应用服务器的自定义镜像被共享到云服务器ECS后,先通过ECS管理控制台复制镜像,将镜像保存至云服务器ECS,再通过复制的自定义镜像创建ECS实例或更换...

访问ECS实例异常时的问题排查和指引

ECS云服务器访问异常问题排查流程图 对于ECS访问异常问题,基本排查思路如下ECS服务器访问异常问题排查流程图所示。ECS访问异常问题排查思路及处理办法 对于ECS访问异常问题,排查思路分为如下两个方面:通过私网访问异常时排查思路 如果...

查看服务器信息

关联产品 在该区域,系统会显示 虚拟主机、云服务器ECS和无影电脑的相关信息,单击对应服务名称,可以跳转到对应服务的官网页面。示例:查询流量使用情况 重要 对于每月无固定流量的套餐,不显示流量使用情况。更多信息,请参见 套餐...

新手指引

轻量应用服务器是一款可快速搭建且易于管理的轻量级云服务器,面向单台服务器提供了一键部署应用、一站式域名解析、安全管理以及运维监控等服务。本文介绍了轻量应用服务器的基础知识、快速使用流程、控制台的使用指引、计费方式、以及新手...

GPU实例上部署NGC环境

NGC(NVIDIA GPU CLOUD)是NVIDIA开发的一套深度学习生态系统,方便您免费访问深度学习软件堆栈,建立适合深度学习的开发环境。本文以搭建TensorFlow深度学习框架为例,为您介绍如何在GPU实例上部署NGC环境。背景信息 NGC作为一套深度学习...

最佳实践概览

源服务器迁移至轻量应用服务器 服务器迁移中心支持将其他厂商轻量服务器(腾讯轻量应用服务器、AWS Lightsail Instance和华为云云耀云服务器)迁移至阿里轻量应用服务器。高可用架构 轻量应用负载均衡可以将公网访问的流量分发到后端的...

远程连接Linux服务器

您可以通过轻量应用服务器管理控制台或者第三方客户端工具远程连接Linux服务器。本文主要介绍如何远程连接Linux服务器。前提条件 待连接的Linux轻量应用服务器的状态为 运行中。如果您需要使用密码的方式远程连接服务器,确保已设置服务器...

支持资源组的云服务

云服务 云服务代码 控制台 API 资源类型 资源元数据 相关文档 云服务器ECS、FPGA云服务器、GPU云服务器、块存储 ecs 是 是 ddh:DDH 资源ID、资源名称、标签 云服务转组API:JoinResourceGroup 统一转组API:MoveResources 控制台:资源组 ...

远程连接FAQ

排查思路 如果无法远程连接轻量应用服务器时,阿里推荐您按照以下思路排查问题。以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低频率原因排查,从而帮助您快速找到问题的原因。如果解决完某个可能原因仍未解决问题,请...

卸载GRID驱动

警告 GPU实例必须配备了相关驱动才可以正常使用,如果您因某种原因需要卸载当前驱动,请务必再安装与您实例规格及操作系统相匹配的正确驱动,否则会因GPU实例与安装的驱动不匹配而造成业务无法正常进行的风险。在Windows操作系统中卸载GRID...

轻量应用服务器之间的数据迁移

迁移场景 源服务器配置说明 目标服务器配置说明 同地域迁移轻量应用服务器 服务器名称:轻量应用服务器A 地域:华北2(北京)镜像:LAMP 7.4应用镜像 防火墙:已放行80、443、22端口 应用程序:默认已在轻量应用服务器A的网站根目录/data/...

创建轻量应用服务器

重要 当您参考云服务器ECS的建站教程在轻量应用服务器上手动建站时,建议您选择手动搭建网站或应用的教程,并且教程中所选用的操作系统版本信息需要和轻量应用服务器的系统镜像版本信息一致。否则可能因为版本不兼容等原因导致运行命令报错...

远程连接Windows服务器

您可以通过轻量应用服务器管理控制台或本地Windows系统自带的远程桌面连接工具连接Windows轻量应用服务器,本文为您提供具体的操作指引。前提条件 待连接的Windows服务器的状态为 运行中。已设置服务器密码。具体操作,请参见 设置或重置...

【公告】GRID驱动变更通知

尊敬的阿里用户,NVIDIA将于2023年7月31日后不再对FLS GRID License提供技术支持,且阿里采购的FLS GRID License也将于2023年9月底到期,为了您的业务不受GRID驱动变更影响,建议您尽快将目前使用的GPU图形加速驱动(采用FLS GRID ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
GPU云服务器 云服务器 ECS 轻量应用服务器 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用