API参考

如果您熟悉网络服务协议和一种以上编程语言,推荐您调用API管理您的上资源和开发自己的应用程序。GPU云服务器适用的API和云服务器ECS一致,详情请参见 ECS API简介 和 ECS API概览。

什么是GPU云服务器

其作为阿里弹性计算家族的一员,结合了GPU计算力与CPU计算力,满足您在人工智能、高性能计算、专业图形图像处理等场景中的需求,例如,在并行运算方面,使用GPU云服务器可显著提高计算效率。为什么选择GPU云服务器 阿里GPU云服务器是...

云速搭部署GPU云服务器

通过云速搭实现GPU云服务器的部署,这里使用 ECS 的 UserData 特性自动安装GPU 驱动、AIACC 等组件,减少配置工作量。涉及产品 专有网络VPC GPU云服务器 弹性公网IP 云速搭CADT 方案架构 操作步骤 具体操作步骤请参考《云速搭部署 GPU ...

应用场景

推荐搭配使用云服务器 ECS/GPU 服务器 EGS/高性能计算服务(Alibaba Cloud HPC)+容器服务+对象存储 OSS/文件存储 NAS/CPFS 相关文档:PyTorch分布式训练 TensorFlow分布式训练 微服务架构 实现敏捷开发和部署落地,加速企业业务迭代...

阿里异构计算产品总览

GPU云服务器 GPU云服务器是基于GPU应用的计算服务器GPU在执行复杂的数学和几何计算方面有着独特的优势。特别是浮点运算、并行运算等方面,GPU可以提供上百倍于CPU的计算能力。作为阿里弹性计算家族的一员,GPU云服务器结合了GPU计算力...

镜像使用说明

您可以快速开始使用GPU进行高性能计算。这些官方基础镜像已经预先配置好了相应的环境和依赖,可以直接使用,省去繁琐的安装和配置过程。您可以在构建业务逻辑时使用这些镜像,以此提高应用的性能和可靠性。以下是 函数计算 GPU提供的基础...

镜像使用说明

您可以快速开始使用GPU进行高性能计算。这些官方基础镜像已经预先配置好了相应的环境和依赖,可以直接使用,省去繁琐的安装和配置过程。您可以在构建业务逻辑时使用这些镜像,以此提高应用的性能和可靠性。以下是 函数计算 GPU提供的基础...

云服务使用限制索引

弹性计算 云服务 使用限制 云服务器ECS 使用限制 弹性裸金属服务器 使用限制 FPGA云服务器 使用限制 GPU云服务器 使用限制 存储容量单位包 使用限制 块存储 使用限制 轻量应用服务器 使用限制 专有宿主机 使用限制 批量计算 使用限制 容器...

应用场景

GPU云服务器适用于视频转码、图片渲染、AI训练、AI推理、云端图形工作站等场景,神行工具包(DeepGPU)为了配合GPU云服务器的计算服务增强能力,也适用于所有AI训练场景和AI推理场景。本文主要介绍GPU云服务器和神行工具包(DeepGPU)的...

按量付费

计费单价 函数调用次数计费示例 资源使用计费 GPU使用量 根据您给函数配置的GPU规格收费,GPU使用量按阶梯累计模式计费。说明 GPU实例的活跃状态和闲置状态计费方式不同,具体见 计费单价。计费单价 GPU使用计费示例 vCPU使用量 根据您给...

GPU监控

监控通过安装在阿里主机(ECS实例)上的监控插件,采集GPU的监控数据,您还可以为这些监控项设置报警规则。当某个监控项达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提条件 请确保您已在云服务器ECS上创建GPU计算...

计费概述

函数计算 提供了试用额度、按量付费和资源包三种计费...使用GPU实例运行的过程中,会涉及到哪些计费项?资源包是否支持跨地域抵扣?账号欠费了不想继续使用这个产品,如何退订服务?如何补交费用?产品发送的短信、邮件等消息是否支持退订?

计费概述

函数计算 提供了试用额度、按量付费和资源包三种计费...使用GPU实例运行的过程中,会涉及到哪些计费项?资源包是否支持跨地域抵扣?账号欠费了不想继续使用这个产品,如何退订服务?如何补交费用?产品发送的短信、邮件等消息是否支持退订?

什么是神行工具包(DeepGPU)

神行工具包(DeepGPU)是阿里专门为GPU云服务器搭配的GPU计算服务增强工具集合,旨在帮助开发者在GPU云服务器上更快速地构建企业级服务能力。GPU云服务器搭配神行工具包(DeepGPU)中的组件可以帮助您更方便地利用阿里上GPU资源,...

GPU集群中加速AI模型训练

本文适用于AI图片的训练场景,使用文件存储CPFS/NAS作为共享存储,使用容器服务Kubernetes版管理GPU云服务器集群实现AI图片的训练加速。方案优势 使用阿里的容器服务ACK可快速搭建AI图片训练基础环境。使用CPFS存储训练数据,支持多个...

通过Prometheus监控GPU实例

相关文档 在使用GPU来做高性能计算时,为了节约成本,您往往需要根据GPU指标(利用率、显存等)来做弹性伸缩。ECI GPU实例支持复用ACK中基于GPU指标的HPA组件,以实现弹性伸缩。具体操作,请参见 基于GPU指标实现弹性伸缩。

手动扩容集群

弹性RDMA接口 打开弹性RDMA开关后,计算节点会绑定弹性RDMA网卡,可以使用高性能RDMA网络服务。更多信息,请参见 eRDMA概述。主机名前缀、主机名后缀 根据业务需求设置节点主机名称的前缀和后缀。扩容多个节点时,设置主机名前缀和后缀可以...

快速搭建AI对话机器人

本文介绍如何使用阿里云GPU云服务器,基于ChatGLM-6B语言模型快速搭建AI对话机器人。背景信息 ChatGLM-6B是一个开源的、支持中英双语对话的语言模型,它基于General Language Model(GLM)架构,具有62亿参数;并使用了和ChatGPT相似的技术...

入门概述

本文介绍E-HPC的使用流程,帮助您快速上手使用弹性高性能计算。下文以创建集群,在集群中安装GROMACS软件并运行水分子算例进行高性能计算为例,介绍弹性高性能计算的使用流程,帮助您快速上手使用弹性高性能计算。使用流程如下图所示。创建...

GPU云服务器计费

计费常见问题 如果您在购买或使用GPU云服务器过程中遇到某些计费相关问题,请参见 计费FAQ 或 提交工单 获取帮助。说明 如果您想了解云服务器ECS的成本构成、成本优势以及成本优化建议方案,更多信息,请参见 成本优化最佳实践。

产品优势

超强计算能力 阿里云GPU云服务器配备业界超强算力的GPU计算卡,结合高性能CPU平台,单实例可提供高达1000 TFLOPS的混合精度计算性能。网络性能出色 阿里云GPU云服务器实例的VPC网络最大支持450万的PPS及32 Gbit/s的内网带宽。在此基础上,...

使用RAPIDS加速机器学习最佳实践

方案优势 阿里云GPU云服务器资源丰富,可灵活选择在GPU上搭建RAPIDS加速机器学习环境。使用容器服务Kubernetes版部署RAPIDS加速机器学习环境。共享存储NAS可提供强大的存储性能。部署架构图 选用的产品列表 产品名称 说明 GPU云服务器 该...

使用限制

产品功能 单个地域下,弹性高性能计算相关功能限制如下所示。限制项 配额值 提升配额方式 集群总数 3 提交工单。一个集群节点总数 500 提交工单。一次最多扩容的节点数 99 无 一个节点系统盘大小 500 GiB 提交工单。单个文件系统可以挂载...

重启实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍如何通过控制台重启实例。前提条件 待重启的实例必须处于 运行中 状态。背景信息 重启操作是维护云服务器的一种常用方式,如系统更新、重启保存相关配置等...

基本概念

本文汇总使用GPU云服务器过程中涉及的基本概念,方便您查询和了解相关概念。GPU云服务器相关概念 概念 说明 GPU 图形处理器(Graphics Processing Unit)。相比CPU具有众多计算单元和更多的流水线,适合用于大规模并行计算等场景。CUDA ...

使用RAPIDS加速图像搜索最佳实践

方案优势 阿里云GPU云服务器资源丰富,可灵活选择在GPU上搭建RAPIDS加速图像搜索环境。使用容器服务Kubernetes版可快速部署图像搜索环境和分发应用。共享存储NAS可提供强大的存储性能。部署架构图 选用的产品列表 产品名称 说明 GPU云服务...

使用ACK服务实现GPU的成本优化

GPU云服务器 该服务提供了GPU算力的弹性计算服务,具有超强的计算能力,可有效缓解计算压力,提升您的业务效率,帮助您提高企业竞争力。容器服务ACK 该服务提供了高性能且可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理...

按量付费

计费单价 磁盘使用计费示例 GPU使用量 根据您给函数配置的GPU规格收费,GPU使用量按阶梯累计模式计费。说明 GPU实例的活跃状态和闲置状态计费方式不同,具体见 计费单价。计费单价 GPU使用计费示例 公网出流量计费 公网出流量 根据使用...

GPU监控

监控通过安装在阿里主机(ECS实例)上的监控插件,采集GPU的监控数据,您还可以为这些监控项设置报警规则。当某个监控项达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提条件 请确保您已在云服务器ECS上创建GPU计算...

神行工具包(DeepGPU)计费

使用神行工具包(DeepGPU)本身不需要额外支付费用,您只需要为执行计算任务过程中使用的阿里资源(例如云服务器ECS或文件存储NAS)进行付费。神行工具包中的组件主要包括 AI训练加速器Deepytorch Training、AI推理加速器Deepytorch ...

异构计算产品最佳实践概览

神龙AI加速引擎AIACC 使用AIACC-Training(AIACC训练加速)加速BERT Finetune模型 适用于自然语言训练场景,使用GPU云服务器和极速型NAS进行BERT Finetune模型训练,使用AIACC-Training(AIACC训练加速)可以有效提升多机多卡的训练效率。...

应用场景

云服务器ECS具有广泛的应用场景,既可以作为Web服务器或者应用服务器单独使用,又可以与其他阿里云服务集成提供丰富的解决方案。说明 云服务器ECS的典型应用场景包括但不限于本文描述,您可以在使用云服务器ECS的同时发现计算带来的技术...

服务条款

请参见 弹性高性能计算(E-HPC)服务协议。

服务等级协议

请参见 弹性高性能计算服务等级协议。

GPU调度概述

本文介绍调度GPU资源的不同方法,包括使用Kubernetes默认GPU调度...关于如何使用GPU拓扑感知调度,请参见以下文档:GPU拓扑感知调度概述 安装GPU拓扑感知组件 Tensorflow分布式训练使用GPU拓扑感知调度 Pytorch分布式训练使用GPU拓扑感知调度

管理内网互通

轻量应用服务器使用阿里自动分配的专有网络VPC(Virtual Private Cloud)进行网络隔离,默认情况下不与云服务器ECS、数据库等其他处于专有网络VPC中的阿里产品内网互通,您可以通过设置内网互通实现互联互通。本文介绍如何设置内网...

使用AIACC-Training(AIACC训练加速)加速BERT Fine...

本文适用于自然语言训练场景,例如,通过使用GPU云服务器和极速型NAS训练BERT Finetune模型,同时使用AIACC-Training(AIACC训练加速)进行该模型的训练加速,可有效加快多机多卡的训练速度,提升模型的训练效率和性能。说明 BERT...

云服务器ECS对比

如果您需要使用更丰富的实例类型,如通用型、计算型、大数据型、弹性裸金属服务器GPU/FPGA/NPU异构计算型等,支持并发网站、视频编解码、大型游戏、复杂分布式集群应用等业务场景,请使用云服务器ECS产品。关于云服务器ECS的更多实例...

功能发布记录

2019-03-19 全部 实例规格族 2018年9月 功能名称 功能描述 发布时间 发布地域 相关文档 实例规格族 最新一代GPU云主机gn6v(V100机型)正式售卖。2018-09-12 全部 实例规格族 2018年3月 功能名称 功能描述 发布时间 发布地域 相关文档 GPU...

账单查询

查询时,筛选产品为 弹性高性能计算 可以查看E-HPC服务费的账单,您也可以筛选产品查询集群内资源的账单,例如如果想要查看集群节点资源费用,可以筛选产品为 云服务器 ECS。查询示例如下:说明 单击账单右上角的 定制列,可以选择您希望...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
GPU云服务器 轻量应用服务器 云服务器 ECS Web应用防火墙 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用