部署GPU云服务器

请按照标签顺序依次点击 新建>新建空白应用,构建如下图所示的包含GPU云服务器实例的应用架构:本文所选地域为 华北2(北京)可用区H。双击GPU实例,配置相关参数。参考 创建GPU实例,选择对应的实例规格、镜像及版本。需要修改自定义登录...

API参考

如果您熟悉网络服务协议和一种以上编程语言,推荐您调用API管理您的上资源和开发自己的应用程序。GPU云服务器适用的API和云服务器ECS一致,详情请参见 ECS API简介 和 ECS API概览。

什么是神行工具包(DeepGPU)

神行工具包(DeepGPU)是阿里专门为GPU云服务器搭配的GPU计算服务增强工具集合,旨在帮助开发者在GPU云服务器上更快速地构建企业级服务能力。GPU云服务器搭配神行工具包(DeepGPU)中的组件可以帮助您更方便地利用阿里上GPU资源,...

异构计算产品最佳实践概览

GPU云服务器 搭建Linux环境License Server 使用GRID驱动必须申请相应的License,同时需要将License部署在License Server上,本教程以Ubuntu 18.04操作系统为例,介绍如何搭建Linux操作系统的License Server。搭建Windows环境的License ...

GPU云服务器常见问题

为了有效排查和解决GPU云服务器的相关问题,本文为您汇总了使用GPU时遇到的一些常见问题。类别 相关问题 功能问题 为什么Windows操作系统不支持DirectX等功能?GPU实例支持安卓模拟器吗?我能变更GPU实例的配置吗?按量付费GPU实例支持节省...

GPU云服务器计费

GPU云服务器计费相关功能与云服务器ECS一致,本文为您介绍GPU云服务器涉及的计费项、计费方式、续费和退费说明等。计费项及其计费方式 一台GPU实例包括计算资源(vCPU、内存和GPU)、镜像、块存储等资源,其中涉及计费的GPU资源如下表所示...

指定GPU规格创建实例

GPU对应的Docker镜像可以直接运行在ECI GPU实例上。实例内已预装NVIDIA显卡设备驱动,不同GPU规格支持安装的驱动和CUDA版本不同。规格类型 GPU规格族 驱动和CUDA版本 GPU虚拟化型实例规格族 sgn7i-vws NVIDIA 470.141.03,CUDA 11.4 vgn7i-...

产品优势

使用EAIS实例:您只需要购买如下计算资源:产品 实例规格 指标数据 云服务器ECS ecs.r6.6xlarge 24 vCPU 192 GiB 弹性计算加速实例EAIS eais.ei-a6.4xlarge 16 TFLOPS/FP32,32 GB/显存 综上所述,如果您购买GPU实例,则只能在已有的固定...

GPU集群中加速AI模型训练

本文适用于AI图片的训练场景,使用文件存储CPFS/NAS作为共享存储,使用容器服务Kubernetes版管理GPU云服务器集群实现AI图片的训练加速。方案优势 使用阿里的容器服务ACK可快速搭建AI图片训练基础环境。使用CPFS存储训练数据,支持多个...

重启实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍如何通过控制台重启实例。前提条件 待重启的实例必须处于 运行中 状态。背景信息 重启操作是维护云服务器的一种常用方式,如系统更新、重启保存相关配置等...

使用RAPIDS加速机器学习最佳实践

方案优势 阿里云GPU云服务器资源丰富,可灵活选择在GPU上搭建RAPIDS加速机器学习环境。使用容器服务Kubernetes版部署RAPIDS加速机器学习环境。共享存储NAS可提供强大的存储性能。部署架构图 选用的产品列表 产品名称 说明 GPU云服务器 该...

使用RAPIDS加速图像搜索最佳实践

方案优势 阿里云GPU云服务器资源丰富,可灵活选择在GPU上搭建RAPIDS加速图像搜索环境。使用容器服务Kubernetes版可快速部署图像搜索环境和分发应用。共享存储NAS可提供强大的存储性能。部署架构图 选用的产品列表 产品名称 说明 GPU云服务...

弹性加速计算实例FAQ

EAIS可以将CPU资源与GPU资源成功解耦,帮助您将GPU资源附加到ECS实例上,构建成您希望得到的GPU实例规格,用于推理场景下的弹性使用,从而提高资源利用率,降低成本。更多信息,请参见 什么是弹性加速计算实例EAIS。EAIS与常规GPU实例有...

卸载GRID驱动

警告 GPU实例必须配备了相关驱动才可以正常使用,如果您因某种原因需要卸载当前驱动,请务必再安装与您实例规格及操作系统相匹配的正确驱动,否则会因GPU实例与安装的驱动不匹配而造成业务无法正常进行的风险。在Windows操作系统中卸载GRID...

什么是弹性加速计算实例EAIS

EAIS可以将CPU资源与GPU资源成功解耦,帮助您将GPU资源附加到ECS实例上,构建成您希望得到的GPU实例规格,用于推理场景下的弹性使用,从而提高资源利用率,降低成本。为什么选择EAIS 选择EAIS,您可以轻松构建具有以下优势的异构计算资源:...

安装CUDA

如果您想要在GPU云服务器上进行GPU加速计算任务(例如科学计算或大规模并行计算等),则需要安装CUDA开发运行环境。CUDA提供了一整套工具和库,可以帮助您进行GPU加速的程序开发,以充分发挥NVIDIA GPU的计算潜力,提高计算性能和加速运行...

应用场景

云服务器ECS具有广泛的应用场景,既可以作为Web服务器或者应用服务器单独使用,又可以与其他阿里云服务集成提供丰富的解决方案。说明 云服务器ECS的典型应用场景包括但不限于本文描述,您可以在使用云服务器ECS的同时发现计算带来的技术...

GPU自助诊断

前提条件 已创建GPU实例且该实例处于 运行中 状态。具体操作,请参见 创建GPU实例。操作步骤 登录 ECS管理控制台。在左侧导航栏,单击 自助问题排查。在顶部菜单栏左上角处,选择地域。在 实例问题排查 页签下,选择问题排查类型、检查项、...

GPU实例(计算型和虚拟化型)中安装GRID驱动...

说明 创建GPU实例时会默认预装助手插件,如果使用助手方式自动安装GRID驱动,建议您提前了解助手相关内容。具体信息,请参见 助手概述。适用实例 仅以下Windows系统GPU实例规格族支持通过助手安装GRID驱动:Windows系统GPU虚拟化...

准实时推理场景

与函数计算同等GPU规格的GPU云服务器单价约为 14元/小时。更多计费详情,请参见 GPU云服务器计费。示例一 假设您的GPU函数一天调用量为3600次,每次为1秒钟,使用4 GB显存规格的GPU实例(模型大小为3 GB左右)。您的日均资源利用率(仅时间...

准实时推理场景

GPU物理卡的使用上限 默认情况下,无论Tesla系列T4卡型、还是Ampere系列A10卡型的GPU实例,单个阿里账号地域级别的GPU物理卡上限为10卡。如您有更高的物理卡需求,请加入钉钉用户群(钉钉群号:11721331)申请。GPU函数默认情况下地域...

启动实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍如何在ECS管理控制台上启动实例。前提条件 实例满足以下条件之一:实例处于 已停止 状态。按量付费实例处于 已过期 状态,您已经结清欠费账单但自动重开机...

GPU实例上使用RAPIDS加速机器学习任务

RAPIDS预装镜像已经发布到阿里镜像市场,创建GPU实例时,您可以在镜像市场中搜索 NVIDIA RAPIDS 并使用RAPIDS预装镜像。说明 该RAPIDS预装镜像使用Ubuntu 16.04 64-bit操作系统。NGC(全称NVIDIA GPU CLOUD)是NVIDIA推出的一套深度学习...

安装并使用Deepnccl

前提条件 已创建阿里云GPU实例,且GPU实例的操作系统为Ubuntu或CentOS。安装Deepnccl 根据GPU实例的不同操作系统,安装Deepnccl有所不同,具体操作如下所示:说明 安装Deepnccl时,系统会自动同时安装aiacc-nccl-plugin,确保了Deepnccl的...

GPUConfig

名称 类型 描述 示例值 object 函数 GPU 配置信息。gpuMemorySize integer GPU 显存规格,单位为 MB,为 1024MB ...fc.gpu.tesla.1 表示 GPU 实例 Tesla 系列 T4 卡型。fc.gpu.ampere.1 表示 GPU 实例 Ampere 系列 A10 卡型。fc.gpu.ampere.1

人工智能最佳实践

函数计算 的GPU实例将这些问题从用户侧转移至厂商侧,让您无需关心底层GPU基础设施,完全聚焦于业务本身,极大地简化了业务的实现路径。在不同的应用场景下,函数计算 提供的GPU实例与CPU相比所具备的优势如下。成本优先的AI应用场景 ...

连接方式概述

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的连接方式。ECS支持通过多种方式连接实例,包括阿里提供的连接工具(例如Workbench、VNC等)和第三方客户端工具。您可以综合考虑目标实例的操作系统、本地设备的操作系统、...

使用ACK服务实现GPU的成本优化

GPU云服务器 该服务提供了GPU算力的弹性计算服务,具有超强的计算能力,可有效缓解计算压力,提升您的业务效率,帮助您提高企业竞争力。容器服务ACK 该服务提供了高性能且可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理...

使用限制

GPU卡数限制 资源项 资源上限 是否支持调整 在单地域的GPU物理卡卡数 说明 GPU实例包括Tesla系列T4卡型的GPU实例和Ampere系列A10卡型的GPU实例。30卡 支持 GPU实例规格与实例并发度的关系 Tesla系列T4卡型,2 GB显存 当GPU函数实例并发度为...

常用操作导航

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的操作方式。在使用云服务器ECS时,您可能会遇到各种问题,例如远程连接、更换操作系统、扩容盘、升高或降低实例配置、使用快照或镜像等。本文介绍了云服务器ECS的常用操作,...

GPU实例FAQ

本文介绍使用GPU实例过程中可能遇到的问题,并提供对应的解决方案。函数计算GPU实例的驱动版本是什么?函数计算GPU实例的CUDA版本是什么?构建镜像时报错CUDA GPG Error如何解决?为什么我的GPU实例规格显示的是g1?为什么我的预留GPU实例...

指定ECS规格创建实例

创建GPU实例 创建GPU实例时,在指定GPU规格的基础上,容器内还需要指定GPU个数。重要 如果实例指定使用GPU规格,但容器内没有指定GPU个数,则实例启动会报错。默认情况下,多个容器可以共享使用GPU,配置时需确保单个容器内配置的GPU个数不...

停止实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍停止ECS实例,以及VPC内实例节省停机模式相关操作。前提条件 实例必须处于 运行中 状态。警告 停止实例会中断您的业务,请谨慎执行。停止包年包月实例 说明...

实例类型及使用模式

函数计算 的弹性实例和GPU实例均支持按量模式和预留模式。按量模式根据请求时长计费,可以结合并发度设置提高实例的资源利用率。预留模式则是从实例启动完成开始计费,到实例释放为止,可用于解决冷启动问题。本文为您介绍两类实例的实例...

实例类型及使用模式

函数计算 的弹性实例和GPU实例均支持按量模式和预留模式。按量模式根据请求时长计费,可以结合并发度设置提高实例的资源利用率。预留模式则是从实例启动完成开始计费,到实例释放为止,可用于解决冷启动问题。本文为您介绍两类实例的实例...

GPU实例FAQ

本文介绍使用GPU实例过程中可能遇到的问题,并提供对应的解决方案。函数计算GPU实例的驱动版本是什么?函数计算GPU实例的CUDA版本是什么?构建镜像时报错CUDA GPG Error如何解决?为什么我的GPU实例规格显示的是g1?为什么我的预留GPU实例...

GPU实例上部署NGC环境

本文以搭建TensorFlow深度学习框架为例,为您介绍如何在GPU实例上部署NGC环境。背景信息 NGC作为一套深度学习生态系统,阿里在镜像市场提供了针对NVIDIA Pascal GPU优化的NGC容器镜像。通过部署镜像市场的NGC容器镜像,您能简单快速地...

GPU虚拟化型实例中安装GRID驱动(Linux)

创建GPU实例时系统会默认预装助手插件。操作步骤 本文仅适用于Linux系统GPU虚拟化型实例 vgn6i-vws、vgn7i-vws、sgn7i-vws,更多信息,请参见 GPU虚拟化型。重要 Linux系统GPU计算型实例(例如gn7i、gn6i、ebmgn7i、ebmgn6i等)无需安装...

ACK支持的GPU机型

支持的GPU实例类型 ECS规格族 该规格支持的GPU型号 GPU计算型gn4 NVIDIA M40 GPU计算型gn5i NVIDIA P4 GPU计算型gn5 NVIDIA P100 GPU计算型gn6e NVIDIA V100 GPU计算型gn6i NVIDIA T4 GPU计算型gn6v NVIDIA V100 GPU计算型gn7i NVIDIA A10 ...

在Knative中使用GPU

ECI支持指定ECS GPU规格来创建GPU实例。GPU对应的Docker镜像可以直接运行在ECI GPU实例上,无需安装Tensorflow、CUDA Toolkit等软件。本文介绍如何在Knative中创建并使用ECI GPU实例。前提条件 创建ACK Serverless集群 部署Knative 在...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
GPU云服务器 弹性容器实例 弹性伸缩 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用