2021年功能发布记录

配置权限助手 权限策略及示例 2021年10月 功能名称 变更类型 功能描述 相关文档 GPU实例(公测中)新增 基于Turing架构的GPU实例,主要适用于音视频、AI人工智能和图像处理等场景。在不同的场景中,将不同的业务负载下沉至GPU硬件加速,...

基于异步任务调用GPU函数

2021年云栖大会,阿里 函数计算 正式推出基于Turing架构的GPU实例,使得Serverless开发者可以将AI训练与推理的业务负载下沉到GPU硬件加速,从而加快模型训练、推理服务的效率。异步任务 函数计算 提供异步任务的分发、执行和观测的全栈...

2021年功能发布记录

配置权限助手 权限策略及示例 2021年10月 功能名称 变更类型 功能描述 相关文档 GPU实例(公测中)新增 基于Turing架构的GPU实例,主要适用于音视频、AI人工智能和图像处理等场景。在不同的场景中,将不同的业务负载下沉至GPU硬件加速,...

验证环境 IAAS 资源配置说明

cpu:required:4 memory:required:8 instanceType:ecs.gn5i-c4g1.xlarge/指定 GPU 实例规格,CPU/Memory 值需和该实例规格对应的机器配置对齐 gpu:/GPU 相关配置 driver:/GPU 驱动配置 CUDAVersion:10.1.168 driverVersion:450.80.02 ...

发现和排查实例问题

GPU实例的显存使用情况。利用报警服务自动通知 使用监控的报警服务,您可以针对关注的事件或者实例运行指标设置报警规则,在发生指定事件或实例运行指标出现异常时,自动以邮件等方式通知到联系人,减轻人工运维压力。更多信息,请参见 ...

通过指定ECS规格创建ECI Pod

GPU对应的Docker镜像可以直接运行在ECI GPU实例上。实例内已预装NVIDIA显卡设备驱动,不同GPU规格支持安装的驱动和CUDA版本不同。规格类型 GPU规格族 驱动和CUDA版本 GPU虚拟化型实例规格族 sgn7i-vws NVIDIA 470.141.03,CUDA 11.4 vgn7i-...

基于eRDMA增强型实例部署AI训练集群

方式1 通过ECS实例启动AI训练 搭建GPU环境 GPU云服务器提供GPU加速计算能力,实现GPU计算资源的即开即用和弹性伸缩。更多信息,请参见 什么是GPU云服务器。在 步骤一:创建eRDMA实例 时,配置镜像时需按以下步骤配置:选择所需的操作系统及...

Python SDK使用说明

您可以使用命令行 fastgpu querygpu 查询GPU实例规格,更多信息,请参见 GPU实例规格族。指定实例类型为单卡V100机型,即 instance_type="ecs.gn6v-c8g1.2xlarge。num_tasks 否 创建实例的数量。默认值:1。指定创建一个实例,即 num_tasks...

基于函数计算低成本部署Google Gemma模型服务

您可以使用函数计算的GPU实例以及函数计算的闲置模式低成本快速部署Gemma模型服务。GPU闲置计费公测资格申请 Serverless GPU闲置计费当前为邀测功能,如需体验,请 提交公测申请 或 联系我们。前提条件 已开通函数计算服务,详情请参见 ...

UpdateFunction-更新函数

fc.gpu.ampere.1:GPU 实例 Ampere 系列 A10 卡型。g1:同 fc.gpu.tesla.1。e1 instanceLifecycleConfig InstanceLifecycleConfig 否 实例生命周期配置。customDNS CustomDNS 否 函数自定义 DNS 配置。customRuntimeConfig ...

命令行使用说明

root/fastgpu querygpu fastgpu query fastgpu query-gpu {gpu_type} fastgpu query-np {number of gpus per node} fastgpu query-gpu {gpu_type}-np {number of gpus per node} 查询阿里支持的GPU实例规格。参数说明:gpu:查询指定的...

ECI Pod Annotation

创建GPU实例时,如果指定了支持多个驱动和CUDA版本的GPU规格,可配置该Annotation指定驱动和CUDA版本。创建GPU实例 k8s.aliyun.com/eci-instance-family "ecs.c6,ecs.g6"指定vCPU和内存创建ECI实例时,支持指定或排除ECS规格族。指定或排除...

CreateFunction-创建函数

fc.gpu.ampere.1:GPU 实例 Ampere 系列 A10 卡型。g1:同 fc.gpu.tesla.1。默认值:e1 e1 customRuntimeConfig CustomRuntimeConfig 否 Custom Runtime 函数详细配置。instanceLifecycleConfig InstanceLifecycleConfig 否 实例生命周期...

查看服务实例云监控事件

gpu 实例使用的GPU个数。gpuMemory 实例GPU内存使用量,单位为GB。nvidiaName 实例使用的显卡名称。role 实例所属的服务角色,可能值:Queue:队列服务。DataLoader:离线服务。Standard:普通服务。isBurst 是否属于Burstable管理的实例,...

功能发布记录

2019-03-19 全部 实例规格族 2018年9月 功能名称 功能描述 发布时间 发布地域 相关文档 实例规格族 最新一代GPU云主机gn6v(V100机型)正式售卖。2018-09-12 全部 实例规格族 2018年3月 功能名称 功能描述 发布时间 发布地域 相关文档 GPU...

通过计算巢创建专属ChatBot

支持GPU的集群管理:在测试的过程中可以使用低水位的GPU实例,随着业务的增长,可以设置基于资源使用情况的动态GPU集群弹性管理,最大程度地节省GPU的开销。基于AnalyticDB PostgreSQL完整数据库能力进行精细化的权限设计:可以基于开源...

GPU FAQ

排查GPU监控常见问题 修复GPU实例重启或被置换后设备ID变更问题 阿里容器服务是否支持GPU虚拟化型(vGPU)实例?如何在已有集群的GPU节点上手动升级Kernel?修复GPU节点容器启动问题 裸金属实例ecs.ebmgn7节点添加失败怎么办?Alibaba ...

扩缩容节点池

重要 神龙裸金属GPU实例(ecs规格族为ebmgn7、ebmgn7e)不支持自动MIG清理,因此ACK添加该类型节点时会对已有的MIG设置进行重置。由于重置时间不定,可能会出现重置时间过长导致自动添加节点失败。排查失败原因,请参见 裸金属实例节点添加...

监控指标

GPU使用量(GPU Usage)GB*秒 在调用函数时,函数占用的GPU实例资源,即函数GPU规格×实例执行时间。vCPU使用量 活跃vCPU使用量(Active vCPU Usage)vCPU*秒 在调用函数时,函数活跃实例占用的vCPU资源,即函数的vCPU规格×函数执行时间。...

规则模板列表

无 否 操作审计开启全量日志跟踪 无 否 云服务器ECS ECS数据磁盘开启加密 无 是 ECS预付费实例到期检查 无 否 使用专有网络类型的ECS实例 无 否 ECS实例CPU核数满足最低要求 无 否 ECS实例规格符合标准要求 无 否 ECS实例GPU核数满足最低...

GPU监控

请确保您已在云服务器ECS上安装监控插件。具体操作,请参见 安装监控插件。监控项说明 您可以从GPU实例和应用分组维度查看GPU相关监控项。GPU的监控项如下表所示。监控项 单位 MetricName Dimensions(Agent)GPU维度解码器使用率%...

使用EAIS推理TensorFlow模型

您可以在ECS实例(非GPU实例)上绑定一个弹性加速计算实例EAIS(EAIS可以为ECS实例提供GPU资源),即可生成一款新规格的GPU实例。相比直接购买GPU实例,使用该方式可以为您灵活提供GPU资源并有效节省成本。如果您初次使用EAIS,可以通过...

CreateEaisEi-(推荐)创建EAIS实例

以ECS实例为例,您可以通过在ECS实例(非GPU实例)上绑定一个弹性加速计算实例EAIS,即可生成一款新规格的GPU实例,且使用该方式相比直接购买GPU实例,可以实现GPU资源的弹性使用(您可以根据实际需要绑定、解绑或释放EAIS实例),有效为您...

GPU虚拟化型

本文介绍为您介绍云服务器ECS GPU虚拟化型实例规格族的特点,并列出了具体的实例规格。GPU虚拟化型实例规格族sgn7i-vws(共享CPU)GPU虚拟化型实例规格族vgn7i-vws GPU虚拟化型实例规格族vgn6i-vws GPU虚拟化型实例规格族sgn7i-vws(共享...

ClaimGPUInstance-获取GPU渲染实例【已废弃】

获取GPU渲染实例。该API已废弃,不建议继续使用。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求语法 POST/...

产品优势

网络性能出色 阿里云GPU云服务器实例的VPC网络最大支持450万的PPS及32 Gbit/s的内网带宽。在此基础上,超级计算集群产品中,节点间额外提供高达50 Gbit/s的RDMA网络,满足节点间数据传输的低延时高带宽要求。购买方式灵活 支持灵活的资源...

弹性加速计算实例EAIS安全性说明

说明 通过在ECS实例(非GPU实例)上绑定一个EAIS实例,即可生成一款新规格的GPU实例,该方式相比直接购买GPU实例,可以实现GPU资源的弹性使用,并为您降低部署成本和使用成本。因此,在使用EAIS前,您也需要关注ECS实例的安全性,更多信息...

Tesla或GRID驱动安装指引

GPU实例本身并未配备相关驱动,只有安装了驱动的GPU实例,才能实现计算加速或图形渲染等功能。根据不同GPU实例规格安装与之匹配的Tesla或GRID驱动,...如果GPU实例安装驱动后,在使用过程中遇到黑屏或其他问题,请参见 GPU云服务器常见问题。

实例命名规则

命名规则 阿里云云服务器ECS提供了多种实例规格族,一种实例规格族又包括多个实例规格。其中,实例规格族名称格式为 ecs.<规格族>,实例规格名称为 ecs.<规格族>.<nx>large。实例具体命名含义如下所示:ecs:云服务器ECS的产品代号。规格...

ECS实例如何升级GPU驱动

概述 本文主要介绍如何升级ECS实例GPU驱动。详细信息 阿里提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、RDS)等进行配置与数据...适用于 云服务器ECS

GPU监控

请确保您已在云服务器ECS上安装监控插件。具体操作,请参见 安装监控插件。监控项说明 您可以从GPU实例和应用分组维度查看GPU相关监控项。GPU的监控项如下表所示。监控项 单位 MetricName Dimensions(Agent)GPU维度解码器使用率%...

接入Nvidia GPU监控数据

如果您使用阿里ECS的GPU实例,则GPU实例中已默认安装驱动,可跳过此步骤。步骤二:创建Logtail采集配置 登录 日志服务控制台。在 日志应用 区域的 智能运维 页签下,单击 全栈可观测。在 SLS全栈可观测 页面,单击目标实例。在左侧导航栏...

使用VNC登录实例

无法使用Workbench和第三方远程连接工具(例如PuTTY、Xshell、SecureCRT等)连接实例时,您可以通过VNC远程连接方式登录实例,查看云服务器ECS操作界面的实时状态。重要 自2023年7月10日起,远程连接工具VNC无需单独设置VNC登录密码,即可...

接入NVIDIA GPU监控数据

如果您使用阿里ECS的GPU实例,则GPU实例中已默认安装驱动,可跳过此步骤。步骤二:创建Logtail采集配置 登录 日志服务控制台。在 接入数据 区域的 监控数据 页签下,单击 NVIDIA GPU监控。选择目标Project和MetricStore,单击 下一步。...

通过Prometheus监控GPU实例

接入可观测监控Prometheus版后,您可以通过预定义的大盘监控Kubernetes集群中ECI GPU实例的性能指标。本文主要为您介绍如何通过Prometheus监控ECI GPU实例。前提条件 已创建 ACK Serverless集群,且集群已接入可观测监控Prometheus版。具体...

搭建Windows环境GRID驱动的License Server

步骤六:测试网络连接和访问 以下操作以创建一台Windows操作系统的GPU虚拟化实例vgn6i为例,您也可以直接应用您已创建的GPU实例。创建一台GPU实例。具体操作,请参见 创建未配备驱动的GPU实例。本示例选择的实例规格为GPU虚拟化实例vgn6i,...

神行工具包(DeepGPU)计费

使用神行工具包(DeepGPU)本身不需要额外支付费用,您只需要为执行计算任务过程中使用的阿里资源(例如云服务器ECS或文件存储NAS)进行付费。神行工具包中的组件主要包括 AI训练加速器Deepytorch Training、AI推理加速器Deepytorch ...

GPU计算型实例中安装Tesla驱动(Windows)

在深度学习、AI等通用计算业务场景...如果GPU实例中安装的驱动版本不适用于当前场景,或您安装了错误的驱动类型或版本导致GPU实例无法正常使用,您可以卸载当前驱动然后安装新的驱动或直接升级驱动。关于如何升级驱动,请参见 升级Tesla驱动。

创建GPU实例

使用GPU实例可以为您的业务提供更的计算性能或者满足专业级图形设计需求,本文为您介绍如何创建GPU实例。操作步骤 前往 实例创建页。选择 自定义购买 页签。按需选择 付费类型、地域、网络及可用区、实例规格、镜像等配置。各配置项详细...

搭建Linux环境GRID驱动的License Server

步骤七:测试网络连接和访问 以下操作以创建一台Windows操作系统的GPU虚拟化实例vgn6i为例,您也可以直接应用您已创建的GPU实例。创建一台GPU实例。具体操作,请参见 创建未配备驱动的GPU实例。本示例选择的实例规格为GPU虚拟化实例vgn6i,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
GPU云服务器 弹性容器实例 弹性伸缩 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用