安装GPU拓扑感知调度组件

前提条件 已创建ACK Pro集群,且集群的实例规格类型选择为 GPU云服务器。更多信息,请参见 创建Kubernetes托管版集群。获取集群KubeConfig并通过kubectl工具连接集群。系统组件版本满足以下要求。组件 版本要求 Kubernetes 1.18.8及以上...

使用阿里Prometheus监控集群GPU资源

前提条件 您已完成以下操作:创建GPU集群 或 创建专有GPU集群。开通 阿里Prometheus服务。已安装阿里Prometheus监控。具体操作,请参见 阿里Prometheus监控。费用说明 在ACK集群中使用 ack-gpu-exporter 组件时,默认情况下它产生的...

2021年

本章节介绍数据库专属集群MyBase的产品功能和对应的文档动态。2021年12月 引擎 类别 功能名称 功能描述 发布时间 相关文档 SQL Server 新增 迁移实例 将专属集群MyBase上的主、备实例迁移到当前可用区的其它主机上。12-23 迁移实例 迁移 ...

管理集群

创建 专属集群MyBase 后,您可以查看、修改、删除专属集群。背景信息 关于 专属集群MyBase 的更多介绍,请参见 什么是数据库专属集群MyBase。查看集群信息 登录 数据库专属集群控制台。在页面左上角,选择目标地域。在 集群列表 页,...

产品优势

高可用性 E-HPC集群节点基于云服务器ECS、超级计算集群SCC和GPU云服务器组建,大大提高了集群的可用性。结果可视 E-HPC提供可视化服务功能,您可以通过可视化服务功能将计算结果转换为可读的图形化数据。例如您可以直接观看渲染后的动画...

管理集群

创建 专属集群MyBase 后,您可以查看、修改、删除专属集群。背景信息 关于 专属集群MyBase 的更多介绍,请参见 什么是数据库专属集群MyBase。查看集群信息 登录 数据库专属集群控制台。在页面左上角,选择目标地域。在 专属集群列表 ...

配置Arena客户端

具体操作,请参见 创建GPU集群 或 创建专有GPU集群。集群节点可以访问公网。已安装Arena组件。具体操作,请参见 部署原生AI套件。步骤一:配置Arena客户 连接集群。专有版集群 用SSH方式登录专有版集群的管理节点,然后执行 arena 命令。...

Tesla或GRID驱动安装指引

GPU实例本身并未配备相关驱动,只有安装了驱动的GPU实例,才能实现计算加速或图形渲染等功能。根据不同GPU实例规格安装与之匹配的Tesla或GRID驱动,...如果GPU实例安装驱动后,在使用过程中遇到黑屏或其他问题,请参见 GPU云服务器常见问题。

设置主机能否分配实例

本文介绍如何设置专属集群MyBase的主机是否分配实例。背景信息 当专属集群MyBase的主机需要维护或您不希望该主机分配实例时,您可以在主机列表页面设置主机停止分配实例。当您再次希望主机可以分配实例时,您可以在主机列表页面设置主机...

监控集群GPU资源最佳实践

本文介绍如何使用GPU监控2.0监控ACK集群的GPU资源。前提条件 已创建Kubernetes集群(ACK专有版集群、ACK集群基础版、ACK集群Pro版 或 ACK Edge集群),本文以 ACK集群Pro版 为例。已安装GPU监控2.0相关组件。具体操作,请参见 开启集群...

设置主机能否分配实例

本文介绍如何设置专属集群MyBase的主机是否分配实例。背景信息 当专属集群MyBase的主机需要维护或您不希望该主机分配实例时,您可以在主机列表页面设置主机停止分配实例。当您再次希望主机可以分配实例时,您可以在主机列表页面设置主机...

集群自定义监控报表

集群数据库 transaction_commit_rt 事务平均提交耗时 集群数据库 transaction_rollback_rt 事务平均回滚耗时 集群数据库 transaction_rt 事务平均处理耗时 集群数据库 active_session 当前活跃会话数 集群数据库 all_session 当前会话数 ...

ACK集群实现GPU AI模型训练

场景描述 本方案适用于AI图片训练场景,使用CPFS和NAS作为共享存储,利用容器服务Kubernetes版管理GPU云服务器集群进行图片AI训练。解决问题 搭建AI图片训练基础环境。使用CPFS存储训练数据。使用飞天AI加速训练工具加速训练。使用Arena一...

安装共享GPU调度组件

ACK Pro集群的实例规格架构设置为 GPU云服务器。其他配置,请参见 创建ACK集群Pro版。已获取集群KubeConfig并通过kubectl工具连接集群。使用限制 请勿将共享GPU调度的节点的CPU Policy设置为 static。cGPU服务的隔离功能不支持以UVM的方式...

创建MyBase MySQL实例

主机创建后,您需要在 专属集群MyBase 内创建实例才能正常使用 专属集群MyBase 的各项功能,系统会根据资源分配策略在主机上创建实例。前提条件 您已创建数据库引擎为MySQL的主机,详情请参见 添加MySQL主机。背景信息 关于 专属集群MyBase...

异构计算产品最佳实践概览

GPU AI模型训练最佳实践 适用于AI图片训练场景,使用CPFS/NAS作为共享存储,利用容器服务Kubernetes版管理GPU云服务器集群进行AI图片训练。在GPU实例上使用RAPIDS加速机器学习任务 在GPU实例上基于NGC环境使用RAPIDS加速库,加速数据科学和...

ACK灵骏集群计费说明

阿里容器服务 ACK灵骏集群 是 容器服务 Kubernetes 版 针对智能计算灵骏提供的集群类型,提供全托管和高可用控制面板的标准Kubernetes集群服务,支持以灵骏计算节点作为Kubernetes集群的工作节点。本文介绍 ACK灵骏集群 各计费项的计费...

主机续费

主机到期停机及释放规则 到期或欠费 操作步骤 登录 数据库专属集群控制台。在页面左上角,选择目标地域。单击左侧 主机列表。找到目标主机,在 操作 列单击 更多>续费。在 续费 页面,您可查看主机的当前设置以及到期时间。选择主机的...

创建堡垒

操作步骤 登录 数据库专属集群控制台。在页面左上角,选择目标地域。单击左侧导航栏中的 集群列表。在目标集群右侧的 操作 列,单击 详情。在左侧单击 堡垒列表。在 堡垒列表 页面,单击 购买堡垒。在 购买堡垒 页面,设置以下...

重启主机

当专属集群MyBase的主机出现性能或其它问题时,您可以在主机列表页面重启主机。注意事项 主机重启时,主机上的主节点实例会发生主备切换,实例主备切换可能有1~2次闪断。主机重启的时长受实例主备切换时长影响。由于主机重启的影响,正在...

重启主机

操作步骤 登录 数据库专属集群控制台。在页面左上角,选择目标地域。单击左侧 主机列表。找到目标主机,在 操作 列单击 更多>重启主机。在弹出的 重启主机 页面,单击 立即重启。说明 主机重启时,主机上的主节点实例会发生主备切换,...

CreateDedicatedHost-添加专属集群主机

调用CreateDedicatedHost接口添加专属集群主机。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 名称 ...

安装CUDA

如果您想要在GPU云服务器上进行GPU加速计算任务(例如科学计算或大规模并行计算等),则需要安装CUDA开发运行环境。CUDA提供了一整套工具和库,可以帮助您进行GPU加速的程序开发,以充分发挥NVIDIA GPU的计算潜力,提高计算性能和加速运行...

连接主机

您可通过以下两种方式连接主机,详情请参考:通过堡垒访问主机 通过Webshell访问主机 通过堡垒访问主机 前提条件 创建 专属集群MyBase 时开放OS权限。您已创建MyBase MySQL主机,详情请参见 添加MySQL主机。已创建主机账号,详情请参见...

DescribeDedicatedHostAttribute-查询专属集群某个...

调用DescribeDedicatedHostAttribute接口查询专属集群某个主机的参数信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权...

重启实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍如何通过控制台重启实例。前提条件 待重启的实例必须处于 运行中 状态。背景信息 重启操作是维护云服务器的一种常用方式,如系统更新、重启保存相关配置等...

利用DCGM实现GPU的性能分析

具体使用场景,请参见:场景三:评估训练任务中如何设置Batch Size参数的大小 场景四:评估一张共享GPU卡可以运行多少个AI推理服务 场景五:评估是否可以在共享的GPU上开启MPS能力 场景六:评估GPU的基本性能 前提条件 已创建托管GPU集群或...

创建GPU集群

本文介绍如何创建GPU集群及查看节点挂载的GPU设备。前提条件 已创建ACK Pro版集群 或 已创建ACK专有版集群。创建GPU节点池 创建GPU节点池时,选择的节点机型需为GPU规格。关于创建节点池,请参见 创建节点池。关于可选的GPU ECS规格,请...

主机续费

当专属集群MyBase的主机即将要到期或主机已经停机锁定时,您可以在主机列表页面为主机手动续费,从而保障主机的可用性。前提条件 已购买主机。具体操作,请参见 添加主机。主机规格及售价 MyBase MySQL和PostgreSQL主机规格及售价 MyBase ...

创建MyBase Redis实例

主机创建后,您需要在 专属集群MyBase 内创建实例才能正常使用 专属集群MyBase 的各项功能,系统会根据资源分配策略在主机上创建实例。前提条件 已创建MyBase Redis主机。具体操作,请参见 添加Redis主机。主机要求 实例架构 主机要求 主从...

基于MyBase构建自主可控数据库和高弹性应用实践

本文介绍基于 专属集群MyBase 构建自主可控数据库和高弹性应用实践。背景信息 一些企业级客户上云前,会重点关心数据库是否自主可控,包括资源独享、自主可运维、获取OS权限等特点,同时又要兼顾数据库合规性、安全性和高性能的要求,并...

历史功能发布记录(2022年)

全部 多集群报警差异化配置 2022年10月 功能名称 功能描述 发布地域 相关文档 ACK支持倚天Arm ECS服务器 ACK现已支持倚天ARM云服务器,支持节点池的全生命周期管理,包括节点添加、扩容、升级、删除。同时也支持了多架构镜像的管理,使用...

什么是容器服务灵骏版

关于ACK灵骏托管版集群的更多操作以及更多功能的使用,请参见:ACK灵骏托管版集群计费说明 ACK灵骏托管版集群管理 创建集群 查看集群信息 管理集群 删除集群 灵骏节点池 灵骏节点池概述 ACK灵骏托管版集群组件 组件概述 管理组件 ACK灵骏...

重建备库

操作步骤 登录 数据库专属集群控制台。在页面左上角,选择目标地域。在左侧单击 集群列表,在目标专属集群的 操作 列单击 详情。在左侧单击 实例列表。找到目标实例,单击 操作 列的 重建备库。打开 启用指定主机 按钮,并在 指定主机 ...

产品优势

阿里GPU云服务器具有广阔的覆盖范围、超强的计算能力、出色的网络性能和灵活的购买方式,神行工具包(DeepGPU)是专门为GPU云服务器搭配的具有GPU计算服务增强能力的免费工具集。本文主要介绍GPU云服务器和神行工具包(DeepGPU)的优势。...

添加Redis主机

您需要在专属集群MyBase内添加主机,才能在主机上创建实例并使用 专属集群MyBase 的各项功能。背景信息 关于主机的规格及售价请参见 MyBase Redis主机规格及售价。操作步骤 登录 数据库专属集群控制台。在页面左上角,选择目标地域。在...

申请14天免费试用

您可以申请免费试用加密服务集群,快速了解加密服务的功能以及如何使用加密服务。本文介绍如何申请免费试用加密服务。使用说明 加密服务提供14天免费试用,且试用形式为由一台密码实例构成的集群。警告 试用到期后,阿里会直接释放实例...

添加主机

专属集群MyBase 创建后,您需要在专属集群内添加主机,才能在主机上创建实例并使用 专属集群MyBase 的各项功能。前提条件 创建集群 主机数量要求 数据库引擎 支持的版本 主机数量要求 MySQL 主从版 1 高可用版 2 SQL Server 基础版 1 高...

添加主机

专属集群MyBase 创建后,您需要在专属集群内添加主机,才能在主机上创建实例并使用 专属集群MyBase 的各项功能。前提条件 创建集群 主机数量要求 数据库引擎 支持的版本 主机数量要求 MySQL 主从版 1 高可用版 2 SQL Server 基础版 1 高...

什么是神行工具包(DeepGPU)

神行工具包(DeepGPU)是阿里专门为GPU云服务器搭配的GPU计算服务增强工具集合,旨在帮助开发者在GPU云服务器上更快速地构建企业级服务能力。GPU云服务器搭配神行工具包(DeepGPU)中的组件可以帮助您更方便地利用阿里上GPU资源,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库专属集群 云虚拟主机 云数据库 Redis 版 运维安全中心(堡垒机) 短信服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用