添加主机

专属集群MyBase 创建后,您需要在专属集群内添加主机,才能在主机上创建实例并使用 专属集群MyBase 的各项功能。前提条件 创建集群 主机数量要求 数据库引擎 支持的版本 主机数量要求 MySQL 主从版 1 高可用版 2 SQL Server 基础版 1 高...

添加主机

专属集群MyBase 创建后,您需要在专属集群内添加主机,才能在主机上创建实例并使用 专属集群MyBase 的各项功能。前提条件 创建集群 主机数量要求 数据库引擎 支持的版本 主机数量要求 MySQL 主从版 1 高可用版 2 SQL Server 基础版 1 高...

Databricks Runtime

Databricks Runtimes是在Databricks集群上运行的一组核心组件。Databricks提供了几种类型的Runtime。Databricks Runtime Databricks Runtime包括Apache Spark,但还添加了许多组件和更新,这些组件和更新极大地提高了大数据分析的可用性,...

应用场景

云服务器ECS具有广泛的应用场景,既可以作为Web服务器或者应用服务器单独使用,又可以与其他阿里云服务集成提供丰富的解决方案。说明 云服务器ECS的典型应用场景包括但不限于本文描述,您可以在使用云服务器ECS的同时发现计算带来的技术...

设置集群超配降低成本

背景信息 在游戏等行业中,新开通的服务器可能无法准确预估客户服务的增长曲线,使用数据库RDS预留服务器的方式可能会造成资源浪费。此时,您可使用专属集群MyBase,根据自身情况,超配创建多个相同规格的实例主机,并监测主机性能。如您...

实例命名规则

命名规则 阿里云云服务器ECS提供了多种实例规格族,一种实例规格族又包括多个实例规格。其中,实例规格族名称格式为 ecs.<规格族>,实例规格名称为 ecs.<规格族>.<nx>large。实例具体命名含义如下所示:ecs:云服务器ECS的产品代号。规格...

GPU节点卡型属性标签

在使用Kubernetes集群实现GPU计算时,为了有效利用GPU设备,可使用GPU节点卡型属性标签将应用调度至目标节点。本文介绍GPU节点卡型属性标签基本信息以及如何使业务运行或不运行在指定卡型上。GPU节点卡型属性标签说明 在ACK集群中扩容GPU...

成本洞察功能说明

您可以通过ACK成本洞察功能查看集群、命名空间、节点池和应用等成本可视化大盘。本文介绍如何查看集群洞察分析及成本可视化大盘。前提条件 确保Kubernetes集群的版本为1.18.8及以上,否则请升级集群。具体操作,请参见 升级ACK集群K8s版本...

查看集群列表信息

本文介绍如何查看已创建集群的详情。前提条件 已创建集群,详情请参见 创建集群。操作步骤 使用阿里账号登录 Databricks数据洞察控制台。在Databricks数据洞察控制台页面,选择所在的地域(Region)。创建的集群将会在对应的地域内,一旦...

已停售的GPU实例规格

vCPU 内存(GiB)GPU GPU显存(GB)网络带宽(Gbit/s)网络收发包PPS RoCE网络(Gbit/s)多队列 弹性网卡 单网卡私有IP ecs.sccgn6e.24xlarge 96 768.0 NVIDIA V100*8 32GB*8 32 480万 50 8 32 10 GPU计算型超级计算集群实例规格族sccgn6 ...

Arena在多用户场景下的最佳实践

步骤一:创建和管理ACK集群的用户和组 为了安全起见,不建议您直接登录ACK集群的Master节点安装使用Arena以及对集群进行操作,因此建议您在与ACK集群同一个VPC下创建ECS实例(Client机器)。通过配置 KubeConfig 文件,使用ECS实例节点对...

配置动态CPU资源弹性策略

本文介绍专属集群MyBase如何配置动态CPU资源弹性策略,从而更有效利用主机上的空闲资源,实现实例性能的提升。应用场景 举例说,一台16核128 GB的主机,部署了8个4核8 GB的实例,那么当前主机的CPU超配比是200%(即所有实例的CPU资源之和...

节点与节点池FAQ

修复GPU节点容器启动问题 添加Kubernetes集群节点的常见问题 移除节点时提示”drain-node job execute timeout”错误 ACK集群中kubelet目录路径是什么?支持自定义吗?如何更换节点池OS镜像?更换节点池OS镜像的方法与升级节点池的方法一致...

通过OSS URL自定义节点GPU驱动

不同类型和版本的ACK集群默认安装不同版本的NVIDIA驱动。如果您使用的CUDA库需要匹配更高版本的NVIDIA驱动,需要自定义安装节点的NVIDIA驱动。本文介绍如何基于节点池标签通过OSS URL自定义GPU节点的NVIDIA驱动版本。注意事项 对于GPU驱动...

什么是容器服务 Kubernetes 版

大类 关联产品说明 计算 云服务器ECS、弹性裸金属EBM、GPU云服务器:提供节点池工作节点。弹性容器实例ECI:提供 ACK Serverless集群 的容器实例。弹性伸缩ESS:支持节点池的配置和弹性伸缩。网络 专有网络VPC:提供集群私网网络。负载均衡...

DNS概述

Kubernetes集群中DNS域名解析原理 ACS集群中kubelet的启动参数有-cluster-dns=和-cluster-domain=,这两个参数分别被用来设置集群DNS服务器的IP地址和主域名后缀。ACS集群默认部署了一套CoreDNS工作负载,并通过 kube-dns 的服务名暴露DNS...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

调度集群管理概述

Dataphin支持连接不同调度集群,并将所有集群可用于调度的资源进行统一管理,使每个租户可以使用不同集群的资源用于创建自定义资源组,从而解决跨Region数据传输以及资源隔离等问题。使用限制 当前仅支持基于最新架构部署的客户使用调度...

DNS概述

域名解析配置 ACK集群中kubelet的启动参数有-cluster-dns=、-cluster-domain=,这两个参数分别被用来设置集群DNS服务器的IP地址和主域名后缀。ACK集群默认部署了一套CoreDNS工作负载,并通过 kube-dns 的服务名暴露DNS服务。ACK部署的...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

创建集群

本节介绍如何使用Databricks数据洞察控制台创建集群。前提条件 已注册阿里账号,并完成实名认证。详情请参见 阿里账号注册流程。操作步骤 使用阿里账号登录 Databricks数据洞察控制台。在Databricks数据洞察控制台页面,选择所在的...

固定规格计算包计费问题

A:若已购买了按量付费集群,直接 购买固定规格计算包 抵扣集群内的计算节点费用。若您还未购买任何集群或当前集群付费方式为包年包月,您仅需如下两步即可快速使用固定规格计算包:购买固定规格计算包。购买按量付费集群 或将 已购的...

超级计算集群概述

SCC与阿里ECS、GPU云服务器等计算类产品一起,为 阿里弹性高性能计算平台E-HPC 提供了极高性能的并行计算资源,实现真正的上超算。机型对比 SCC与物理机、虚拟机的对比如下表所示。其中,Y表示支持,N表示不支持,N/A表示无数据。...

通过Prometheus监控GPU实例

接入可观测监控Prometheus版后,您可以通过预定义的大盘监控Kubernetes集群中ECI GPU实例的性能指标。本文主要为您介绍如何通过Prometheus监控ECI GPU实例。前提条件 已创建 ACK Serverless集群,且集群已接入可观测监控Prometheus版。具体...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

注册CDH或CDP集群至DataWorks

背景信息 CDH是Cloudera的开源平台发行版,提供开箱即集群管理、集群监控、集群诊断等功能,并支持使用多种组件,助力您执行端到端的大数据工作流程。CDP是跨平台收集和整合客户数据的公共数据平台,可帮助您收集实时数据,并将其构建...

升级节点cGPU版本

ACK集群支持GPU共享调度时节点需要安装cGPU模块。本文介绍如何通过命令及控制台升级节点上的cGPU模块。前提条件 您已通过kubectl连接集群。具体操作,请参见 通过kubectl连接Kubernetes集群集群已安装ack-cgpu组件。具体操作,请参见 ...

创建DTS专属集群

优势 购买DTS专属集群后,集群的硬件资源仅用于运行DTS迁移、同步、订阅任务,其优势如下所示:DTS专属集群为您提供独立的资源空间,实现与其他用户的DTS实例资源隔离,将不会受到其他DTS实例影响,同时您也可以自主控制DTS专属集群的负载...

存储空间计费问题

说明 关于整体集群转化计费类型的操作步骤,请参见 包年包月集群转按量付费集群 和 按量付费集群转包年包月集群。Q:如何降低按容量计费(按量计费)存储的费用?A:当您需要的数据量较大(如1000 GB或以上)时,相比未使用存储包即正常按...

GPU计算型

gn7r的特点如下:gn7r是阿里推出的企业级ARM处理+GPU的多功能规格族产品。以ARM架构为开发Android线上应用和手机、手游等业务,为其提供原生底层资源平台。同时,其配备的NVIDIA A16 GPU具备多芯片硬件转码能力,可以作为高性价...

GetClusterDataInformation

调用GetClusterDataInformation,获取集群的数据信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见...

应用:账号型-集群手工部署

云端外部接入:用户的应用部署在自己管理的云服务器中。2.应用配置 创建应用完成后点击 初始化应用,设置实例所需网络限制与版本说明如图所示:应用详情页可以看到集群信息与版本管理功能,如图所示:2.1 登录管理 点击登录管理查看集群...

配置共享GPU调度仅共享不隔离策略

配置项 说明 实例规格 架构 选择 GPU云服务器,选择多个GPU实例规格。本文以使用GPU卡V100为例进行说明。期望节点数 设置节点池初始节点数量。如无需创建节点,可以填写为0。节点标签 单击,添加如下记录:键 为 ack.node.gpu.schedule,值...

共享GPU调度

容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)开源了GPU共享调度之后,您能在阿里、AWS、Google Compute Engine和自己数据中心的容器集群上通过GPU共享调度框架实现多个容器运行在同一个GPU设备上的目标。ACK开源GPU...

指标含义与异常处理建议

阿里Elasticsearch为运行中的集群提供了多项基础监控指标(例如集群状态、集群查询QPS、节点CPU使用率、节点磁盘使用率等)和高级监控报警指标(例如Cluster、Index、Note Resource等),用来监测集群的运行状况。您可以根据这些指标,...

重启主机

当专属集群MyBase的主机出现性能或其它问题时,您可以在主机列表页面重启主机。注意事项 主机重启时,主机上的主节点实例会发生主备切换,实例主备切换可能有1~2次闪断。主机重启的时长受实例主备切换时长影响。由于主机重启的影响,正在...

重启主机

操作步骤 登录 数据库专属集群控制台。在页面左上角,选择目标地域。单击左侧 主机列表。找到目标主机,在 操作 列单击 更多>重启主机。在弹出的 重启主机 页面,单击 立即重启。说明 主机重启时,主机上的主节点实例会发生主备切换,...

迁移实例

操作步骤 登录 数据库专属集群控制台。在页面左上角,选择目标地域。在目标专属集群的 操作 列,单击 详情。在左侧导航栏,单击 实例列表,根据实例的架构类型选择迁移方式。场景一:实例类型为主从(非集群)时,选择目标实例 操作 列中...

上云须知

GPU云服务器 是基于GPU应用的计算服务,多适用于AI深度学习、视频处理、科学计算、图形可视化等应用场景。网络规划 容器集群基础设施(云服务器 ECS)的网络类型选择:专有网络VPC或经典网络。专有网络VPC:推荐使用。采用二层隔离,相对...

在ACK专有版集群中使用共享GPU调度

如您需要在 ACK专有版集群 中使用共享GPU调度基础版,请参见...基础版迁移专业版 安装共享GPU调度组件 运行共享GPU调度组件 使用共享GPU调度实现仅共享不隔离能力 使用共享GPU调度实现cGPU算力分配策略 解决专业版集群升级共享GPU调度失效问题
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
GPU云服务器 云数据库专属集群 云数据库 Redis 版 云原生数据仓库AnalyticDB MySQL版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用