通过OpenAPI创建集群

addons Array of addon 否[{"name":"logtail-ds","config":"{\"sls_project_name\":\"your_sls_project_name\"}"}]Kubernetes集群安装的组件列表。组件的结构包括:name:必填,组件名称。config:可选,取值为空时表示无需配置。disabled...

API概览

集群 API 标题 API概述 CreateCluster 创建集群 您可以通过OpenAPI创建ACK集群,包含ACK托管集群、ACK专有集群、ACK Serverless集群,ACK Edge集群以及注册集群。创建集群时,您将完成集群信息、集群组件以及ACK相关资源的配置。...

功能特性

GPU容器虚拟化方案eGPU 针对AI作业规模庞大、GPU硬件资源昂贵、集群GPU利用率低等业务场景实际遇到的问题,灵骏支持GPU虚拟化技术eGPU,可有效提升AI集群GPU利用率,具体如下:支持显存、算力双维度自由切分。支持多个规格。支持动态创建...

API概览

集群 API 标题 API概述 CreateCluster 创建集群 您可以通过OpenAPI创建ACK集群,包含ACK托管集群、ACK专有集群、ACK Serverless集群,ACK Edge集群以及注册集群。创建集群时,您将完成集群信息、集群组件以及ACK相关资源的配置。...

将报警配置功能接入注册集群

安装云监控组件时将自动引用此AccessKey访问对应的云服务资源。kubectl-n kube-system create secret generic alibaba-addon-secret-from-literal='access-key-id=<your access key id>'-from-literal='access-key-secret=...

容器服务报警管理

报警配置功能提供统一管理容器报警场景的功能,包括容器服务异常事件报警、集群相关基础资源的关键指标报警、集群核心组件及集群中应用的指标报警。支持在创建集群时默认开启报警功能。容器服务的报警规则支持通过集群内部署CRD的方式配置...

手动执行脚本

手动执行类似引导操作,在集群创建完成后,您可以通过手动执行功能来安装集群尚未支持的软件和服务,例如:使用YUM安装已经提供的软件。直接下载公网上公开的软件。读取您OSS中的自有数据。安装并运行服务(例如,Flink或者Impala),但...

部署GPU云服务器

请按照标签顺序依次点击 新建>新建空白应用,构建如下图所示的包含GPU云服务器实例的应用架构:本文所选地域为 华北2(北京)可用区H。双击GPU实例,配置相关参数。参考 创建GPU实例,选择对应的实例规格、镜像及版本。需要修改自定义登录...

共享GPU调度

容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)开源了GPU共享调度之后,您能在阿里、AWS、Google Compute Engine和自己数据中心的容器集群上通过GPU共享调度框架实现多个容器运行在同一个GPU设备上的目标。ACK开源GPU...

阿里Elasticsearch实例FAQ

本文列举了阿里Elasticsearch(ES)相关的常见问题,包括购买、退订、配置、访问、查询、写入、插件、分词、日志、重启、负载或状态异常、备份与恢复、监控报警等相关问题。常见问题概览 购买或退订实例问题 购买ES实例时选错配置,如何...

更改共享GPU调度显存最小分配单位

前提条件 您的集群需要安装共享GPU调度专业版的组件,然后您才可以更改共享GPU调度显存最小分配单位。关于安装共享GPU调度专业版的组件,请参见 安装共享GPU调度组件。集群类型为ACK Pro且集群版本≥1.18.8。关于创建ACK Pro集群和升级集群...

热迁移ACK专有版集群至ACK集群Pro版

如果您有存量的 ACK专有版集群,但同时希望享受 ACK集群Pro版 的功能和特性,容器服务平台推出了 ACK专有版集群 至 ACK集群Pro版 的集群热迁移功能,让您可以动态完成迁移。本文介绍如何将 ACK专有版集群 动态迁移至 ACK集群Pro版,以及热...

阿里异构计算产品总览

GPU云服务器 GPU云服务器是基于GPU应用的计算服务器GPU在执行复杂的数学和几何计算方面有着独特的优势。特别是浮点运算、并行运算等方面,GPU可以提供上百倍于CPU的计算能力。作为阿里弹性计算家族的一员,GPU云服务器结合了GPU计算力...

修复NVIDIA GPU驱动漏洞CVE-2021-1056公告

依据NVIDIA官方信息,目前已验证受影响的容器服务Kubernetes集群版本包括:ACK 1.16.9-aliyun.1(默认安装GPU驱动版本为418.87.01版本)ACK 1.18.8-aliyun.1(默认安装GPU驱动版本为418.87.01版本)说明 其他版本的ACK集群,GPU节点默认...

Tesla或GRID驱动安装指引

GPU实例本身并未配备相关驱动,只有安装了驱动的GPU实例,才能实现计算加速或图形渲染等功能。根据不同GPU实例规格安装与之匹配的Tesla或GRID驱动,...如果GPU实例安装驱动后,在使用过程中遇到黑屏或其他问题,请参见 GPU云服务器常见问题。

什么是神行工具包(DeepGPU)

神行工具包(DeepGPU)是阿里专门为GPU云服务器搭配的GPU计算服务增强工具集合,旨在帮助开发者在GPU云服务器上更快速地构建企业级服务能力。GPU云服务器搭配神行工具包(DeepGPU)中的组件可以帮助您更方便地利用阿里上GPU资源,...

配置共享GPU调度cGPU算力调度策略

步骤一:查看是否已安装共享GPU组件 配置共享GPU算力分配策略时,未安装共享GPU组件和已安装共享GPU组件的操作方式不同,因此需要您确认集群是否已安装共享GPU组件。登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,...

配置共享GPU调度节点选卡策略

配置项 说明 实例规格 架构 选择 GPU云服务器,选择多个GPU实例规格。由于只有在节点有多张GPU卡的情况下,节点选卡策略才能看出效果,建议选择带有多张GPU卡机型。期望节点数 设置节点池初始节点数量。如无需创建节点,可以填写为0。节点...

应用场景

GPU云服务器应用场景 直播实时视频转码 阿里云GPU云服务器重点支持2019年天猫双11狂欢夜直播的实时视频转码,以高画质、低带宽、高分辨率、实时的综合优势服务于天猫双11狂欢夜当天直播业务4K、2K、1080P等各个分辨率的转码。具体说明如下...

安装GPU拓扑感知调度组件

前提条件 已创建ACK Pro集群,且集群的实例规格类型选择为 GPU云服务器。更多信息,请参见 创建Kubernetes托管版集群。获取集群KubeConfig并通过kubectl工具连接集群。系统组件版本满足以下要求。组件 版本要求 Kubernetes 1.18.8及以上...

产品优势

阿里GPU云服务器具有广阔的覆盖范围、超强的计算能力、出色的网络性能和灵活的购买方式,神行工具包(DeepGPU)是专门为GPU云服务器搭配的具有GPU计算服务增强能力的免费工具集。本文主要介绍GPU云服务器和神行工具包(DeepGPU)的优势。...

重启实例

GPU实例作为云服务器ECS的一类实例规格,保持了与ECS实例相同的管理操作。本文介绍如何通过控制台重启实例。前提条件 待重启的实例必须处于 运行中 状态。背景信息 重启操作是维护云服务器的一种常用方式,如系统更新、重启保存相关配置等...

配置共享GPU调度仅共享不隔离策略

配置项 说明 实例规格 架构 选择 GPU云服务器,选择多个GPU实例规格。本文以使用GPU卡V100为例进行说明。期望节点数 设置节点池初始节点数量。如无需创建节点,可以填写为0。节点标签 单击,添加如下记录:键 为 ack.node.gpu.schedule,值...

什么是GPU云服务器

对比项 GPU云服务器 GPU自建服务器 灵活性 能够快速开通一台或多台GPU云服务器实例。实例规格(vCPU、内存及GPU)支持灵活变更,并且支持在线升降配。带宽升降自由。服务器购买周期长。服务器规格固定,无法灵活变更。带宽一次性购买,无法...

ACK集群节点安装云监控插件

ACK集群节点均已安装云监控插件,且插件运行状态正常,视为“合规”。应用场景 当您创建、变更、删除在ACK集群节点部署的应用时,插件会自动同步应用元数据到监控,帮助您实现应用的容器监控与报警。风险等级 默认风险等级:高风险。当您...

安装Nginx Ingress Controller

操作步骤 方式一:创建集群安装Nginx Ingress Controller 创建ACS集群时,在 Ingress 参数配置区域,选择安装 Nginx Ingress。说明 安装Nginx Ingress Controller需要满足以下两个条件:2个2核4 GiB的ECI实例:用于部署服务。1个SLB:SLB...

灵骏常见问题

开通集群后,是否需要安装GPU驱动?灵骏计算节点的操作系统镜像中已包含GPU驱动,您可以使用nvidia-smi确认GPU驱动已正确安装并查询显卡状态。如何查询GPU显卡的详细信息?不同操作系统的灵骏节点实例,查看GPU显卡信息的操作有所区别,...

内置CRD模板工具

namespace value或-n value:选择组件空间,当集群安装多个Logtail组件时生效,默认参数为空。help或-h:查看当前指令文档。样例:验证参数合法性 说明 当前模板配置文件中含有REQUIRED参数未填充。sls-crd-tool apply-f template-...

管理MSE Ingress Controller组件

阿里容器服务ACK或 ACK Serverless集群 基于MSE原生网关提供了托管的MSE Ingress Controller。本文介绍如何在ACK或 ACK Serverless集群安装、升级和卸载MSE Ingress Controller组件。安装MSE Ingress Controller组件 方式一:创建...

安装云原生工具箱

本文介绍如何为ACK集群和 ACK Serverless集群 应用安装并使用原生工具箱。使用说明 原生工具箱当前仅支持ACK集群和 ACK Serverless集群 的应用。对于EDAS集群中使用较高版本管控组件的ACK集群,您可以参考本文档在 EDAS控制台 安装访问...

同地域跨集群迁移应用

通过在源K8s集群安装WordPress应用,并且通过发布博客的方式,将博客中的文本内容存储在盘,图片内容存储在NAS,实现应用中既有NAS数据也有盘数据。通过备份中心,将源集群的WordPress应用进行备份,然后在目标集群中恢复应用和数据...

管理MSE Ingress Controller组件

阿里容器服务ACK或 ACK Serverless集群 基于MSE原生网关提供了托管的MSE Ingress Controller。本文介绍如何在ACK或 ACK Serverless集群安装、升级和卸载MSE Ingress Controller组件。安装MSE Ingress Controller组件 方式一:创建...

管理MSE Ingress Controller组件

阿里容器服务ACK或 ACK Serverless集群 基于MSE原生网关提供了托管的MSE Ingress Controller。本文介绍如何在ACK或 ACK Serverless集群安装、升级和卸载MSE Ingress Controller组件。安装MSE Ingress Controller组件 方式一:创建...

Kubernetes 集群托管

Kubernetes 集群支持阿里容器服务 ACK、其他厂商提供的集群、以及企业自建 Kubernetes 集群。阿里 ACK 通过服务连接授权效即可使用。其他厂商集群或自建集群,需要集群的 API Server 公网可访问,使用集群的 kubeconfig 凭证与效...

ACK集群运行中节点安装云监控插件

ACK集群运行中节点均安装监控插件,且监控运行状态正常,视为“合规”。应用场景 当您创建、变更、删除在ACK集群节点部署的应用时,插件会自动同步应用元数据到监控,实现应用的容器监控与报警。风险等级 默认风险等级:高风险。当您...

访问Web UI

说明 关联的ACK集群需已安装Ingress组件,如果未安装Ingress组件,请先参见 常见问题 追加Ingress组件。已获取其他阿里账号或RAM用户的账号ID。操作步骤 进入配置页面。登录 EMR on ACK控制台。在EMR on ACK页面,单击目标集群操作列的 ...

使用限制

如有白名单限制需添加效 AppStack 公网IP:47.98.185.51、47.93.89.246、47.94.150.17,其中47.98.185.51 出口用于 AppStack 应用部署链路,47.93.89.246、47.94.150.17 出口用于复用 Flow 流水线能力实现集群Agent安装。OAM 版本兼容性...

管理Nginx Ingress Controller组件

方式一:创建集群安装Nginx Ingress Controller 创建ACK或 ACK Serverless集群 时,在 组件配置 阶段的 Ingress 参数配置区域,选择安装 Nginx Ingress。具体操作,请参见 创建ACK Pro版集群 或 创建集群。您可以在参数配置区域,选择...

安装Logtail组件(阿里Kubernetes集群

安装Logtail 您可以为已有的Kubernetes集群安装Logtail组件,也可以在创建Kubernetes集群时选中 使用日志服务,安装Logtail组件。为已有的Kubernetes集群安装Logtail组件 重要 此操作仅适用于专有版Kubernetes和托管版Kubernetes。如果您要...

入门概述

您可以安装GROMACS软件、PBS调度,选择ecs.gn5-c4g1.xlarge规格的计算节点来创建集群。创建用户 您必须提前创建用户,用于在集群中提交作业时标识身份。创建成功后,您可以使用该用户管理集群、提交作业等。创建作业 作业指提交到E-HPC...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
GPU云服务器 云数据库专属集群 开源大数据平台 E-MapReduce 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用