AIOps套件概述

为降低Kubernetes集群运维管理的难度,容器服务平台提供了AIOps套件。AIOps套件包括集群检查、集群巡检和集群诊断,可以帮助您排查问题,提升运维效率。本文介绍AIOps套件的优势、集群检查、集群巡检和集群诊断。优势 AIOps套件由集群检查...

AIOps套件概述

为降低Kubernetes集群运维管理的难度,容器服务平台提供了AIOps套件。AIOps套件包括集群检查、集群巡检和集群诊断,可以帮助您排查问题,提升运维效率。本文介绍AIOps套件优势、集群检查、集群巡检和集群诊断。索引 优势 集群检查 集群巡检...

成本套件概述

ACK提供成本套件功能,使用基于FinOps理念的云成本治理解决方案协助企业IT成本管理人员实现容器集群的资源分账、提效降本等业务场景诉求。本文介绍了成本治理FinOps解决方案和成本治理流程,快速建立云原生下IT成本治理体系。背景信息 云...

云原生AI套件概述

云原生AI套件是阿里云容器服务ACK提供的云原生AI技术和产品方案。使用云原生AI套件,您可以充分利用云原生架构和技术,在Kubernetes容器平台上快速定制化构建AI生产系统,并为AI/ML应用和系统提供全栈优化。本文介绍云原生AI套件产品架构、...

WAF支持的加密套件

自定义加密套件 CNAME接入方式下,您可以通过自定义 加密套件,只允许WAF监听支持以下一种或多种加密套件的客户端的业务请求:ECDHE-ECDSA-AES128-GCM-SHA256 ECDHE-ECDSA-AES256-GCM-SHA384 ECDHE-ECDSA-AES128-SHA256 ECDHE-ECDSA-AES256...

安装云原生AI套件

云原生AI套件支持安装在ACK Pro版集群、ACK Serverless集群Pro版、ACK Edge集群Pro版,且集群版本为1.18及以上。本文介绍如何安装云原生AI套件,以及如何安装配置云原生AI运维控制台和开发控制台。前提条件 已创建ACK Pro版集群、ACK ...

云原生AI套件计费说明

索引 计费说明:计费流程、计费组成、付费方式与计费周期、计费项及定价、计费公式及示例 查看账单明细 欠费说明 计费常见问题 计费流程 计费组成 使用云原生AI套件所产生费用=云原生AI套件费用+ACK费用+其他云产品费用 云原生AI套件费用:...

加密套件组支持的算法

全站加速 DCDN 中 全部加密算法套件 和 强加密算法套件 支持的加密算法不同,您可根据实际需求选择加密算法套件。全部加密算法套件(默认)支持的加密算法 TLS_AES_256_GCM_SHA384 TLS_CHACHA20_POLY1305_SHA256 TLS_AES_128_GCM_SHA256 ...

配置TLS版本与加密套件

支持如下加密套件,请根据需求选择:全部加密算法套件(默认):安全性较低,兼容性较高,支持的加密算法请见 CDN默认支持的TLS加密算法。强加密算法套件:安全性较高,兼容性较低,支持的加密算法:TLS_AES_256_GCM_SHA384 TLS_AES_128_GCM_...

TLS加密套件与协议版本配置

如何选择TLS加密套件组和TLS协议 业务场景 加密套件组 支持的TLS协议 特点 对兼容性要求较高,安全性要求可适当放宽的大部分网站或应用 全部加密算法套件(默认)TLS1.0、TLS1.1、TLS1.2、TLS1.3(可选)支持数量最多的加密套件和协议,...

云原生AI套件管理员运维指南

本文介绍云原生AI集群的基本运维操作,包括安装AI套件、查看资源大盘、管理用户和配额。背景信息 当部署一个云原生AI集群之后,集群管理员需要对集群资源进行划分,管理多个项目组,并可以多个维度查看集群资源的使用情况,以便及时做出...

在ACK集群中安装P2P加速套件

本文介绍如何在ACK集群中安装P2P加速套件。前提条件 创建容器镜像服务ACR企业版实例,且创建的企业版实例需为标准版或高级版。具体操作,请参见 创建企业版实例。创建ACK集群。具体操作,请参见 创建集群。确认在容器镜像服务企业版实例中...

云原生AI套件开发者使用指南

本文以开源数据集fashion-mnist任务为例,介绍开发者如何利用云原生AI套件,在ACK集群运行深度学习任务,优化分布式训练性能,调试模型效果,并最终把模型部署到ACK集群中。背景信息 云原生AI套件包括一系列可单独部署的组件(K8s Helm ...

基于ACCL优化套件进行多机训练

本文以BERT-Large模型为例,介绍如何使用ACCL优化套件进行PyTorch分布式训练。前提条件 可以访问灵骏节点并拥有管理员权限。已安装和配置GPU驱动、RDMA驱动和Docker CE。步骤一:准备容器镜像 本文推荐的镜像为 registry....

什么是性能监控套件与集群事件采集能力?

Prometheus实例 for 容器服务类型包年包月计费方式内置了性能监控套件和集成K8s事件能力,包括集成事件采集、工作负载性能监控、Ingress性能监控、CoreDNS性能监控功能。在您初次开通包年包月时购买页面会默认自动勾选,成功订购包年包月后...

什么是性能监控套件与集群事件采集能力?

Prometheus实例 for 容器服务类型包年包月计费方式内置了性能监控套件和集成K8s事件能力,包括集成事件采集、工作负载性能监控、Ingress性能监控、CoreDNS性能监控功能。在您初次开通包年包月时购买页面会默认自动勾选,成功订购包年包月后...

SLB实例的HTTPS监听使用指定的安全策略套件

SLB实例的所有HTTPS类型监听使用参数指定的安全策略套件版本,视为“合规”。应用场景 TLS安全策略用于保障公网通信数据的安全性、完整性和可靠性,高版本TLS协议的HTTPS通信安全性更高。风险等级 默认风险等级:高风险。当您使用该规则时...

【产品变更】云原生AI套件计量模式和定价方案升级公告

为了给您提供更好的体验,云原生AI套件对计量模式和定价方案进行了升级。本文介绍云原生AI套件计量模式和定价方案升级内容。升级集群规模的计量模式 云原生AI套件根据集群规模(vCPU核数和GPU卡数)计算费用。升级后的集群规模的计量模式...

【产品变更】ACK云原生AI套件商用收费与优惠活动公告

尊敬的阿里云用户,为提供更优质的服务,阿里云容器服务ACK云原生AI套件将于2022年10月10日00:00:00启动该服务的收费,并提供限时5折优惠活动帮助您更好的体验该服务,活动截止至2023年03月31日24:00:00。这些不会影响您已有组件和任务的...

在IDC或其他云厂商集群中安装P2P加速套件

本文介绍如何在IDC或其他云厂商集群中安装P2P加速套件。前提条件 创建容器镜像服务ACR企业版实例,且创建的企业版实例需为 标准版或 高级版。具体操作,请参见 创建企业版实例。确认在容器镜像服务企业版实例中配置专有网络。具体操作,请...

基于eGPU优化套件的ResNet50模型训练和推理

本文以卷积神经网络模型ResNet50的训练和推理为例,为您介绍如何通过Docker或Kubernetes使用eGPU优化套件,进行GPU容器虚拟化和资源共享。本实践中的ResNet50模型基于NVIDIA官方开源代码DeepLearningExamples实现。步骤一:准备模型和数据...

【组件升级】云原生AI套件ack-fluid组件升级公告

ack-fluid是云原生AI套件的数据缓存加速组件。当集群的ack-fluid组件版本为v1.0.6及以下,且攻击者拥有创建和修改Dataset和JuiceFSRuntime权限时,CRD资源可能被恶意修改,导致脚本注入,继而引起节点提权的安全风险。为提高安全性,建议您...

【组件升级】云原生AI套件ack-fluid组件升级公告

ack-fluid是云原生AI套件的数据缓存加速组件,默认组件版本处于v0.7.0和v0.9.6之间(包含v0.7.0和v0.9.6)的ack-fluid组件版本RBAC权限较大,存在安全风险。为提高安全性,建议您将ack-fluid组件升级至v0.9.7及以上版本。本文介绍如何升级...

【组件升级】云原生应用管理套件ack-kruise组件升级...

ack-kruise是Kubernetes的一个标准扩展,可以配合原生Kubernetes使用,并为管理应用容器、Sidecar、镜像分发等方面提供更加强大和高效的能力。组件版本处于v1.0.0和v1.3.1之间(包含v1.0.0和v1.3.1)的ack-kruise组件版本RBAC权限较大,...

视频专区

主题 视频 相关文档 云原生AI套件概述 云原生AI套件概述 如何安装ACK云原生AI套件 安装云原生AI套件 如何使用ACK共享GPU调度 共享GPU调度概述 Fluid数据加速 数据加速Fluid概述 如何安装Arena并使用Arena提交Gang Scheduling任务 安装Arena...

AI任务概述

借助ACK云原生AI套件提供的Arena命令行工具、AI负载调度、弹性数据集加速、GPU异构资源管理等基础能力,您可以在Kubernetes集群中简便、高效地运行各种AI任务,比如模型训练、测试和分析模型性能、部署模型推理服务等。本文介绍使用云原生...

模型管理

已安装云原生AI套件的 开发控制台 和 调度组件。具体操作,请参见 安装云原生AI套件。集群管理员在RAM控制台已创建RAM用户(子账号),并为该RAM用户分配和关联配额组。关于如何创建RAM用户,请参见 创建RAM用户。关于如何为RAM用户分配和...

联系我们

如果您对于云原生AI套件有任何反馈或疑问,请加入钉群(钉群号:33214567)联系我们。

创建并使用Notebook

数据科学家可以使用云原生AI套件创建Notebook(云原生AI套件提供Jupyter和VSCode两种类型的Notebook)来进行机器学习算法的开发调试,并将算法提交到ACK集群中进行训练。云原生AI套件可按用户选择,将开源JupyterLab、用户自定义的Jupyter...

部署PAI轻量化控制台

您可以在容器服务ACK的 云原生AI套件 页面,进行一键部署和操作使用。本文介绍如何部署PAI轻量化控制台。使用说明 ACK集群暂不支持同时部署PAI轻量化控制台和云原生AI套件自带的控制台(基于Arena相关功能提供的操作界面)。操作步骤 关于...

通过Kubeflow Pipelines创建工作流

云原生AI套件支持通过Kubeflow Pipelines构建和部署基于容器的可移植、可扩展的机器学习工作流。本文介绍如何通过Kubeflow Pipelines创建及查看工作流。前提条件 已创建Kubernetes集群。本文以包含GPU的Kubernetes集群为例。具体操作,请...

组件概述

云原生AI套件基于Kubernetes容器服务,以灵活、可扩展的组件化方式,为AI/ML应用和系统提供了自底向上的全栈支持和优化。云原生AI套件的核心能力组件通过Helm Chart进行部署和管理,便于进行一键部署、升级,以及自定义配置等操作。本文...
共有13条 < 1 2 3 4 ... 13 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网平台 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储
新人特惠 爆款特惠 最新活动 免费试用