容器服务ACK(Alibaba Cloud Container Service for Kubernetes)是阿里云所提供的高性能的容器应用管理服务。通过ADP平台,您可以将产品直接交付到容器服务ACK的集群中。适用场景 适用于在阿里云线上进行POC/正式交付的场景,相比较使用...
场景描述 本方案适用于AI图片训练场景,使用CPFS和NAS作为共享存储,利用容器服务Kubernetes版管理GPU云服务器集群进行图片AI训练。解决问题 搭建AI图片训练基础环境。使用CPFS存储训练数据。使用飞天AI加速训练工具加速训练。使用Arena一...
本方案使用了SCC超级计算集群,采用弹性裸金属GPU服务器、并行文件系统CPFS、RDMA网络、阿里云容器服务Kubernetes版和飞天AI加速训练工具,提供性能稳定的训练环境,保障业务能力。解决问题 搭建AI图片训练基础环境。使用CPFS存储训练数据...
本文介绍基于弹性计算的AI推理的场景描述、解决问题、架构...使用容器服务Kubernetes版构建推理环境。使用NAS存储模型数据。使用飞天AI加速推理工具加速推理。架构图 参考链接 有关基于弹性计算的AI推理的详情,请参见 基于弹性计算的AI推理。
本文介绍通过为注册集群安装ack-co-scheduler组件的方式,以实现在您的本地集群中使用阿里云容器服务ACK的调度能力,让您能够便捷地使用容器服务对于大数据、AI等应用扩展出的差异化能力,提高应用的运行效率。前提条件 已创建注册集群,并...
Knative中提供了开箱即用、基于流量请求的KPA功能。本视频介绍如何在ACK中基于流量请求数实现服务自动扩缩容。更多信息,请参见 基于流量请求数实现服务自动扩缩容。
本文介绍如何通过阿里云容器服务Ingress Controller实现gRPC协议的服务后端的路由功能。背景信息 gRPC是Google开源的一个高性能RPC通信框架,通过 Protocol Buffers 作为其IDL,在不同语言开发的平台上使用,同时gRPC基于HTTP/2协议实现,...
针对不同集群和插件类型,添加 ResizeDisk 权限的步骤如下:专有版集群(CSI插件)登录 容器服务管理控制台。在控制台左侧导航栏中,单击 集群。在 集群列表 页面,选中目标集群,并在目标集群右侧 操作 列下,单击 详情。在集群管理页左侧...
本文介绍如何使用ack-autoscaling-placeholder实现容器秒级伸缩。前提条件 您已为ACK集群开通自动伸缩。关于开通自动伸缩的操作步骤,请参见 节点自动伸缩。操作步骤 登录 容器服务管理控制台,在左侧导航栏选择 市场>应用市场。在 应用...
本文介绍如何使用ack-autoscaling-placeholder实现容器秒级伸缩。前提条件 您已为ACK集群开通自动伸缩。关于开通自动伸缩的操作步骤,请参见 节点自动伸缩。操作步骤 登录 容器服务管理控制台。在控制台左侧导航栏,选择 市场>应用市场。在...
ACK集群也提供ACK autoscaler组件实现自动伸缩功能,根据集群中工作负载的实际需要自动调整节点数量。Ray autoscaler与ACK autoscaler弹性功能的结合能更充分地发挥云的弹性能力,提高计算资源供给效率和性价比。前提条件 已 基于ACK创建...
ACK One 整合了ArgoCD GitOps的能力,同时结合渐进式发布组件Argo Rollouts,通过Git Commit实现全自动的金丝雀发布。本文介绍如何通过ACK One GitOps结合Argo Rollouts组件快速构建应用的金丝雀发布能力。前提条件 已开启舰队管理功能。...
登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 运维管理>组件管理。在 组件管理 页面,单击 应用管理 页签,然后在 ack-kruise 卡片右下方,单击 安装。在弹出的对话框...
步骤二:为服务接入日志采集 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 集群信息。在集群信息页面,单击 集群资源 页签,然后单击 日志服务 Project 右侧的链接。在...
本文为您介绍如何通过SAG vCPE将已经部署在用户云下网络环境中的K8s集群接入阿里云ACK,实现云上云下网络互通。前提条件 您已具备操作IDC网络管理和配置的权限。具体可以咨询IDC管理员。您已经在阿里云平台创建了专有网络VPC(Virtual ...
在 连接到Kubernetes集群 对话框,集群类型 选择 容器服务集群,选择需要连接的集群,然后单击 保存。如果您没有进行过授权,可以单击 去授权,完成集群授权后,再进行集群选择。配置 YAML路径。本文配置为 app-configs/knative。配置 变量...
本文介绍如何部署 阿里云Prometheus 监控,并结合示例说明如何通过 阿里云Prometheus 监控观测GPU指标,实现容器的弹性伸缩。前提条件 您已 创建GPU集群 或已 创建专有GPU集群。功能介绍 在高性能计算领域,例如深度学习模型训练、推理等...
本文介绍如何部署 阿里云Prometheus 监控,并结合示例说明如何通过 阿里云Prometheus 监控观测GPU指标,实现容器的弹性伸缩。前提条件 您已 创建GPU集群 或已 创建专有GPU集群。功能介绍 在高性能计算领域,例如深度学习模型训练、推理等...
通过使用阿里云cGPU技术,您可以将GPU利用率不高的应用容器化部署在一块GPU卡上,实现资源利用率提升并且降低成本,且保持对高负载应用的资源保障。...架构图 参考链接 有关ACK实现GPU成本优化的详情,请参见 ACK实现GPU成本优化。
具体操作,请参见 创建Kubernetes托管版集群、创建Kubernetes专有版集群、容器服务 Serverless 版使用快速入门。已创建两个不同可用区的交换机,且与集群处于同一VPC。具体操作,请参见 创建和管理交换机。已为集群安装ALB Ingress ...
步骤一:安装kritis-validation-hook组件 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 运维管理>组件管理。在 组件管理 页面,单击 安全 页签,找到 kritis-validation-...
当容器发生宕机故障时,有状态服务容器存储的业务数据存在着丢失和不可靠等风险。使用持久化存储可以解决该问题。本文介绍如何使用OSS实现持久化存储。背景信息 阿里云对象存储服务(OSS)提供海量、安全、低成本、高可靠的云存储服务。OSS...
在 容器服务管理控制台 通过Knative把消息处理部署到ECI类型的工作负载。在集群管理页左侧导航栏中,选择 应用>Knative。在Knative页面,单击 服务管理 页签,然后单击 使用模板创建。从 命名空间 下拉列表中,选择 default。从 示例模板 ...
步骤二:获取 日志服务 Project 的ID,以备后续使用 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 集群信息。在 集群信息 页面,单击 集群资源 页签,复制保存 日志服务 ...
通过ACK One的服务网格功能,您可以实现多集群的一站式应用分发和流量治理。本文介绍如何通过ACK One Fleet实例完成关联集群之间的应用分发和流量治理。前提条件 ACK One Fleet实例已开启 服务网格。具体操作,请参见 开启服务网格。已添加...
容器服务 Kubernetes 版 支持基于GPU指标进行弹性伸缩。您可以利用Prometheus采集GPU的实时利用率和显存使用情况等关键指标。然后通过Prometheus Adapter将这些指标转换为Kubernetes可识别的metrics格式,并与AHPA集成。AHPA可以根据从...
步骤一:部署Knative Service 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 应用>Knative。在 Knative 页面的 服务管理 页签下,选择 命名空间 为 default,然后单击 ...
设置多卡共享策略 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 工作负载>任务。在页面右上角,单击 使用YAML创建资源。将以下内容拷贝至 模板 区域,然后单击 创建。...
后端转发服务器组支持通过服务名称或服务器组ID挂载,实现K8s集群内Pod和集群外ECS实例混合挂载。通过ALB和云企业网CEN(Cloud Enterprise Network)转发路由器等产品的组合配置,可以使ALB将请求转发至其他地域VPC内的服务器,实现跨地域...
后端转发服务器组支持通过服务名称或服务器组ID挂载,实现K8s集群内Pod和集群外ECS实例混合挂载。通过ALB和云企业网CEN(Cloud Enterprise Network)转发路由器等产品的组合配置,可以使ALB将请求转发至其他地域VPC内的服务器,实现跨地域...
更多信息,请参见 ARMS OpenTelemetry Collector 步骤二:在Ingress中开启可观测链路 OpenTelemetry 版服务 登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...
Kube Controller Manager限流调整 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 运维管理>组件管理。在 组件管理 页面的 核心组件 页签,定位到 Kube Controller Manager...
因此,阿里云容器服务ACK联合RAM访问控制服务推出了RRSA功能。基于RRSA功能,您可以在集群内实现应用隔离的RAM角色功能。各个应用可以扮演独立的RAM角色并使用获取的临时凭证访问云资源,以实现应用RAM权限最小化。在多租场景下,RRSA功能...
因此,阿里云容器服务ACK联合RAM访问控制服务推出了RRSA功能。基于RRSA功能,您可以在集群内实现Pod级别隔离的应用关联RAM角色功能。各个应用可以扮演独立的RAM角色并使用获取的临时凭证访问云资源,从而实现应用RAM权限最小化以及无...
步骤一:部署MSE网关 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 应用>Knative。在 组件管理 页签,单击 一键部署Knative。在部署Knative页面,选择 MSE 服务网关,...
本文介绍了如何在Knative上实现GitHub事件处理。前提条件 您已经成功部署Serving组件、Eventing组件及add-on组件,参见 部署Knative组件。您已经在Knative上自定义域名并完成域名配置。参见 在Knative使用自定义域名。步骤一:创建服务 ...
本视频介绍如何基于ACK查看集群成本分析及集群成本分析的能力,加速企业FinOps进程。更多信息,请参见 成本洞察概述。
步骤一:设置Terway的配置文件eni-config 通过控制台设置Terway的配置文件eni-config 登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 详情。编辑Terway的配置...
步骤一:部署MSE网关 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 应用>Knative。在 组件管理 页签,单击 一键部署Knative。在部署Knative页面,选择 MSE 服务网关,...
本文介绍如何基于流量请求数实现服务自动扩缩容。前提条件 已创建 ACK托管集群 或 ACK Serverless集群,且集群版本为1.20及以上。具体操作,请参见 已创建Kubernetes托管版集群、已创建ACK Serverless集群。实现原理 Knative Serving会为每...