基于容器服务ACK实现线上交付

容器服务ACK(Alibaba Cloud Container Service for Kubernetes)是阿里云所提供的高性能的容器应用管理服务。通过ADP平台,您可以将产品直接交付到容器服务ACK的集群中。适用场景 适用于在阿里云线上进行POC/正式交付的场景,相比较使用...

ACK集群实现GPU AI模型训练

场景描述 本方案适用于AI图片训练场景,使用CPFS和NAS作为共享存储,利用容器服务Kubernetes版管理GPU云服务器集群进行图片AI训练。解决问题 搭建AI图片训练基础环境。使用CPFS存储训练数据。使用飞天AI加速训练工具加速训练。使用Arena一...

ACK集群实现弹性裸金属AI训练

本方案使用了SCC超级计算集群,采用弹性裸金属GPU服务器、并行文件系统CPFS、RDMA网络、阿里云容器服务Kubernetes版和飞天AI加速训练工具,提供性能稳定的训练环境,保障业务能力。解决问题 搭建AI图片训练基础环境。使用CPFS存储训练数据...

ACK集群实现基于弹性计算的AI推理

本文介绍基于弹性计算的AI推理的场景描述、解决问题、架构...使用容器服务Kubernetes版构建推理环境。使用NAS存储模型数据。使用飞天AI加速推理工具加速推理。架构图 参考链接 有关基于弹性计算的AI推理的详情,请参见 基于弹性计算的AI推理。

通过ack-co-scheduler组件实现协同调度

本文介绍通过为注册集群安装ack-co-scheduler组件的方式,以实现在您的本地集群中使用阿里云容器服务ACK的调度能力,让您能够便捷地使用容器服务对于大数据、AI等应用扩展出的差异化能力,提高应用的运行效率。前提条件 已创建注册集群,并...

第11课:容器弹性-使用Knative on ACK实现基于请求的...

Knative中提供了开箱即用、基于流量请求的KPA功能。本视频介绍如何在ACK中基于流量请求数实现服务自动扩缩容。更多信息,请参见 基于流量请求数实现服务自动扩缩容。

通过Ingress Controller实现gRPC服务访问

本文介绍如何通过阿里云容器服务Ingress Controller实现gRPC协议的服务后端的路由功能。背景信息 gRPC是Google开源的一个高性能RPC通信框架,通过 Protocol Buffers 作为其IDL,在不同语言开发的平台上使用,同时gRPC基于HTTP/2协议实现,...

ACK实现Flexvolume云盘在线扩容

针对不同集群和插件类型,添加 ResizeDisk 权限的步骤如下:专有版集群(CSI插件)登录 容器服务管理控制台。在控制台左侧导航栏中,单击 集群。在 集群列表 页面,选中目标集群,并在目标集群右侧 操作 列下,单击 详情。在集群管理页左侧...

基于ack-autoscaling-placeholder实现容器秒级伸缩

本文介绍如何使用ack-autoscaling-placeholder实现容器秒级伸缩。前提条件 您已为ACK集群开通自动伸缩。关于开通自动伸缩的操作步骤,请参见 节点自动伸缩。操作步骤 登录 容器服务管理控制台,在左侧导航栏选择 市场>应用市场。在 应用...

使用ack-autoscaling-placeholder实现容器秒级伸缩

本文介绍如何使用ack-autoscaling-placeholder实现容器秒级伸缩。前提条件 您已为ACK集群开通自动伸缩。关于开通自动伸缩的操作步骤,请参见 节点自动伸缩。操作步骤 登录 容器服务管理控制台。在控制台左侧导航栏,选择 市场>应用市场。在...

基于Ray autoscaler与ACK autoscaler实现弹性伸缩

ACK集群也提供ACK autoscaler组件实现自动伸缩功能,根据集群中工作负载的实际需要自动调整节点数量。Ray autoscaler与ACK autoscaler弹性功能的结合能更充分地发挥云的弹性能力,提高计算资源供给效率和性价比。前提条件 已 基于ACK创建...

基于ACK One Gitops使用Argo Rollouts实现金丝雀发布

ACK One 整合了ArgoCD GitOps的能力,同时结合渐进式发布组件Argo Rollouts,通过Git Commit实现全自动的金丝雀发布。本文介绍如何通过ACK One GitOps结合Argo Rollouts组件快速构建应用的金丝雀发布能力。前提条件 已开启舰队管理功能。...

基于ACK One Gitops使用Kruise Rollout实现金丝雀发布

登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 运维管理>组件管理。在 组件管理 页面,单击 应用管理 页签,然后在 ack-kruise 卡片右下方,单击 安装。在弹出的对话框...

在Knative上实现日志采集

步骤二:为服务接入日志采集 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 集群信息。在集群信息页面,单击 集群资源 页签,然后单击 日志服务 Project 右侧的链接。在...

通过SAG vCPE实现云上ACK与云下K8s集群互通

本文为您介绍如何通过SAG vCPE将已经部署在用户云下网络环境中的K8s集群接入阿里云ACK实现云上云下网络互通。前提条件 您已具备操作IDC网络管理和配置的权限。具体可以咨询IDC管理员。您已经在阿里云平台创建了专有网络VPC(Virtual ...

通过云效实现Knative服务持续交付

在 连接到Kubernetes集群 对话框,集群类型 选择 容器服务集群,选择需要连接的集群,然后单击 保存。如果您没有进行过授权,可以单击 去授权,完成集群授权后,再进行集群选择。配置 YAML路径。本文配置为 app-configs/knative。配置 变量...

基于GPU指标实现弹性伸缩

本文介绍如何部署 阿里云Prometheus 监控,并结合示例说明如何通过 阿里云Prometheus 监控观测GPU指标,实现容器的弹性伸缩。前提条件 您已 创建GPU集群 或已 创建专有GPU集群。功能介绍 在高性能计算领域,例如深度学习模型训练、推理等...

基于GPU指标实现弹性伸缩

本文介绍如何部署 阿里云Prometheus 监控,并结合示例说明如何通过 阿里云Prometheus 监控观测GPU指标,实现容器的弹性伸缩。前提条件 您已 创建GPU集群 或已 创建专有GPU集群。功能介绍 在高性能计算领域,例如深度学习模型训练、推理等...

ACK集群实现GPU成本优化

通过使用阿里云cGPU技术,您可以将GPU利用率不高的应用容器化部署在一块GPU卡上,实现资源利用率提升并且降低成本,且保持对高负载应用的资源保障。...架构图 参考链接 有关ACK实现GPU成本优化的详情,请参见 ACK实现GPU成本优化。

通过ALB Ingress实现灰度发布

具体操作,请参见 创建Kubernetes托管版集群、创建Kubernetes专有版集群、容器服务 Serverless 版使用快速入门。已创建两个不同可用区的交换机,且与集群处于同一VPC。具体操作,请参见 创建和管理交换机。已为集群安装ALB Ingress ...

使用kritis-validation-hook组件实现自动验证容器镜像...

步骤一:安装kritis-validation-hook组件 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 运维管理>组件管理。在 组件管理 页面,单击 安全 页签,找到 kritis-validation-...

使用OSS实现持久化存储-Flexvolume

当容器发生宕机故障时,有状态服务容器存储的业务数据存在着丢失和不可靠等风险。使用持久化存储可以解决该问题。本文介绍如何使用OSS实现持久化存储。背景信息 阿里云对象存储服务(OSS)提供海量、安全、低成本、高可靠的云存储服务。OSS...

通过Knative事件驱动实现消息发送

容器服务管理控制台 通过Knative把消息处理部署到ECI类型的工作负载。在集群管理页左侧导航栏中,选择 应用>Knative。在Knative页面,单击 服务管理 页签,然后单击 使用模板创建。从 命名空间 下拉列表中,选择 default。从 示例模板 ...

通过Albconfig开启Xtrace实现链路追踪

步骤二:获取 日志服务 Project 的ID,以备后续使用 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 集群信息。在 集群信息 页面,单击 集群资源 页签,复制保存 日志服务 ...

基于ASM实现多集群的一站式流量治理

通过ACK One的服务网格功能,您可以实现多集群的一站式应用分发和流量治理。本文介绍如何通过ACK One Fleet实例完成关联集群之间的应用分发和流量治理。前提条件 ACK One Fleet实例已开启 服务网格。具体操作,请参见 开启服务网格。已添加...

基于GPU指标实现AHPA弹性预测

容器服务 Kubernetes 版 支持基于GPU指标进行弹性伸缩。您可以利用Prometheus采集GPU的实时利用率和显存使用情况等关键指标。然后通过Prometheus Adapter将这些指标转换为Kubernetes可识别的metrics格式,并与AHPA集成。AHPA可以根据从...

使用Knative实现资源自动扩缩容

步骤一:部署Knative Service 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 应用>Knative。在 Knative 页面的 服务管理 页签下,选择 命名空间 为 default,然后单击 ...

通过共享GPU调度实现多卡共享

设置多卡共享策略 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 工作负载>任务。在页面右上角,单击 使用YAML创建资源。将以下内容拷贝至 模板 区域,然后单击 创建。...

通过ALB Ingress实现混合挂载、跨地域挂载和本地IDC...

后端转发服务器组支持通过服务名称或服务器组ID挂载,实现K8s集群内Pod和集群外ECS实例混合挂载。通过ALB和云企业网CEN(Cloud Enterprise Network)转发路由器等产品的组合配置,可以使ALB将请求转发至其他地域VPC内的服务器,实现跨地域...

通过ALB Ingress实现混合挂载、跨地域挂载和本地IDC...

后端转发服务器组支持通过服务名称或服务器组ID挂载,实现K8s集群内Pod和集群外ECS实例混合挂载。通过ALB和云企业网CEN(Cloud Enterprise Network)转发路由器等产品的组合配置,可以使ALB将请求转发至其他地域VPC内的服务器,实现跨地域...

使用Nginx-Ingress-tracing实现链路追踪

更多信息,请参见 ARMS OpenTelemetry Collector 步骤二:在Ingress中开启可观测链路 OpenTelemetry 版服务 登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...

使用ContainerOS实现节点极速扩容

Kube Controller Manager限流调整 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 运维管理>组件管理。在 组件管理 页面的 核心组件 页签,定位到 Kube Controller Manager...

通过RRSA配置ServiceAccount的RAM权限实现Pod权限隔离

因此,阿里云容器服务ACK联合RAM访问控制服务推出了RRSA功能。基于RRSA功能,您可以在集群内实现应用隔离的RAM角色功能。各个应用可以扮演独立的RAM角色并使用获取的临时凭证访问云资源,以实现应用RAM权限最小化。在多租场景下,RRSA功能...

通过RRSA配置ServiceAccount的RAM权限实现Pod权限隔离

因此,阿里云容器服务ACK联合RAM访问控制服务推出了RRSA功能。基于RRSA功能,您可以在集群内实现Pod级别隔离的应用关联RAM角色功能。各个应用可以扮演独立的RAM角色并使用获取的临时凭证访问云资源,从而实现应用RAM权限最小化以及无...

在Knative中使用MSE网关实现自动弹性

步骤一:部署MSE网关 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 应用>Knative。在 组件管理 页签,单击 一键部署Knative。在部署Knative页面,选择 MSE 服务网关,...

在Knative上实现GitHub事件处理

本文介绍了如何在Knative上实现GitHub事件处理。前提条件 您已经成功部署Serving组件、Eventing组件及add-on组件,参见 部署Knative组件。您已经在Knative上自定义域名并完成域名配置。参见 在Knative使用自定义域名。步骤一:创建服务 ...

第19课:容器可观测-如何基于ACK实现企业IT成本治理?

本视频介绍如何基于ACK查看集群成本分析及集群成本分析的能力,加速企业FinOps进程。更多信息,请参见 成本洞察概述。

使用ACKTerway和CiliumHubble实现网络可观测性

步骤一:设置Terway的配置文件eni-config 通过控制台设置Terway的配置文件eni-config 登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 详情。编辑Terway的配置...

在Knative中使用MSE网关实现自动弹性

步骤一:部署MSE网关 登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 应用>Knative。在 组件管理 页签,单击 一键部署Knative。在部署Knative页面,选择 MSE 服务网关,...

基于流量请求数实现服务自动扩缩容

本文介绍如何基于流量请求数实现服务自动扩缩容。前提条件 已创建 ACK托管集群 或 ACK Serverless集群,且集群版本为1.20及以上。具体操作,请参见 已创建Kubernetes托管版集群、已创建ACK Serverless集群。实现原理 Knative Serving会为每...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
容器服务 Kubernetes 版 ACK 容器镜像服务 弹性公网IP 文件存储 CPFS 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用