[帮助文档] 使用ACK Pro大规模集群的建议_容器服务 Kubernetes 版_容器服务Kubernetes版(ACK)

ACK Pro大规模集群中的资源数量、资源访问频率等对集群可用性及性能影响较大。集群管理者需要密切关注集群规模变化,合理设计和使用规模化集群,以确保集群可靠运行工作负载。本文介绍使用ACK Pro大规模集群时需要了解的重要信息和使用建议。

[帮助文档] 优化大规模Tewary集群的网络性能_容器服务 Kubernetes 版_容器服务Kubernetes版(ACK)

在Terway的集群中,可以使用NetworkPolicy来控制Pod之间的访问。当Terway的集群节点数量增加到100以上时,NetworkPolicy的代理会给Kubernetes的管控造成不小的压力,所以需要对NetworkPolicy做针对大规模集群的优化调整。本文介绍如何优化大规模Ter...

使用ASK容器化部署大语言模型FastChat

1 课时 |
16 人已学 |
免费

如何在 ACK 中使用 MSE Ingress

1 课时 |
114 人已学 |
免费

从概念、部署到优化,Kubernetes Ingress 网关的落地实践

1 课时 |
188 人已学 |
免费
开发者课程背景图
阿里云 ACK 云上大规模 Kubernetes 集群高可靠性保障实战

阿里云 ACK 云上大规模 Kubernetes 集群高可靠性保障实战

作者:贤维 马建波 古九 五花 刘佳旭01 引言2023 年 7 月,阿里云容器服务 ACK 成为首批通过中国信通院“云服务稳定运行能力-容器集群稳定性”评估的产品, 并荣获“先进级”认证。随着 ACK 在生产环境中的采用率越来越高,稳定性保障已成为基本诉求。本文基于 ACK 稳定性保障实践经验,帮...

OpenKruise 成为 CNCF 孵化项目:为大规模采用 Kubernetes 打开大门

OpenKruise 成为 CNCF 孵化项目:为大规模采用 Kubernetes 打开大门

作者:OpenKruise 社区近期,CNCF Technical Oversight Committee(TOC)根据 OpenKruise 的发展以及社区的接受程度,通过投票决定将 OpenKruise 升级为 CNCF 孵化项目。OpenKruise[1]是一个扩展的组件套件,专注于应用程序自...

大规模 Kubernetes 集群故障注入的利器-ChaosBlade

大规模 Kubernetes 集群故障注入的利器-ChaosBlade

作者:叶飞ChaosBlade随着云原生的发展,云原生应用一致性、可靠性、灵活编排的能力让大部分企业选择将应用往云上迁移,但同时云基础设施在稳定性、可观测、也接受的强大的考验。ChaosBlade 是阿里巴巴开源的一款遵循混沌工程原理和混沌实验模型的实验注入工具,帮助企业提升分布式系统的容错能力,并...

用更云原生的方式做诊断|大规模 K8s 集群诊断利器深度解析

用更云原生的方式做诊断|大规模 K8s 集群诊断利器深度解析

背景通常而言,集群的稳定性决定了一个平台的服务质量以及对外口碑,当一个平台管理了相当规模数量的 Kubernetes 集群之后,在稳定性这件事上也许会“稍显被动”。我们可能经常会遇到这样的场景:客户一个电话,火急火燎地说业务出现问题了,你们平台快帮忙查询一下是不是哪里出了问题呀?技术同学连忙放下手头...

蚂蚁大规模 Kubernetes 集群无损升级实践指南【探索篇】

蚂蚁大规模 Kubernetes 集群无损升级实践指南【探索篇】

文|王连平(花名:烨川 )蚂蚁集团高级开发工程师负责蚂蚁 Kubernetes 集群容器交付,专注于集群交付能力、交付性能及交付 Trace 等相关领域本文 12623 字 阅读 20 分钟—— 庖丁解牛,让升级不再烦恼PART. 1 背 景蚂蚁 Sigma 作为蚂蚁集团核心的基础设施,经过多年的发...

大规模 K8s 集群管理经验分享 · 上篇

大规模 K8s 集群管理经验分享 · 上篇

11 月 23 日,Erda 与 OSCHINA 社区联手发起了【高手问答第 271 期 -- 聊聊大规模 K8s 集群管理】,目前问答活动已持续一周,由 Erda SRE 团队负责人骆冰利为大家解答,以下是本次活动的部分问题整理合集,其他问题也将于近期整理后发布,敬请期待!Q1:K8s 上面部署不...

面对大规模 K8s 集群,如何先于用户发现问题?

面对大规模 K8s 集群,如何先于用户发现问题?

作者 | 彭南光(光南)来源 | 阿里巴巴云原生公众号千里之堤,溃于蚁穴。绪论不知道大家是否经历过这样的情景:突然被用户告知系统出现问题,然后一脸懵地惶惶然排查修复;或是等到自己发现系统出现故障时,实际已经对用户造成了严重的恶劣影响。所谓千里之堤,溃于蚁穴。用户信任的建立是长期而艰难的,然而要摧毁这...

在大规模 Kubernetes 集群上实现高 SLO 的方法

在大规模 Kubernetes 集群上实现高 SLO 的方法

作者 | 蚂蚁金服技术专家 姚菁华;蚂蚁金服高级开发工程师 范康 导读:随着 Kubernetes 集群规模和复杂性的增加,集群越来越难以保证高效率、低延迟的交付 pod。本文将分享蚂蚁金服在设计 SLO 架构和实现高 SLO 的方法和经验。 Why SLO? Gartner 对...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云容器服务 ACK
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
234772+人已加入
加入
相关电子书
更多
智算时代,基于 Kubernetes 落地云原生 AI
ACK云上大规模Kubernetes集群高可靠性保障实战
Kubernetes在大规模场景下的service性能优化实战
立即下载 立即下载 立即下载
相关镜像