[帮助文档] 使用SysOM定位容器内存问题

为解决因容器引擎层的不透明性而导致的故障排查困难问题,阿里云容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)团队推出操作系统内核层的容器监控可观测能力,为您提供更可靠、透明的容器引擎层,助力您更顺利地进行容器化迁移。本文介绍如何使用Sys...

惊魂48小时,阿里工程师如何紧急定位线上内存泄露?

惊魂48小时,阿里工程师如何紧急定位线上内存泄露?

作者 | 朱云锋 1、问题初现 该风险隐患在2019年10月下旬某天开始浮现,不到24小时的时间里,值班同学陆续收到多个线上电话报警,显示某业务集群中分布式协调服务进程异常: 14:04:28,报警显示一台Follower意外退出当前Quorum,通过选举重新加入Quorum;16:06:35,报警...

惊魂48小时,阿里工程师如何紧急定位线上内存泄露?

阿里妹导读:云计算场景下的大规模分布式系统中,网络异常、磁盘IO异常、时钟跳变、操作系统异常乃至软件本身可能存在bugs等,均给分布式系统正确运行带来了挑战。持续的监控报警完善是打造稳定高可用分布式系统过程中非常重要的工作,这个也就要求我们研发同学从细节处入手,本文将介绍的场景是针对线上报警的一丝异...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
内存取证与IaaS云平台恶意行 为的安全监控
云服务器ECS内存增强型实例re6全新发布
立即下载 立即下载