Linux实例负载高问题排查和异常处理

sar是Linux系统中较为全面的性能分析工具,可以从多个方面对系统的活动进行监控和报告,包括文件读写情况、系统调用使用情况、串口、CPU效率、内存使用情况、进程活动及IPC(Inter-Process Communication,进程间通信)等。安装sar工具 ...

内核功能与接口概述

内存 文档链接 支持版本 说明 Memcg Exstat功能 Alibaba Cloud Linux 2内核版本 4.19.91-18.al7 及以上 Alibaba Cloud Linux 3所有内核版本 Alibaba Cloud Linux所支持的Memcg Exstat功能,相较于社区版内核额外在cgroup v1接口支持了...

节点异常问题排查

在 Prometheus监控 页面,单击 节点监控 页签,在 集群节点监控详情 页面选择待查看的节点,可查看对应节点的CPU、内存、磁盘等监控信息。检查节点的安全组 关于如何检查节点的安全组,请参见 安全组概述 和 配置集群安全组。Kubelet异常...

Linux系统的ECS实例的系统、内存进程出现异常,查看...

问题现象 Linux系统的ECS实例的系统、内存进程出现异常,通过查看系统日志提示"page allocation failure"错误,表示系统因内存不足导致无法为新的内存页分配内存空间,内存页分配失败。什么是内存内存页(Memory Page)是操作系统中对...

节点异常问题排查

journalctl-u chronyd 检查节点的监控监控 阿里云容器服务ACK集群集成了监控服务,可登录 云监控控制台 查看对应ECS实例的基本监控信息,关于云监控节点的使用方式,请参见 监控节点。Prometheus监控 登录 容器服务管理控制台。在控制台...

系统类故障排查

“total”指总计物理(swap)内存的大小,“used”指已使用物理内存(swap)的大小,“free”指可用的物理内存(swap)大小,“shared”指多个进程共享的内存总额,“buff/cache”指磁盘的缓存大小,“available”指可以被新应用程序使用的...

为什么应用运行时进程突然消失了?

这个问题通常由操作系统物理内存耗尽或应用运行的Java虚拟机进程Crash导致,本文以Linux操作系统为例说明如何解决。操作系统物理内存耗尽,触发操作系统OOM Killer 当操作系统物理内存和交换空间不够用时,操作系统的OOM Killer机制(默认...

Alibaba Cloud Linux 3镜像发布记录

阿里云定期发布Alibaba Cloud Linux 3镜像的更新版本,以确保用户可以获取到最新的操作系统特性、功能和安全补丁。您可以通过本文查看Alibaba Cloud Linux 3镜像最新的可用版本及更新内容。背景信息 如无特殊声明,更新内容适用于云服务器...

内存诊断

进程内存 以进程维度按内存大小排序,并分解成匿名内存、文件缓存和共享内存。Pod内存 Pod内存分析功能够解析容器组和容器内部文件缓存和共享内存对应的文件,以及文件缓存活跃和非活跃的占比。检查项 说明 Pod Pod名称。容器 容器名称。...

系统运维工具集SysAK使用说明

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。运维场景 阿里云通过对百万服务器运维经验...

THP reclaim功能

} 在测试过程中,您可以在另一台终端通过 dmesg-wH 命令同步监控系统是否发生OOM事件和内存使用情况。测试结果根据THP reclaim功能的开启状态有所不同:THP reclaim功能开启:进程申请透明大页过程中,THP reclaim会把前序申请的透明大页拆...

Alibaba Cloud Linux 2镜像发布记录

阿里云定期发布Alibaba Cloud Linux 2镜像的更新版本,以确保用户可以获取到最新的操作系统特性、功能和安全补丁。您可以通过本文查看Alibaba Cloud Linux 2镜像最新的可用版本及更新内容。背景信息 如无特殊声明,更新内容适用于云服务器...

如何查看Linux系统I/O负载情况?

查看磁盘I/O负载 使用iostat从系统纬度查看磁盘IO负载 iostat是一款Linux系统中监控I/O性能的工具,可以从系统纬度查看磁盘I/O负载情况。执行如下命令,安装iostat。yum install sysstat 执行如下命令,查看I/O负载。iostat-d-k 3 5 说明-d...

Linux系统CPU使用率和负载高排查方法

vmstat top ps-aux ps-ef vmstat命令的使用 vmstat(VirtualMeomoryStatistics,虚拟内存统计),通过vmstat命令,从系统维度查看操作系统的虚拟内存进程、CPU等的整体情况。vmstat命令 常用vmstat命令如下所示。vmstat[-n][delay[count]...

Linux系统的ECS实例CPU使用率或CPU负载较高问题的排查...

vmstat top ps-aux ps-ef vmstat命令的使用 vmstat(VirtualMeomoryStatistics,虚拟内存统计),通过vmstat命令,从系统维度查看操作系统的虚拟内存进程、CPU等的整体情况。vmstat命令 常用vmstat命令如下所示。vmstat[-n][delay[count]...

启动、停止或者卸载云助手Agent

etc/init.d/aliyun-service restart 卸载云助手守护进程Linux实例)云助手守护进程用于监控 云助手Agent 的资源消耗情况,上报 云助手Agent 的运行状态,以及当 云助手Agent 崩溃时重启客户端。您在卸载 云助手Agent 前,需要先卸载云...

查看实例监控信息

实例是否安装云监控插件会导致在ECS管理控制台查看到的监控数据不同:实例已安装云监控插件:ECS管理控制台的监控项中,CPU、内存、系统负载数据为云监控的操作系统监控项,其他监控项与云监控的基础监控项一致。实例未安装云监控插件:在...

RDS PostgreSQL云盘版实例的内存利用率监控项优化

优化前:内存利用率=PostgreSQL进程占用内存/实例规格内存 优化后:内存利用率=(PostgreSQL进程占用内存+管控系统内存消耗+操作系统内存消耗)/实例规格内存 说明 相比优化前,内存实际使用量的计算更加准确:新增了管控系统内存消耗和 ...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

诊断项与诊断结果说明

开启DHCP服务进程的方法,请参见 Linux系统网络进程不存在。fstab中的设备检查 检查fstab中的设备是否存在。检查该实例的/etc/fstab 文件。如果/etc/fstab 文件中配置了不存在的设备,可能会导致实例无法启动。移除/etc/fstab 文件中不存在...

容器内存QoS

ack-koordinator为容器提供内存服务质量QoS(Quality of Service)保障能力,在确保内存资源公平性的前提下,改善应用在运行时的内存性能。本文介绍如何使用容器内存QoS功能。背景信息 容器在使用内存时主要有以下两个方面的约束:自身内存...

监控信息

说明 系统平均负载计算方法:系统平均负载值即Linux系统负载平均值,用于计算在一段时间内,一个进程或线程对系统CPU、内存或者IO等的需求。例如load_1m指过去1分钟的网关平均负载。系统平均负载值记录在Linux系统的/proc/loadavg 文件中,...

Linux服务器内存消耗过高

问题描述 Linux服务器的内存持续消耗过高,重启后可以恢复正常,但业务运行后问题依旧存在,而且没有明显高消耗内存进程存在。问题原因 slab消耗内存过多。解决方案 登录问题Linux服务器。执行free和top命令确认不存在占用大量内存进程。...

如何处理云监控插件异常停止问题?

日志主要包括监控进程的启动、停止等信息。argusagent.log:云监控插件的运行日志。Linux 以root用户登录待安装云监控插件的主机。执行以下命令,查看云监控插件日志。cd/usr/local/cloudmonitor/local_data/logs cat argusagent.log cat ...

增强容器资源可见性

从Alibaba Cloud Linux 2(内核版本 4.19.91-22.2.al7)和Alibaba Cloud Linux 3(内核版本 5.10.46-7.al8)开始,在内核层面提供了容器资源视图功能的相关接口,实现对容器资源的可见性增强。本文将对该功能的接口进行说明,并提供示例...

采集主机监控数据

日志服务Logtail支持采集主机CPU、内存、负载、磁盘、网络等监控数据。本文介绍通过Logtail采集主机监控数据的操作步骤。前提条件 已创建Project和MetricStore。具体操作,请参见 创建项目Project 和 创建MetricStore。使用限制 不支持...

2022年

新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用观测Windows。请参见 开服地域。2022年09月 功能名称 功能概述 支持地域 云服务集成中心全面改版 推出全新云服务...

2022年

v2.8.7 Prometheus监控 新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用Prometheus监控Windows。请参见 可观测监控 Prometheus 版目前支持的地域。v2.8.7 云拨测 ...

服务运维

周边技术风险能力的建设 监控能力 蚂蚁的监控平台为 Service Mesh 提供了基础的监控能力和大盘,以及应用维度的 Sidecar 监控情况,包括:系统监控:CPU MEM LOAD 业务监控:RT RPC 流量 MSG 流量 Error 日志监控 Service Mesh 进程还提供...

在cgroup v1接口开启PSI功能

cat/proc/cmdline|grep"psi=1 psi_v1=1"查询CPU、内存及IO的监控数据 当您开启cgroup v1接口的PSI功能时,CPU、内存及IO的PSI监控数据均会输出到cpuacct控制器下,您可以通过以下命令查看详细的监控数据。cat/sys/fs/cgroup/cpuacct/cpu....

查看仪表盘

中间件监控 仪表盘 说明 JVM监控 用于实时可视化展示JVM中的监控指标,包括进程运行时长、总内存、堆内存、CPU使用率等。Nginx监控 用于实时可视化展示Nginx中的监控指标,包括Processed connections、QPS等。Tomcat监控 用于实时可视化...

JVM监控

相关文档 ARMS应用监控采集的数据来自JMX,其中非堆内存所包含的内存区域比Java进程中实际的非堆内存区域少,因此可能会出现监控中堆内存+非堆内存总和与通过 top 命令看到的RES大小存在一定差值,相关细节请参见 JVM监控内存详情说明。

如何处理进程监控报警规则未被触发问题?

背景信息 云监控每分钟统计一次CPU消耗Top5的进程,记录这些进程的CPU使用率、内存使用率和打开文件数。如果您想查看非Top5的进程数,则需要先添加进程监控,再为其设置报警规则(进程监控的指标为(Agent)process.count_processname),当...

实例监控

说明 ARMS应用监控采集的数据来自JMX,其中非堆内存所包含的内存区域比Java进程中实际的非堆内存区域少,因此可能会出现监控中堆内存+非堆内存总和与通过 top 命令看到的RES大小存在一定差值,相关细节请参见 JVM监控内存详情说明。...

Linux实例存在OOM问题的处理方法

信息点 获取途径 备注 OOM发生的时间和频率 Linux系统日志 您的业务应用日志 Linux系统日志路径如下:/var/log/message Linux实例的系统负载情况 云监控 负载查询工具 推荐使用云监控查询您的ECS实例负载信息。如果您没有使用云监控产品,...

无侵入观测概述

K8s进程过滤 支持通过Pod名称正则匹配指定需要监控的Pod容器进程。支持通过Pod名称正则匹配排除不需要监控的Pod容器进程。支持通过Namespace名称正则匹配指定需要监控的容器进程。支持通过Namespace名称正则匹配排除不需要监控的容器进程。...

功能特性

Node.js 性能平台提供下列功能:性能监控 系统层面 针对服务器(物理机、虚拟机、Docker 等)级别,提供如下监控指标:内存使用 CPU 使用率 系统负载 系统 QPS 硬性性能指标 磁盘使用率 GC 统计 …… 进程层面 针对每个 Node.js 进程,提供...

出现OOM Killer的原因及解决方案

Linux操作系统内存不足时,会先触发内存回收机制释放内存,并将这部分被释放的内存分配给其他进程。如果内存回收机制不能处理系统内存不足的情况,则系统会触发OOM Killer(Out of Memory Killer)强制释放进程占用的内存,达到给系统解压...

守护进程集(Daemonsets)

守护进程集(Daemonsets)确保全部(或者部分)节点都运行一个 Pod 实例,支持实例动态添加到新节点。您可以通过 YAML 方式创建守护进程集(Daemonsets)。完成创建后,还可以对其执行监控、删除等操作。说明 Daemonsets 是 kubernetes ...

如何解决Alibaba Cloud Linux 2中polkit内存泄露问题...

polkit是Linux系统中一个用于控制系统范围内权限的组件,它通常作为守护进程运行,并且与系统安全相关,所以polkit内存泄露可能导致安全问题和性能下降。本文介绍如何解决Alibaba Cloud Linux 2中polkit内存泄露问题。问题现象 符合以下...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 应用实时监控服务 视图计算 云数据库 RDS 轻量应用服务器 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用