如何使用Linux系统的atop监控工具

atop是一款用于监控Linux系统资源与进程的工具,能够报告所有进程的活动。其以一定的频率记录系统和进程活动,采集的数据包含CPU、内存、磁盘、网络的资源使用情况和进程运行情况,并能以日志文件的方式保存在磁盘中。对于每个进程,会显示...

内核热补丁FAQ

Alibaba Cloud Linux系统的CVE-2021-33909安全漏洞内核热补丁修复方案 Alibaba Cloud Linux 2系统的CVE-2021-22555安全漏洞内核热补丁修复方案 Alibaba Cloud Linux 2系统的ECS实例中Page Fault异常导致系统宕机 Alibaba Cloud Linux 2系统...

Alibaba Cloud Linux常见问题

已知性能问题 开启内核选项CONFIG_PARAVIRT_SPINLOCK可能导致性能问题 NFS v4.x版本中可能存在的已知问题 Alibaba Cloud Linux系统中与透明大页THP相关的性能调优方法 Alibaba Cloud Linux 3系统关闭CPU漏洞修复的方法 使用问题 Alibaba ...

如何解决Alibaba Cloud Linux 2中polkit内存泄露问题...

polkit是Linux系统中一个用于控制系统范围内权限的组件,它通常作为守护进程运行,并且与系统安全相关,所以polkit内存泄露可能导致安全问题和性能下降。本文介绍如何解决Alibaba Cloud Linux 2中polkit内存泄露问题。问题现象 符合以下...

跨目录配额创建硬链接

背景信息 Linux系统支持三种模式的磁盘配额,分别为:user quota、group quota以及project quota。前两种是针对用户和组的,最后的project quota提供一种更细粒度的磁盘配额,细化到文件系统的目录和文件,使用project id将不同的目录和...

Linux内存碎片化的应对措施

Linux系统长时间运行会出现内存碎片化的问题,本文主要提供了应对该问题的一些措施。问题现象 实例内部署的业务偶然出现响应时间过长或者系统调用时间过长,系统的 sys 指标也会相应的增高,伙伴系统会缺少高阶内存(order 大于3的内存)。...

快速构建主机监控能力

您可以从 操作系统监控、基础监控、GPU监控、进程监控、网络监控 和 云盘 监控维度查看ECS实例的监看数据。说明 您还可以通过Dashboard可视化查看ECS实例的监控数据。具体操作,请参见 查看云产品监控大盘。步骤三:开启一键报警 ECS实例...

代码大页

代码大页(Huge Pages)是基于透明大页THP(Transparent Huge Pages)进行的优化扩展,支持将应用程序和动态链接库的可执行部分放入到大页(通常是2 MB或更大...更多信息,请参见 Alibaba Cloud Linux系统中与透明大页THP相关的性能调优方法。

如何排查slab_unreclaimable内存占用高的原因?

本文介绍如何排查Alibaba Cloud Linux系统slab_unreclaimable内存占用高的原因。问题现象 在Linux实例内运行 cat/proc/meminfo|grep"SUnreclaim"命令查看SUnreclaim参数指标时,发现内存较大(例如 SUnreclaim:6069340 kB),当该内存超过...

2022年

新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用观测Windows。请参见 开服地域。2022年09月 功能名称 功能概述 支持地域 云服务集成中心全面改版 推出全新云服务...

在本地虚拟机使用Alibaba Cloud Linux镜像

seed.img镜像只包含cloud-init启动所需的配置文件,不包含Alibaba Cloud Linux系统文件。您可以通过以下两种方式生成seed.img镜像。方式一:直接下载seed.img镜像 Alibaba Cloud Linux 3和Alibaba Cloud Linux 2预先提供了seed.img镜像文件...

Alibaba Cloud Linux系统中与透明大页THP相关的性能...

本文主要介绍在Alibaba Cloud Linux系统中如何通过透明大页THP功能来提升系统的性能。THP 相关配置说明 在Alibaba Cloud Linux 2的 4.19.81-17.2 及更早的内核版本中,透明大页THP默认配置为 madvise,即限定开启透明大页THP的功能。这一...

ARMS统一告警管理最佳实践

本文介绍告警统一管理的最佳实践,以帮助企业更好地处理异构监控系统所带来的挑战和问题。背景信息 在云原生时代,企业IT基础设施的规模越来越大,越来越多的系统和服务被部署在云环境中。为了监控这些复杂的IT环境,企业通常会选择使用...

2022年

v2.8.7 Prometheus监控 新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用Prometheus监控Windows。请参见 可观测监控 Prometheus 版目前支持的地域。v2.8.7 云拨测 ...

Alibaba Cloud Linux 2系统的ECS实例中Page Fault异常...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:kernel-4.19.91-23.al7及之前的内核版本。系统宕机,且出现如下调用栈信息。[332.057218]watchdog...

Block IO限流增强监控接口

为了更方便地监控Linux block IO限流,Alibaba Cloud Linux 2(内核版本 4.19.81-17.al7 开始)和Alibaba Cloud Linux 3增加相关接口,用于增强block IO限流的监控统计能力。本文主要介绍新增接口及使用示例。背景信息 很多场景中您会用到...

前端监控场景

主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。业务痛点 定位性能瓶颈困难 当用户反馈页面...

Linux实例存在OOM问题的处理方法

信息点 获取途径 备注 OOM发生的时间和频率 Linux系统日志 您的业务应用日志 Linux系统日志路径如下:/var/log/message Linux实例的系统负载情况 云监控 负载查询工具 推荐使用云监控查询您的ECS实例负载信息。如果您没有使用云监控产品,...

使用API查询监控数据

大型企业内部通常有自建的运维监控系统,上云过程中会面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据,从而将阿里云的监控数据与现有系统进行集成。指标类监控数据查询的接口 云...

Java应用监控和诊断方案

基于ARMS的应用监控方案 ARMS提供的 应用监控 功能,脱胎于阿里巴巴内部的分布式跟踪与监控系统(内部称为“鹰眼系统”),可以在不修改任何现有代码的情况下帮助网站开发人员和运维人员解决上述问题。调用拓扑图 您可以在ARMS中看到应用的...

开始使用业务监控

适用场景 业务监控的适用场景如下所示:业务人员需要监控所关注的业务,但已有的监控系统无法表达业务语义。应用系统包含很多业务语义,运维人员需要快速配置并监控各个业务的流量数据。新业务接口上线后,接口不稳定导致出现异常或错误,...

如何处理云监控插件进程自动退出问题?

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。Windows 以...

什么是ARMS前端监控

现有的服务器端监控系统相对已经很成熟,而页面加载和页面运行时的状态监控一直比较欠缺。例如:无法第一时间获知用户访问您的站点时遇到的错误。各个国家、各个地区的用户访问您的站点的真实速度未知。每个应用内有大量的异步数据调用,而...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

Prometheus可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,同时结合Grafana可实现监控指标的展示和告警等。Prometheus和Grafana结合的方案可有效进行容器集群监控指标采集、存储、展示、告警等,能够有效帮助...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

Prometheus可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,同时结合Grafana可实现监控指标的展示和告警等。Prometheus和Grafana结合的方案可有效进行容器集群监控指标采集、存储、展示、告警等,能够有效帮助...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

接入指南

Nebula 如何使用Prometheus监控Nebula TiDB 如何使用Prometheus监控TiDB SNMP 如何使用Prometheus监控SNMP CoreDNS监控 CoreDNS性能监控组件接入 托管版CoreDNS监控 使用Terraform管理Prometheus实例的集成中心 Ingress性能监控 Ingress...

如何重启云监控C++版本插件?

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。Windows 以...

操作系统监控

云监控通过安装在阿里云主机(ECS实例)和非阿里云主机上的云监控插件,为您采集丰富的操作系统层面的监控指标,您可以为操作系统监控指标设置报警规则。当某个监控指标达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提...

如何查看Linux系统网络流量负载情况?

Linux系统中有各种查看网络流量的工具,比如sar、iftop、nethogs等,它们可以从不同的纬度来分析系统中流量信息,本文介绍如何使用sar、iftop、nethogs查看Linux系统ECS实例中网络流量负载情况。操作场景 在您使用Linux系统的ECS实例过程中...

概览

目前云监控仅支持为Linux和Windows操作系统的主机安装插件。应用场景 您可以使用主机监控功能查询主机的资源使用情况和故障指标。主机监控的应用场景如下:混合云监控解决方案 主机监控通过云监控插件采集您主机的监控项。该插件支持安装在...

通过企业监控大盘监控线下IDC的中间件

重要 您只能通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)安装云监控插件和Exporter。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。步骤一:为...

如何使用Prometheus监控SNMP

1.3.6.1.2.1.31.1.1.1.4 sysUpTime 系统最近一次re-initialized后的时间 无 SNMP监控大盘 可观测监控 Prometheus 版 默认提供了SNMP Status和SNMP Interface Detail两个大盘,主要针对if_mib场景,监控网络流量等信息。SNMP Status 主要...

如何使用Prometheus监控SNMP

1.3.6.1.2.1.31.1.1.1.4 sysUpTime 系统最近一次re-initialized后的时间 无 SNMP监控大盘 可观测监控 Prometheus 版 默认提供了SNMP Status和SNMP Interface Detail两个大盘,主要针对if_mib场景,监控网络流量等信息。SNMP Status 主要...

Alibaba Cloud Linux常见问题

Alibaba Cloud Linux系统的Overlayfs文件系统缺乏读权限导致操作失败,如何处理?Alibaba Cloud Linux 2 如何解决Alibaba Cloud Linux 2中polkit内存泄露问题?Alibaba Cloud Linux 2系统中systemd服务异常问题说明 如何避免因cgroup引起的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 视图计算 云数据库 RDS 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用