如何使用Linux系统的atop监控工具

atop是一款用于监控Linux系统资源与进程的工具,能够报告所有进程的活动。其以一定的频率记录系统和进程活动,采集的数据包含CPU、内存、磁盘、网络的资源使用情况和进程运行情况,并能以日志文件的方式保存在磁盘中。对于每个进程,会显示...

内核热补丁FAQ

Alibaba Cloud Linux系统的CVE-2021-33909安全漏洞内核热补丁修复方案 Alibaba Cloud Linux 2系统的CVE-2021-22555安全漏洞内核热补丁修复方案 Alibaba Cloud Linux 2系统的ECS实例中Page Fault异常导致系统宕机 Alibaba Cloud Linux 2系统...

Alibaba Cloud Linux常见问题

Alibaba Cloud Linux系统中与透明大页THP相关的性能调优方法 Alibaba Cloud Linux 2系统的ECS实例挂载Overlayfs时共用挂载目录导致挂载失败 Alibaba Cloud Linux 2系统的ECS实例系统盘扩容失败,如何处理?Alibaba Cloud Linux 2系统的ECS...

监控与日志

监控站点资源 监控服务器级别资源 Linux操作系统独享云虚拟主机 除了监控站点资源的使用情况,包括站点运行情况,流量使用情况、网页空间使用情况、数据库空间使用情况外,还支持监控服务器级别的资源,包括CPU、内存和带宽等监控信息,...

ARMS统一告警管理最佳实践

本文介绍告警统一管理的最佳实践,以帮助企业更好地处理异构监控系统所带来的挑战和问题。背景信息 在云原生时代,企业IT基础设施的规模越来越大,越来越多的系统和服务被部署在云环境中。为了监控这些复杂的IT环境,企业通常会选择使用...

如何解决Alibaba Cloud Linux 2中polkit内存泄露问题...

部分旧版本的Alibaba Cloud Linux 2操作系统中,可能出现polkit内存泄露的问题。polkit是Linux系统中一个用于控制系统范围内权限的组件,它通常作为守护进程运行,并且与系统安全相关,所以polkit内存泄露可能导致安全问题和性能下降。本文...

前端监控场景

现有的Server端监控系统相对已经很成熟了,而页面加载和页面运行时的状态监控一直比较欠缺。主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况...

Java应用监控和诊断方案

基于ARMS的应用监控方案 ARMS提供的 应用监控 功能,脱胎于阿里巴巴内部的分布式跟踪与监控系统(内部称为“鹰眼系统”),可以在不修改任何现有代码的情况下帮助网站开发人员和运维人员解决上述问题。调用拓扑图 您可以在ARMS中看到应用的...

什么是ARMS前端监控

现有的服务器端监控系统相对已经很成熟,而页面加载和页面运行时的状态监控一直比较欠缺。例如:无法第一时间获知用户访问您的站点时遇到的错误。各个国家、各个地区的用户访问您的站点的真实速度未知。每个应用内有大量的异步数据调用,而...

使用API查询监控数据

大型企业内部通常有自建的运维监控系统,上云过程中会面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据,从而将阿里云的监控数据与现有系统进行集成。指标类监控数据查询的接口 云...

如何处理云监控插件进程自动退出问题?

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。Windows 以...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

Linux内存碎片化的应对措施

Linux系统长时间运行会出现内存碎片化的问题,本文主要提供了应对该问题的一些措施。问题现象 实例内部署的业务偶然出现响应时间过长或者系统调用时间过长,系统的 sys 指标也会相应的增高,伙伴系统会缺少高阶内存(order 大于3的内存)。...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

跨目录配额创建硬链接

但在实际中,某些特定场景有创建硬链接的需求,因此Alibaba Cloud Linux 2和Alibaba Cloud Linux 3提供定制接口,该接口能够绕过ext4文件系统中的约束,实现跨目录配额创建硬链接。本文主要介绍实现该功能的接口及接口示例。背景信息 Linux...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何重启云监控C++版本插件?

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。Windows 以...

在本地虚拟机使用Alibaba Cloud Linux镜像

背景信息 本文示例中,本地环境为龙蜥操作系统(下载地址为 龙蜥操作系统),使用Alibaba Cloud Linux镜像创建了KVM虚拟机,使用cloud-init初始化虚拟机系统设置,然后使用NoCloud数据源在本地建立相关配置文件,以虚拟磁盘的形式挂载到KVM...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

Prometheus可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,同时结合Grafana可实现监控指标的展示和告警等。Prometheus和Grafana结合的方案可有效进行容器集群监控指标采集、存储、展示、告警等,能够有效帮助...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

Prometheus可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,同时结合Grafana可实现监控指标的展示和告警等。Prometheus和Grafana结合的方案可有效进行容器集群监控指标采集、存储、展示、告警等,能够有效帮助...

代码大页

代码大页(Huge Pages)是基于透明大页THP(Transparent Huge Pages)进行的优化扩展,支持将应用程序和动态链接库的可执行部分放入到大页(通常是2 MB或更大...更多信息,请参见 Alibaba Cloud Linux系统中与透明大页THP相关的性能调优方法。

如何排查slab_unreclaimable内存占用高的原因?

问题现象 在Linux实例内运行 cat/proc/meminfo|grep"SUnreclaim"命令查看SUnreclaim参数指标时,发现内存较大(例如 SUnreclaim:6069340 kB),当该内存超过系统总内存大小的10%时,表示slab_unreclaimable内存占用过高,系统可能会存在...

Block IO限流增强监控接口

为了更方便地监控Linux block IO限流,Alibaba Cloud Linux 2(内核版本 4.19.81-17.al7 开始)和Alibaba Cloud Linux 3增加相关接口,用于增强block IO限流的监控统计能力。本文主要介绍新增接口及使用示例。背景信息 很多场景中您会用到...

Alibaba Cloud Linux系统中与透明大页THP相关的性能...

本文主要介绍在Alibaba Cloud Linux系统中如何通过透明大页THP功能来提升系统的性能。THP 相关配置说明 在Alibaba Cloud Linux 2的 4.19.81-17.2 及更早的内核版本中,透明大页THP默认配置为 madvise,即限定开启透明大页THP的功能。这一...

快速构建主机监控能力

主机监控是维护和管理IT系统的重中之重,您可以借助云监控快速构建主机监控能力。对于已安装云监控插件的阿里云主机(ECS实例),您可以通过 主机监控 以可视化的方式查看其监控数据,也可以通过一键报警为主机的关键指标快速设置报警规则...

Alibaba Cloud Linux 2系统的ECS实例中Page Fault异常...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:kernel-4.19.91-23.al7及之前的内核版本。系统宕机,且出现如下调用栈信息。[332.057218]watchdog...

2022年

新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用观测Windows。请参见 开服地域。2022年09月 功能名称 功能概述 支持地域 云服务集成中心全面改版 推出全新云服务...

2022年

v2.8.7 Prometheus监控 新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用Prometheus监控Windows。请参见 可观测监控 Prometheus 版目前支持的地域。v2.8.7 云拨测 ...

Linux实例存在OOM问题的处理方法

信息点 获取途径 备注 OOM发生的时间和频率 Linux系统日志 您的业务应用日志 Linux系统日志路径如下:/var/log/message Linux实例的系统负载情况 云监控 负载查询工具 推荐使用云监控查询您的ECS实例负载信息。如果您没有使用云监控产品,...

通过企业监控大盘监控线下IDC的中间件

重要 您只能通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)安装云监控插件和Exporter。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。步骤一:为...

概览

目前云监控仅支持为Linux和Windows操作系统的主机安装插件。应用场景 您可以使用主机监控功能查询主机的资源使用情况和故障指标。主机监控的应用场景如下:混合云监控解决方案 主机监控通过云监控插件采集您主机的监控项。该插件支持安装在...

Alibaba Cloud Linux常见问题

Meltdown/Spectre漏洞修复会影响系统性能 使用问题 Alibaba Cloud Linux 3 Alibaba Cloud Linux 3系统配置XPS的方法及影响说明 Alibaba Cloud Linux 3.8版本镜像升级内核报错的修复方案 Alibaba Cloud Linux 3系统关闭CPU漏洞修复的方法 ...

如何查看Linux系统网络流量负载情况?

Linux系统中有各种查看网络流量的工具,比如sar、iftop、nethogs等,它们可以从不同的纬度来分析系统中流量信息,本文介绍如何使用sar、iftop、nethogs查看Linux系统ECS实例中网络流量负载情况。操作场景 在您使用Linux系统的ECS实例过程中...

如何使用Prometheus监控SNMP

1.3.6.1.2.1.31.1.1.1.4 sysUpTime 系统最近一次re-initialized后的时间 无 SNMP监控大盘 可观测监控 Prometheus 版 默认提供了SNMP Status和SNMP Interface Detail两个大盘,主要针对if_mib场景,监控网络流量等信息。SNMP Status 主要...

如何使用Prometheus监控SNMP

1.3.6.1.2.1.31.1.1.1.4 sysUpTime 系统最近一次re-initialized后的时间 无 SNMP监控大盘 可观测监控 Prometheus 版 默认提供了SNMP Status和SNMP Interface Detail两个大盘,主要针对if_mib场景,监控网络流量等信息。SNMP Status 主要...

操作系统监控

监控通过安装在阿里云主机(ECS实例)和非阿里云主机上的云监控插件,为您采集丰富的操作系统层面的监控指标,您可以为操作系统监控指标设置报警规则。当某个监控指标达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提...

配置网络

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。执行以下命令,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 视图计算 云数据库 RDS 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用