如何使用Linux系统的atop监控工具

其以一定的频率记录系统和进程活动,采集的数据包含CPU、内存、磁盘、网络的资源使用情况和进程运行情况,并能以日志文件的方式保存在磁盘中。对于每个进程,会显示CPU使用率、内存增长、磁盘使用率、优先级、用户名、状态和退出码等。当...

内网监控

说明 需要监控VPC内ECS本地进程是否响应正常时,可在探测源中选中所有需要监控的ECS,在探测目标中填写 localhost:port/path 格式的地址,进行本地探测。当您需要监控VPC内SLB是否正常响应时,可选择与SLB在同一VPC网络内的ECS实例作为探测...

API概览

DescribeMonitoringAgentStatuses 查询云监控插件运行状态 调用DescribeMonitoringAgentStatuses接口查询云监控插件运行状态。ModifyHostInfo 修改非阿里云的主机显示信息 调用ModifyHostInfo接口修改非阿里云的主机显示信息。...

版本说明

系统进程数超过5000个(可配置)时,不再继续监控进程,避免占用多地域的客户资源。升级安装插件时,先自动下载安装包,然后在安装成功后自动删除安装包。提升JSON配置文件的兼容性,支持:C风格的注释、允许尾部逗号、允许非标UTF-8编码。...

为什么应用运行进程突然消失了?

当一个进程被OOM Killer杀死以后会向操作系统日志写入杀死的进程PID等信息,所以判断进程是否被OOM Killer,就可以通过搜索操作系统日志来得知。ECS集群进程被OOM Killer的日志:[Wed Aug 31 16:36:42 2017]Out of memory:Kill process ...

管理站点监控任务

删除站点监控任务 当您不再需要条站点监控任务时,可以对其执行删除操作。删除站点监控任务后,与其关联的报警规则同步被删除。登录 云监控控制台。在左侧导航栏,选择 网络分析与监控>站点监控。删除站点监控任务。单个删除 在 监控任务...

如何重启云监控C++版本插件?

当您安装或配置云监控C++版本插件时,为了使其生效,需要重启插件。本文为您介绍在Windows和Linux操作系统中,重启云监控C++版本插件的操作方法。重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用...

操作系统监控

监控通过安装在阿里云主机(ECS实例)和非阿里云主机上的云监控插件,为您采集丰富的操作系统层面的监控指标,您可以为操作系统监控指标设置报警规则。当某个监控指标达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提...

诊断服务端报错问题

系统已运行了很长时间,但是不想关心遗留的异常,只想知道今天和昨天相比、发布后和发布前相比多了哪些异常。查看一个异常对应的Web请求和相关参数。客服人员提供了一个用户下单失败的订单号,分析该用户下单失败的原因。解决方案 为应用...

应用监控 eBPF 版运行环境要求和限制

本文主要介绍 应用监控 eBPF 版 对运行环境的要求和限制。Kubernetes 版本:v1.20 运行环境:阿里云ACK集群 重要 阿里云 ACK Serverless集群 暂不支持。自建Kubernetes集群 其他Kubernetes集群 说明 CentOS集群暂不支持。节点 环境 要求 ...

配置规则:按表(单表)

数据质量支持按照数据表配置质量监控规则,用来监控表数据是否符合要求,自动拦截问题任务,阻断脏数据向下游蔓延,保障产出的表数据符合预期。本文为您介绍如何配置表的质量监控规则并执行质量监控及其他相关操作。前提条件 已采集引擎...

2023年

2023年12月 模块 功能名称 变更类型 功能描述 相关文档 应用监控 告警规则 优化 针对JVM监控提供更丰富的告警规则。告警规则指标说明 应用监控 控制台 新增 全新控制台全量上线,提供更精细的场景化可观测能力、更强大的链路查询分析能力。...

如何使用Prometheus监控Windows

如果您发现磁盘响应繁忙、响应慢,那么您需要优先查看进程IO量大的进程是否符合预期。进程I/O请求数(Bytes)Major WMI(IODataOperationsPerSec)进程IO请求速率。进程分页文件大小(Bytes)Recommend WMI(PageFileBytes)进程占用分页...

如何使用Prometheus监控Windows

如果您发现磁盘响应繁忙、响应慢,那么您需要优先查看进程IO量大的进程是否符合预期。进程I/O请求数(Bytes)Major WMI(IODataOperationsPerSec)进程IO请求速率。进程分页文件大小(Bytes)Recommend WMI(PageFileBytes)进程占用分页...

告警规则指标说明

异常监控 指标说明 指标名称 单位 是否为常用指标 指标说明 异常发生次数 无 是 在软件系统运行过程中发生的各种异常的次数,如空指针异常、数组越界异常、IO异常等。可以根据该指标判断调用堆栈是否抛错,从而判断是否存在应用调用异常。...

概览

智能阈值报警是针对云监控中的云资源实例的监控指标推出的智能报警功能,它自动适配并拟合监控指标的历史数据,展示报警阈值边界,发现监控指标突增或突降的异常行为,为您业务的稳定性提供保障。什么是智能阈值 智能阈值基于机器学习算法...

主机可观测

可观测监控 Prometheus 版 支持通过node-exporter采集ECS Linux或Windows主机操作系统相关指标,也支持process-exporter采集进程相关监控数据,另外基于textfile的方式也支持采集用户写到文件中自定义监控指标。前提条件 已创建ECS实例。...

函数计算FC环境自动安装探针

函数计算内置的Java8运行时支持接入ARMS(Application Real-Time Monitoring Service)应用监控。自定义运行时中的Java 8、Java 11和Java 17也支持接入ARMS应用监控。本文介绍如何使用自定义运行时接入ARMS应用监控。背景信息 函数计算无缝...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作,...

GPU监控

监控通过安装在阿里云主机(ECS实例)上的云监控插件,采集GPU的监控数据,您还可以为这些监控项设置报警规则。当某个监控项达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提条件 请确保您已在云服务器ECS上创建GPU计算...

主机可观测

可观测监控 Prometheus 版 支持通过node-exporter采集ECS Linux或Windows主机操作系统相关指标,也支持process-exporter采集进程相关监控数据,另外基于textfile的方式也支持采集用户写到文件中自定义监控指标。前提条件 已创建ECS实例。...

管理报警规则

某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。生效时间 报警规则的生效时间。报警...

智能监控概述

智能监控功能支持您通过配置自定义规则,实现对任务运行状态及资源使用情况的监控;通过配置智能基线,保障复杂依赖场景下重要数据在预期时间内正常产出。同时,您还可以根据业务需求自定义资源组运维规则,实现资源组的自动化运维。功能...

EnableHostAvailability-启用指定可用性监控任务

ACBDBB40-DFB6-4F4C-8957-51FFB233969C Success boolean 操作是否成功。取值:true:成功。false:失败。true 示例 正常返回示例 JSON 格式 {"Code":"200","Message":"User not authorized to operate on the specified resource.",...

2021年

v2.8.1.1 2021年07月 模块 功能名称 功能概述 发布时间 支持地域 版本号 容器监控 新增国际地域 阿里云容器监控新增以下6个地域:新加坡 印度尼西亚(雅加达)日本(东京)美国(硅谷)美国(弗吉尼亚)德国(法兰克福)容器监控支持的所有...

删除组进程监控任务

调用DeleteGroupMonitoringAgentProcess接口删除组进程监控任务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,...

DisableHostAvailability-禁用指定可用性监控任务

ACBDBB40-DFB6-4F4C-8957-51FFB233969C Success boolean 操作是否成功。取值:true:成功。false:失败。true 示例 正常返回示例 JSON 格式 {"Code":"200","Message":"User not authorized to operate on the specified resource.",...

创建报警模板

当您拥有大量云资源时,可以使用报警模板功能,将各类云产品监控项的报警规则保存到模板中。当您创建或修改报警规则时,可以直接使用模板,无需重复定义报警规则。背景信息 报警模板需要与应用分组配合使用。您可以先创建应用分组,再创建...

为什么阈值报警规则触发延迟?

首先您需要明确以下两个概念:监控指标的Period 表示监控指标数据点的间隔时间及聚合时间,例如:大多数监控指标的Period为60秒,表示每60秒产生一个监控指标数据点,这个监控数据是过去60秒所有监控值的聚合值,或最后一个监控值。...

云主机监测点

云拨测可以通过监控运营商运行情况,获取不同运营商环境下浏览网页时的性能耗时及网络信息,并可统计出最慢运营商和城市。本文列出了云主机拨测支持的监测点。中国监测点 省级行政区 城市 运营商 是否支持IPV6 北京 北京市 阿里云 否 广东 ...

智能基线概述

智能基线能够及时捕捉导致基线上的任务无法按时完成的异常情况并提前预警,保障复杂依赖场景下重要数据能在预期时间内顺利产出,帮助您降低配置成本、避免无效报警、自动监控所有重要任务。应用场景 管理任务优先级 在任务数量越来越多,而...

查看实例监控信息

实例是否安装云监控插件会导致在ECS管理控制台查看到的监控数据不同:实例已安装云监控插件:ECS管理控制台的监控项中,CPU、内存、系统负载数据为云监控的操作系统监控项,其他监控项与云监控的基础监控项一致。实例未安装云监控插件:在...

修改可用性监控任务

某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。生效时间 报警规则的生效时间。报警...

为指定阿里云主机安装云监控插件

调用InstallMonitoringAgent接口为指定阿里云主机安装云监控插件。接口说明 前提条件 请确保阿里云主机已安装云助手。关于如何安装云助手,请参见 云助手概述。背景信息 本接口仅适用于阿里云主机,即 ECS 实例。通过 API 安装云监控插件的...

查看质量监控执行详情

数据质量的运行记录模块展示质量监控任务运行时的规则校验结果。质量监控任务运行后,您可以在运行记录页面查看详情。进入任务查询 登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据建模与开发>数据质量,在下拉框中选择...

创建报警规则

某监控指标达到报警阈值时发送报警,如果监控指标在通道沉默周期内持续超过报警阈值,在通道沉默周期内不会重复发送报警通知;如果监控指标在通道沉默周期后仍未恢复正常,则云监控再次发送报警通知。例如:当 通道沉默周期 选择 12小时 时...

ECS环境自动安装探针

如果重启后页面状态显示 目标Java进程未找到,需要确认重启时是否变更了命令和脚本执行目录,导致进程的工作目录发生了变化,可以通过以下命令进行确认:找到对应的Java进程并获取进程PID。ps-ef|grep java 执行以下命令查看进程目录。ls-...

CreateMonitorAgentProcess-创建进程监控

调用CreateMonitorAgentProcess接口创建进程监控。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限...

JVM监控

JVM监控功能用于监控重要的JVM指标,包括GC(Garbage Collection)瞬时指标、堆内存指标、非堆内存指标、元空间指标、直接缓冲区指标、JVM线程数等。本文介绍JVM监控功能和查看JVM监控指标的操作步骤。功能入口 登录 ARMS控制台,在左侧...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 应用实时监控服务 威胁情报服务(文档停止维护) 视图计算 轻量应用服务器 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用