使用API查询监控数据

监控数据会有一定的延迟,且各产品的监控数据的延迟情况不太一样,所以建议您使用 DescribeMetricLast 查询最新数据时,时间窗口放宽到5-10分钟。秒级精度的数据保存7天,分钟级精度的数据保存31天。如果您需要查询云账号所有实例的数据,...

JVM监控内存详情说明

内存泄露分析 ARMS提供了完善的堆内存泄露定位分析能力,用户可以通过JVM堆内存监控查看是否出现堆内存缓慢增长,如果存在相关堆内存持续增长趋势,可以通过ARMS提供的 内存快照 或 持续剖析 功能排查定位堆内内存泄露位置。堆外内存泄露...

实例监控

说明 ARMS应用监控采集的数据来自JMX,其中非堆内存所包含的内存区域比Java进程中实际的非堆内存区域少,因此可能出现监控中堆内存+非堆内存总和与通过 top 命令看到的RES大小存在一定差值,相关细节请参见 JVM监控内存详情说明。...

为什么Redis内存报警与监控内存使用率不一致

如果Redis内存使用率告警显示内存占用较高,或您的应用程序出现OOM异常,但性能监控显示的内存使用率并不高,可参考本文排查原因并解决问题。问题现象 现象一:您收到 Redis 内存告警,显示 内存使用率超过阈值(例如,连续满足3次平均值>=...

Hologres管控台的监控指标

Hologres的内存资源采用预留模式,在没有查询的时候,也会有数据表的元数据、索引、数据缓存等加载到内存中,以便加快检索和计算,此时内存使用率不为零是正常情况。理论上,在无查询的情况,内存使用率达到30%-40%左右都属于正常情况。当...

创建系统预置大盘

说明 创建监控大盘时,企业云监控会自动导入所需监控指标,将会产生相关费用。更多信息,请参见 监控大盘。在 提示 对话框,单击 确定。创建监控大盘成功,等待几秒后数据更新完毕。您可以在 监控大盘 页面,单击目标大盘对应 操作 列的 ...

创建高精度秒级大盘

说明 创建监控大盘时,企业云监控会自动导入所需监控指标,将会产生相关费用。更多信息,请参见 监控大盘。在 提示 对话框,单击 确定。创建监控大盘成功,等待几秒后数据更新完毕。您可以在 监控大盘 页面,单击目标大盘对应 操作 列的 ...

接入外部报警

如果您设置了安全词,则云监控对外部系统的报警内容进行验证,当报警内容包含该安全词时,云监控会给报警联系组中的报警联系人发送报警通知;反之,云监控不发送报警通知。如果您未设置安全词,则云监控忽略校验安全词,直接给报警联系组中...

JVM监控

相关文档 ARMS应用监控采集的数据来自JMX,其中非堆内存所包含的内存区域比Java进程中实际的非堆内存区域少,因此可能出现监控中堆内存+非堆内存总和与通过 top 命令看到的RES大小存在一定差值,相关细节请参见 JVM监控内存详情说明。

创建自定义监控报警规则

当自定义监控指标达到报警阈值时,云监控会发送报警通知给报警联系人组中的报警联系人。前提条件 请您确保已成功上报自定义监控数据至云监控。具体操作,请参见 概览。操作步骤 登录 云监控控制台。在左侧导航栏,选择 接入中心>自定义监控...

版本升级说明

如果旧版本云监控插件(3.5.9及以下版本)存在严重的安全或稳定性问题,云监控会发公告,并强制升级。请您关注云监控插件版本发布信息,并主动升级到最新版本。关于云监控插件的版本信息,请参见 版本说明。升级方式 云监控提供了阿里云...

如何禁止默认报警自动创建

Prometheus监控会为接入的应用自动创建默认报警。关于这些自动创建的默认报警,请参见 报警规则说明。控制默认报警自动创建的参数为 defaultAlert,取值为 true 时表示自动创建默认的报警,取值为 false 时表示不自动创建默认的报警。对于...

管理系统事件报警规则(旧版)

取值:满足包含上面任何一个关键词:当事件内容中包含任何一个关键词时,云监控会发送报警通知。满足不包含上面任何一个关键词:当事件内容中不包含任何一个关键词时,云监控会发送报警通知。说明 关于如何查看事件内容,请参见 查看系统...

概览

统计方式 通过上报监控数据接口上报原始数据后,云监控会按以下统计方式计算1分钟和5分钟的统计结果。统计方式 描述 Average 平均值 Maximum 最大值 Minimum 最小值 Sum 求和 SampleCount 计数 SumPerSecond 求和/对应周期的秒数,也可以...

使用自定义事件报警

填写公网可访问的URL,云监控会将报警信息通过POST或GET请求推送到该地URL,目前仅支持HTTP协议。当您需要测试报警回调地址的连通性时,可以执行以下操作。单击回调地址正后方的 测试。在 WebHook测试 面板,您可以通过Webhook返回的状态码...

监控系统权限策略参考

在产品迭代过程中,云监控会向系统策略中添加新的权限,用来支持新的功能和能力。系统策略的更新将会影响所有授予了该策略的 RAM 身份,包括 RAM 用户、RAM 用户组和 RAM 角色。有关 RAM 权限策略的更多信息,请参阅 权限策略概览。说明 ...

创建报警规则

例如:当 通道沉默周期 选择 12小时 时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。生效时间 报警规则的生效时间。报警规则只在生效时间内才会检查监控指标是否需要报警。报警联系人组 发送报警的联系人组。应用分组...

通过HTTP上报监控数据

如果type为0,则Key只能与Value相同,上报原始值,云监控会按周期将原始值聚合为多个值。例如:最大、计数、求和等。返回示例 通过HTTP方式上报监控数据的代码返回示例如下:{"code":"200",/200表示成功。msg":""/正常上报时返回msg为空。...

创建报警规则

例如:当 通道沉默周期 选择 12小时 时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。生效时间 报警规则的生效时间。报警规则仅在生效期内才会发送报警通知。说明 当报警规则不在生效期时,不会发送报警通知,但是报警...

PutCustomMetric-上报自定义监控数据

说明 如果上报数值的类型为 0,则上报的是原始值,云监控会按周期将原始值聚合为多个值,例如:最大、计数、求和等。{"value":10.5} Dimensions string 是 维度 Map,用于查询指定资源的监控数据。N 的取值范围:1~21。格式:key-value 键...

通过日志监控实现日志关键字的监控与报警

报警回调 填写公网可访问的URL地址,云监控会将报警信息通过POST或GET请求推送到该URL地址,目前仅支持HTTP协议。关于报警回调的设置方法,请参见 使用阈值报警回调。在 创建结果 页面,单击 关闭。查看关键字ERROR的监控数据。创建日志...

无效的报警规则

这类报警规则的存在对监控有弊无利,需要关注和处理。检测出来的无效报警规则,可能由于对应监控指标的调整或下线,从报警功能层面已无存在的必要。您可以通过以下方法进行治理:选择性删除 逐条确认无效报警规则,并逐一手动删除。具体...

创建报警规则

例如:当 通道沉默周期 选择 12小时 时,如果报警未恢复正常,则间隔12小时后,云监控会再次发送报警通知。生效时间 报警规则的生效时间。报警规则仅在生效期内才会发送报警通知。说明 当报警规则不在生效期时,不会发送报警通知,但是报警...

管理自定义事件报警规则

填写公网可访问的URL地址,云监控会将报警信息通过POST或GET请求推送到该URL地址,目前仅支持HTTP协议。URL回调的设置方法,请参见 使用阈值报警回调。当您需要测试报警回调地址的连通性时,可以执行以下操作。单击回调地址正后方的 测试。...

DescribeHostAvailabilityList-查询可用性监控任务...

监控会将报警信息通过 POST 请求推送到该地址,目前仅支持 HTTP 协议。https://www.aliyun.com NotifyType integer 报警通知类型。取值:2:电话+短信+邮件+钉钉机器人。1:短信+邮件+钉钉机器人。0:邮件+钉钉机器人。1 EscalationList ...

基础监控

应用部署到 Serverless 应用引擎 SAE(Serverless App Engine)后,SAE 对应用所运行设备的请求次数、内存使用率等信息进行数据采集与分析,并以图表的方式展示,方便您实时、直观地了解应用版本所运行设备的状态。本文介绍控制台查看...

监控Java版本插件安装

监控配置管理等管控类操作 100.103.0.94:80 出方向 收集监控数据到云监控服务端 us-west-1(美国西部1 硅谷)100.103.0.95:3128 出方向 监控配置管理等管控类操作 100.100.29.7:80 出方向 收集监控数据到云监控服务端 eu-central-1(欧洲...

【组件升级】Helm1.1.17/Agent v4.0.0的升级内容与...

升级后,Agent消耗Memory/CPU较高 您需要检查是否发送数据出现异常,数据发送异常导致Agent内存憋数据,进而导致资源消耗增高。您可以在容器服务控制台的目标集群 运维管理>Prometheus监控 页面,单击 其他 页签,在 Prometheus Agent ...

【组件升级】Helm1.1.17/Agent v4.0.0的升级内容与...

升级后,Agent消耗Memory/CPU较高 您需要检查是否发送数据出现异常,数据发送异常导致Agent内存堆积数据,进而导致资源消耗增高。您可以在容器服务控制台的目标集群 运维管理>Prometheus监控 页面,单击 其他 页签,在 Prometheus ...

如何为应用更名?

如何为 部署在ACK集群中的Java应用更名?...应用名称更改成功后稍等片刻,旧名称的应用下将不再有监控数据上报,且新名称的应用下将有监控数据上报。如何为部署 在EDAS上的Java应用 更名?目前不支持为部署在EDAS上的Java应用更改应用名称。

查看监控信息

‪ 诊断视图使用指南 内存OOM诊断 通过 内存OOM诊断 视图提供的监控指标,分析处理内存OOM(Out of Memory)问题。Memory Usage:InnoDB Buffer Pool使用率不变,内存使用率长时间(例如超过7天)缓慢持续上涨时,可能是内存泄露导致。内存...

安装探针后应用启动时报OutOfMemoryError错误怎么办?

ARMS应用监控的探针占用一部分内存空间,常规通过带来100 M左右内存开销,持续剖析等高阶功能还带来额外的内存开销,如果您的应用在接入ARMS应用监控后,发生OutOfMemoryError现象,请参考本文适当增加JVM内存申请。如果出现 ...

SysOM内核层容器监控

节点维度操作系统内核级监控 在 SysOM容器系统监控-节点维度 页签,您可以从节点维度监控内存、CPU和调度、存储、网络等模块的指标。Pod维度操作系统内核级监控 在 SysOM容器系统监控-Pod维度 页签,您可以从Pod维度实时监控内存、CPU、...

2017年

本文为ARMS在2017年的版本发布记录,介绍发布的特性变更情况。V2.3.1 发布时间:2017-12-14 新特性:应用监控功能,...支持任务的复制和导入导出,方便用户快速复制已有监控方案。用户任务自检,包括任务错误统计、错误抽样。复合算子支持。

进程监控

监控通过安装在阿里云主机(ECS实例)和非阿里云主机上的云监控插件,为您采集最近一段时间内活跃进程的CPU使用率、内存使用率和文件打开数。您还可以添加进程监控,查看其进程数,并为这些进程设置报警规则,及时关注进程数的变化,确保...

【通知】云监控中Tair持久内存型的CPU使用率指标升级

监控中Tair持久内存型实例的CPU使用率指标将仅采集...升级后,云监控中 Tair 持久内存型的CPU使用率可能达到升级前的2~3倍。若您在 报警设置 中配置了 Tair 持久内存型的CPU使用率的告警,请重新配置告警规则,避免出现误报、漏报等现象。

Tair选型指南

集群架构实例扩容会有闪断。集群架构实例的分片节点的扩展数固定,例如2分片、4分片、8分片等。读写分离架构的只读节点固定为1、3、5个。说明 更多信息请参见 云原生实例和经典实例对比。选择部署架构 云原生内存数据库Tair 支持三种不同的...

使用阈值报警回调

执行结果 当报警规则被触发时,云监控会将报警消息发送到您指定的URL地址,发送的POST请求内容如下表所示。说明 POST请求内容可能会新增参数,因此需要您的Webhook可以兼容新增参数。参数 数据类型 描述 alertName String 报警名称。...

如何使用Prometheus监控Windows

通常系统都有一些规律性的中断触发上下文切换,进而需要特权模式来处理,所以当前指标始终会有一个较小的值(通常不超过10%)。如果当前指标持续大于30%,需要先检查DPCTime和中断时间,如果任一值超过20%,则很可能是硬件问题。则可以使用...

如何使用Prometheus监控Windows

通常系统都有一些规律性的中断触发上下文切换,进而需要特权模式来处理,所以当前指标始终会有一个较小的值(通常不超过10%)。如果当前指标持续大于30%,需要先检查DPCTime和中断时间,如果任一值超过20%,则很可能是硬件问题。则可以使用...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 应用实时监控服务 视图计算 检索分析服务 Elasticsearch版 轻量应用服务器 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用