插件概览

监控的主机监控服务通过在主机上安装云监控插件,为您提供主机的系统监控服务。插件版本 云监控插件共有三个版本,从前往后依次为Java、Go和C++版本,当前最新版本为C++版本。由于C++版本的云监控插件比Go和Java版本占用的CPU和内存资源...

DescribeLogMonitorList-获取日志监控列表

调用DescribeLogMonitorList接口获取日志监控列表。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限...

报警通知合并

通过应用分组设置阈值报警规则 示例:创建报警规则 test_cpu_alarm,对应用分组 testGroup 中的云服务器ECS实例的监控指标(Agent)Host.cpu.total(推荐)进行监控,并将报警通知以 短信、邮件和钉钉机器人的方式发送给报警联系人组 Alarm...

DescribeMetricRuleList-查询报警规则列表中的所有...

说明$Average>0 中的$Average 为一个占位符,格式为$监控结果字段值,云监控会将其替换为对应的统计值或原始的监控值。Average>80 Times integer Info 级别报警连续出现次数。报警连续出现这个次数,且超过阈值才会触发报警。3 Threshold ...

SysOM内核层容器监控

节点维度操作系统内核级监控 在 SysOM容器系统监控-节点维度 页签,您可以从节点维度监控内存、CPU和调度、存储、网络等模块的指标。Pod维度操作系统内核级监控 在 SysOM容器系统监控-Pod维度 页签,您可以从Pod维度实时监控内存、CPU、...

CreateMetricRuleTemplate-创建报警模板

调用CreateMetricRuleTemplate接口创建报警模板。...cpu_total Webhook string 否 报警发生回调时的 URL 地址。N 的取值范围:1~200。填写公网可访问的 URL 地址,云监控会将报警信息通过 POST 请求推送到该地址,目前仅支持 HTTP 协议。...

ModifyMetricRuleTemplate-修改报警模板

调用ModifyMetricRuleTemplate接口修改报警模板。...cpu_total Webhook string 否 报警发生回调时的 URL 地址。N 的取值范围:1~200。填写公网可访问的 URL 地址,云监控会将报警信息通过 POST 请求推送到该地址,目前仅支持 HTTP 协议。...

CreateGroupMetricRules-批量为指定应用分组创建报警...

接口说明 本文将提供一个示例,为应用分组 123456 中的云服务器 ECS 的监控cpu_total 创建一条报警规则,其中报警规则 ID 为 456789,报警规则名称为 ECS_Rule1,报警级别为 Critical,报警统计方法为 Average,报警阈值比较符为 ...

ECS实例CPU使用率空闲检测

规则详情 参数 说明 规则名称 ECS实例CPU使用率空闲检测 规则标识 ecs-cpu-max-utilization-check 自动修正 不支持 规则触发机制 周期执行 触发频率 24小时 规则支持的资源类型[ACS:ECS:Instance]规则入参 relativeTime(默认值:168)...

通过弹性伸缩管理阿里云实例和托管实例

Sl 15:44 0:00/usr/local/cloudmonitor/bin/argusagent 说明 在云监控控制台的主机监控页面,您也可以看到该托管实例已安装云监控Agent,例如可以看到托管实例的CPU使用率、内存使用率以及磁盘使用率等情况。步骤三:将托管实例添加至伸缩...

告警触发器ACS:AlarmTrigger

默认为监控项的最小频率60s。SilenceTime:3600#通道沉默周期,单位为秒。默认86400秒(即1天)。监控数据持续超过报警规则阈值时,每个沉默周期内只发送1次报警通知。Outputs:paraName1:Type:String ValueSelector:.key#此处的.key表示获取...

Helm版本说明

本文主要介绍 可观测监控 Prometheus 版 的监控组件Helm的版本发布说明。2023年 Helm版本号 Agent镜像版本号 功能概述 发布时间 v1.1.17 arms-prom-operator:v4.0.0 新增集群事件采集任务,支持Kubernetes Deployment大盘。新增根据SLA进行...

云资源监控

PTS集成的ECS监控是操作系统级别的,监控项是通过插件采集的,采集频率为15秒一次。故需要先在云监控控制台上安装插件,并确保插件在运行中的状态。具体信息,请参见 安装和卸载云监控插件。说明 关于插件安装的权限,主账号可以直接安装,...

Helm版本说明

本文主要介绍 可观测监控 Prometheus 版 的监控组件Helm的版本发布说明。2024年 Helm版本号 Agent镜像版本号 变更内容 发布时间 变更影响 v1.1.19 registry-{REGION}.ack.aliyuncs.com/acs/arms-prometheus-agent:v4.1.0 改进大规模集群...

MongoDB实例的CPU使用率高问题

MongoDB实例的CPU使⽤率是⼀个⾮常重要的监控指标。如果MongoDB实例的CPU使⽤率过⾼,会导致MonogoDB响应缓慢,甚⾄业务不可⽤。本文介绍查看MongoDB实例CPU使用率的方法,以及导致CPU使用率高的原因和优化策略。查看CPU使用率 分⽚集群...

【组件升级】Helm1.1.17/Agent v4.0.0的升级内容与...

您可以在容器服务控制台的目标集群 运维管理>Prometheus监控 页面,单击 其他 页签,在 Prometheus Agent 中查看Memory/CPU的资源消耗情况。升级后,出现基础指标异常(完全断线或者不连续)例如node_*(图标①)、container_*(图标②)、...

【组件升级】Helm1.1.17/Agent v4.0.0的升级内容与...

您可以在容器服务控制台的目标集群 运维管理>Prometheus监控 页面,单击 其他 页签,在 Prometheus Agent 中查看Memory/CPU的资源消耗情况。升级后,出现基础指标异常(完全断线或者不连续)例如node_*(图标①)、container_*(图标②)、...

集群监控告警说明

集群监控 进入【集群管理-集群监控】可以查看集群整体的监控大盘。上面4个选项卡可以切换图表,分别查看:集群监控大盘、集群巡检结果、底座组件监控、Yoda PV存储监控。集群告警 集群告警策略 集群告警主要包含所有K8s内核以及集群节点...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

区间检测

服务器资源优化:可以监测服务器的CPU和内存使用情况。如果某台服务器的资源使用率持续超过预设阈值,那么系统会自动生成异常事件。有助于团队及时调整资源分配,避免潜在的系统崩溃。应用连接池分析:可以利用此功能来监控查询速度、并发...

区间检测

服务器资源优化:可以监测服务器的CPU和内存使用情况。如果某台服务器的资源使用率持续超过预设阈值,那么系统会自动生成异常事件。有助于团队及时调整资源分配,避免潜在的系统崩溃。应用连接池分析:可以利用此功能来监控查询速度、并发...

MetricStat

cpu_idle Period integer 监控项的时间间隔。单位:秒。60 Timestamp long 监控数据的时间戳(单位:毫秒)1641454680000 Dimensions array 用于标识监控对象(实例)的 Dimension 信息。Dimension 用于标识监控对象(实例)的 Dimension ...

RDS PostgreSQL CPU利用率高问题

活跃会话高导致的CPU利用率高 现象:在 监控与报警 页面的 标准监控 中可以看到,CPU利用率 较高,此时系统态占用达到了23%,说明可能存在大量的系统调用或者中断。通过 操作行数 可以看到,全表扫描数其实并不高。再查看 连接数,发现此时...

容器监控

本文说明如何查看容器监控,从而了解应用的Pod情况,包括CPU、物理内存、网络流量、网络数据包等信息。前提条件 应用部署在容器服务ACK环境中。应用的容器服务ACK集群已经接入 可观测监控 Prometheus 版,具体操作,请参见 Prometheus实例 ...

性能监控

本文介绍如何在可观测可视化Grafana版控制台查看当前Grafana工作区性能监控,以及在CPU和内存的使用触发预设警戒线时,如何升级Grafana工作区,保证Grafana的稳定性。查看性能监控 登录 ARMS控制台,在左侧导航栏选择 Grafana服务>工作区...

Pod监控

本文说明如何查看Pod监控,从而了解应用的Pod情况,包括CPU、物理内存、网络流量、网络数据包等信息。应用限制 EDAS标准版不支持Pod监控,专业版和铂金版支持Pod监控。功能入口 登录 EDAS控制台。在左侧导航栏,单击 应用管理>应用列表,在...

如何处理监控指标满足报警条件但未触发报警问题?

监控指标中的周期(period)是指监控指标数据点的间隔时间和聚合时间,例如:大多数监控指标的周期(period)=60秒,表示每60秒产生一个数据点,这个监控数据是过去60秒所有监控值的聚合值。报警的检测周期由周期(period)决定,对于多...

查询指定指标仓库中的监控数据

使用说明 本文将提供一个示例,查询指标仓库 default-aliyun 中监控指标 AliyunEcs_cpu_total 在指定时间 1653804865(2022-05-29 14:14:25)至 1653805225(2022-05-29 14:20:25)内的监控数据。调试 您可以在OpenAPI Explorer中直接运行...

查看监控信息

接入指标 CPU使用率%监控如下信息:接入层CPU最大使用率 接入层CPU平均使用率 计算资源组指标 CPU使用率%监控如下信息:计算CPU最大使用率 计算CPU平均使用率 存储指标 CPU使用率%监控如下信息:存储CPU最大使用率 存储CPU平均使用率 磁盘...

恢复通知

例如您创建了一个告警监控规则,用于监控各个主机的CPU指标,当CPU使用率超过95%时触发告警,主机CPU使用率下降为正常值(低于等于95%)后发送一条恢复通知。具体配置如下图所示,更多参数说明,请参见 创建日志告警监控规则。具体配置如下...

创建常用报警规则

ARMS报警模板默认提供了多个典型场景下的报警规则配置模板,包括应用监控报警和前端监控报警的场景,可以帮助您快速创建常用的报警规则。前提条件 说明 目前公有云已不支持使用旧版报警功能,您可以使用新版告警管理功能创建告警规则。更多...

使用云监控对MSFE进行监控和报警实践

监控内容 推荐配置报警规则的监控项名称 说明 CPU使用率(Agent)cpu.total 一台ECS只运行一个Tengine进程服务,Tengine对资源的消耗主要体现在CPU使用率上,通常情况下,若CPU使用率达到60%,就需要考虑扩容。Load(Agent)load.5m....

如何使用Prometheus监控Windows

监控大盘 这里参考Linux广泛使用的Node Exporter监控大盘,并结合Windows自身的特点,建议服务提供的默认监控大盘至少包含以下指标Panel:指标分类 指标项 CPU CPU使用率(%):Windows正常运行最重要的指标之一。DPC队列长度、等待线程...

如何使用Prometheus监控Windows

监控大盘 这里参考Linux广泛使用的Node Exporter监控大盘,并结合Windows自身的特点,建议服务提供的默认监控大盘至少包含以下指标Panel:指标分类 指标项 CPU CPU使用率(%):Windows正常运行最重要的指标之一。DPC队列长度、等待线程...

管理报警模板

应用监控默认报警-主机监控报警模板:CPU水位过高或磁盘空间不足场景的报警。应用监控默认报警-进程异常报警模板:进程存活场景的报警。应用监控默认报警-GC异常报警模板:FullGC过多、FullGC耗时长或YoungGC耗时长场景的报警。前端监控 ...

DescribeCustomMetricList-查询上报的自定义监控数据

cpu_total Dimension string 否 维度 Map,用于查询指定资源的监控数据。{sampleName1=value1&sampleName2=value2} Md5 string 否 消息摘要算法,可以产生一个 128 位(16 字节)的散列值,用来校验上报的自定义监控数据的唯一性。97c...

监控

使用建议 目前云监控已经支持按照Hologres实例类型(包括 实时数仓Hologres(从实例)、实时数仓Hologres(湖仓加速)、实时数仓Hologres(通用型)、实时数仓Hologres(计算组))展示对应实例的监控指标,不同的实例类型对应专属监控指标...

自治中心

性能监控 性能监控提供了 QPS、查询响应时间、CPU 使用率 的监控数据。默认展示近 1 小时的数据。单击 近 1 小时 下拉框,也可以选择 近 5 分钟、近半小时、近 6 小时 和 自定义时间 进行查看。将鼠标置于问号图标,可查看图表的监控指标及...

Hologres管控台的监控指标

自2023年9月开始,管控台监控服务底层技术升级,升级后的监控指标汇报原理如下:1天内间隔按照1分钟聚合 5天内间隔按照5分钟聚合 10天内间隔按10分钟聚合 15天内间隔按照15分钟聚合 30天内间隔按照30分钟聚合 CPU使用率(%)CPU使用率 包含...

按量计费

例如,kube_node_status_allocatable_cpu_cores指标监控了Kubernetes集群中每个节点的可分配CPU核心数,假设您的集群中包含3个节点,则采样点分布于3条不同的时间线上。若每个节点以15s为间隔来进行采样,则您在一分钟的时间范围内,上报的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 应用实时监控服务 视图计算 检索分析服务 Elasticsearch版 轻量应用服务器 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用