GPU监控

监控通过安装在阿里云主机(ECS实例)上的云监控插件,采集GPU的监控数据,您还可以为这些监控设置报警规则。当某个监控项达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提条件 请确保您已在云服务器ECS上创建GPU计算...

安装和卸载云监控插件

当您需要通过云监控采集主机操作系统层面的监控指标,并对重要监控指标设置报警规则,以便及时关注其动态时,需要为主机安装云监控插件。当您不再需要通过云监控监控某台主机时,可以登录目标主机卸载云监控插件。本文为您介绍为主机自动...

常见问题排查

确保目标监控项中设置的 统计方法 和 日志筛选 有匹配的日志数据。在 日志监控 列表中,单击目标监控项对应 操作 列的 编辑,在 预览 中查看是否有匹配的日志数据。您可以查看最近1小时内的日志数据。登录 日志服务控制台,您可以查看更长...

常见问题排查

确保目标监控项中设置的 统计方法 和 日志筛选 有匹配的日志数据。在 日志监控 列表中,单击目标监控项对应 操作 列的 编辑,在 预览 中查看是否有匹配的日志数据。您可以查看最近1小时内的日志数据。登录 日志服务控制台,您可以查看更长...

概览

本文为您介绍日志监控的应用场景、解决方案以及业务流程。重要 日志监控功能将于2024年09月14日下线,建议您使用企业云监控中的 SLS日志监控 替代。应用场景 在企业级的业务运维和运营场景中,日志正扮演着越来越...为监控指标设置报警规则。

概览

本文为您介绍日志监控的应用场景、解决方案以及业务流程。重要 日志监控功能将于2024年09月14日下线,建议您使用企业云监控中的 SLS日志监控 替代。应用场景 在企业级的业务运维和运营场景中,日志正扮演着越来越...为监控指标设置报警规则。

管理本地日志的数据接入任务

根据 示例日志 解析出的有效字段设置监控指标的统计方法。数据存入指标仓库 指标仓库名称。标签 监控指标的标签。您可以设置标签键和标签值。Agent安装确认 请确保您所选的应用分组下的实例已安装云监控插件,且版本必须大于等于3.5.5。...

通过日志监控实现网站访问日志的统计与报警

本文为您介绍如何使用日志监控统计网站访问日志(例如:Nginx,Apache)的QPS、状态码和响应时间,并对这些监控设置报警规则。重要 仅2022年09月13日22:00:00之前已订购包年包月套餐(cms_edition)的用户或已开通按量计费(cms_post)的...

API概览

SaveTraceAppConfig 应用监控自定义设置 进行应用监控的自定义设置(如调用链采样设置、Agent开关等)。DeleteTraceApp 删除指定ID和类型的应用 删除指定ID或类型的应用。QueryReleaseMetric 查看不同版本的指标 查询EDAS和K8s应用发布过程...

通过飞书群接收报警通知

您在已有报警联系人上新增飞书机器人的Webhook地址后,如果资源的监控指标达到报警条件,即可通过飞书群接收报警通知。前提条件 请确保您已创建报警联系人。具体操作,请参见 创建报警联系人或报警联系组。步骤一:创建飞书机器人 本文以PC...

通过企业微信群接收报警通知

您在已有报警联系人上新增企业微信机器人的Webhook地址后,如果资源的监控指标达到报警条件,即可通过企业微信群接收报警通知。前提条件 请确保您已创建报警联系人。具体操作,请参见 创建报警联系人或报警联系组。步骤一:创建企业微信...

通过钉钉群接收报警通知

您在已有报警联系人上新增钉钉机器人的...步骤四:创建报警规则 为目标资源的监控指标设置报警条件,并选择报警联系组。关于如何创建报警规则,请参见 创建报警规则。步骤五:查看报警通知 当监控指标达到报警条件时,钉钉群会收到报警通知。

资源消耗

您可以查看当前账号的网络分析与监控、基础云监控和企业云监控的资源消耗情况,还可以开通或关闭他们的按量付费,购买网络分析与监控和基础云监控的资源包。背景信息 关于网络分析与监控、基础云监控和企业云监控的计费方式和计费标准,请...

创建报警规则

多指标:先选择报警级别,再为两个或两个以上的监控指标设置报警条件。智能阈值:关于智能阈值的更多信息,请参见 概览 和 创建智能阈值报警规则。单击 确定。说明 关于如何设置复杂的报警条件,请参见 报警规则表达式说明。通道沉默周期 ...

名词解释

创建报警时,选择自定义监控报警,设置变量a的数据集为当前总价,变量b的数据集为当前商品总数,报警规则为N=3时(当前总价)/(当前商品总数)的最小值小于等于10则报警。若当前商品总数为0时,复合指标(当前总价)/(当前商品总数)的值...

创建报警规则

在 添加规则描述 面板,输入 规则名称,指标类型 选择 单指标,监控指标 选择 实例维度>(ECS)CPU使用率,在 紧急(Critical)区域,触发条件选择 连续3个周期(1周期=1分钟),设置最大值大于等于85%。单击 确定。报警联系人组 选择 Alarm_...

通过日志监控实现日志关键字的监控与报警

在 监控项定义 页面,设置监控项相关参数,单击 下一步。参数 描述 监控项 监控指标的名称。单位 监控项的单位。计算周期 监控项的计算周期。单位:分钟。取值:1、2、3、4、5、10、15、20、30、60。统计方法 在计算周期内根据选定的统计...

概览

您可以对主机监控中的监控项、站点监控中的探测点、云服务监控中的实例和自定义监控中的监控设置报警规则。您可以在全部资源、应用分组和单实例维度设置报警规则。报警服务支持 电话、短信、邮件和Webhook地址。如果您安装了阿里云App,...

为指定资源的指定监控设置多条阈值报警规则

调用PutResourceMetricRules接口为指定资源的指定监控设置多条阈值报警规则。接口说明 本文将提供一个示例,为云服务器 ECS acs_ecs_dashboard 的实例 i-uf6j91r34rnwawoo*中的监控项 cpu_total 设置阈值报警规则。该报警规则的报警联系...

PutResourceMetricRule-为指定资源的指定监控设置一...

调用PutResourceMetricRule接口为指定资源的指定监控设置一条阈值报警规则。接口说明 本文将提供一个示例,为云服务器 ECS acs_ecs_dashboard 的实例 i-uf6j91r34rnwawoo*中的监控项 cpu_total 设置阈值报警规则。该报警规则的报警联系组...

什么是可观测监控 Prometheus 版

说明 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQL以及数据可视化展示等。更多信息,请参见 Prometheus官方文档。什么是Prometheus实例 可观测监控 Prometheus 版 是阿里云 可观测监控 Prometheus ...

什么是可观测监控 Prometheus 版

说明 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQL以及数据可视化展示等。更多信息,请参见 Prometheus官方文档。什么是Prometheus实例 Prometheus实例是阿里云 可观测监控 Prometheus 版 服务提供...

订阅规则

智能洞察Insights会基于系统默认设置或自定义设置对您名下的所有应用自动进行异常识别,发现任何异常都会根据您配置的订阅规则第一时间发送通知信息。添加订阅 登录 ARMS控制台。在左侧导航栏选择 智能洞察>订阅配置。在顶部菜单栏,选择...

进程监控

您还可以添加进程监控,查看其进程数,并为这些进程设置报警规则,及时关注进程数的变化,确保其正常运行。前提条件 请确保您已为阿里云主机(ECS实例)和非阿里云主机安装云监控插件。具体操作,请参见 安装云监控插件。背景信息 云监控每...

创建自定义监控报警规则

在 创建/修改自定义监控报警规则 面板,设置自定义监控指标的报警规则。参数 说明 规则名称 报警规则名称。所属应用分组 报警规则所属的应用分组名称。报警规则默认不属于任何一个应用分组,您可以根据所需选择应用分组。关于如何创建应用...

告警事件

KMS支持与 云监控 CMS(Cloud Monitor)集成,提供系统事件的监控以及告警功能,帮助您及时得知相关事件以便快速处理。本文介绍如何查询系统事件以及设置告警。KMS的系统事件类型 KMS的系统事件包含:clientkey到期前提醒:事件级别为严重...

修改自定义监控报警规则

在 创建/修改自定义监控报警规则 面板,设置自定义监控指标的报警规则。参数 说明 规则名称 报警规则名称。所属应用分组 报警规则所属的应用分组名称。报警规则默认不属于任何一个应用分组,您可以根据所需选择应用分组。关于如何创建应用...

版本升级说明

监控插件可以采集主机操作系统监控数据,对主机监控有重要价值。云监控插件将不断升级版本,以便给您带来更好的监控体验。升级原因 云监控插件版本的升级原因如下:云监控插件会一直迭代新版本,从而增加新特性、修复稳定性问题和优化...

管理报警黑名单策略

背景信息 目前云监控仅支持为阈值指标设置报警黑名单策略,不支持系统事件。关于云监控支持的云产品和阈值指标,请参见 云产品监控项。创建报警黑名单策略 前提条件:请确保您已创建阈值报警规则。具体操作,请参见 创建报警规则。登录 云...

Python SDK调用示例

说明 云监控系统权限策略如下:AliyunCloudMonitorFullAccess:管理云监控(CloudMonitor)的权限。AliyunCloudMonitorReadOnlyAccess:只读访问云监控(CloudMonitor)的权限。AliyunCloudMonitorMetricDataReadOnlyAccess:访问云监控...

通过企业监控大盘实现本地日志监控

在右上方的 Panel 页签,设置监控图表的名称、类型、展示样式等。在 Edit Panel 页面,单击右上角的 Apply。创建监控图表成功。单击右上角的 图标,设置监控大盘的名称和归属目录。单击 Save。创建监控大盘成功。在监控大盘的左侧导航栏,...

探测目标站点或API的连通性和时延

在 创建任务 页面,先选择 PC端(PC),再设置站点监控任务的相关信息。关于站点监控任务参数的更多信息,请参见 通过PC端探测目标站点的网络质量。基本信息 任务类型 选择 HTTP(S),输入任务名称,监控地址 输入 ...

CreateMetricRuleBlackList-创建报警黑名单策略

目前云监控仅支持为阈值指标设置报警黑名单策略,不支持系统事件。关于云监控支持的云服务和阈值指标,请参见 云服务监控项。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动...

PutMonitoringConfig-设置监控插件的全局配置

调用PutMonitoringConfig接口设置监控插件的全局配置。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在...

报警通知合并

通过事件监控设置事件报警规则 示例:创建事件报警规则 test_config_alarm,对云数据库Redis集群版中目标实例 r-bp1vfufnlnkt2c*-name(r-bp1vfufnlnkt2c*)的监控指标 Proxy单个请求的平均字节数 进行监控,并将报警通知以邮件和钉钉机器...

SetRetcodeShareStatus-打开或关闭前端监控站点的免...

atc889zkcf@d8deedfa9bf*Status boolean 是 设置前端监控站点的免登录分享开关的状态。取值:true:开启。false:关闭。true AppName string 否 前端监控应用名称。test-app 返回参数 名称 类型 描述 示例值 object IsSuccess boolean 操作...

全景监控

同时,全景监控提供统一的监控接入标准,全方位对接各种应用系统监控信息,实现覆盖所有系统、全流程的监控管理。数据全链路保障是指通过采集数据汇聚、数据融合、数据分析挖掘等阶段的各项任务状态信息,对异常状态进行预警和处置,实现对...

功能简介

同时,全景监控提供统一的监控接入标准,全方位对接各种应用系统监控信息,实现覆盖所有系统、全流程的监控管理。数据全链路保障是指通过采集数据汇聚、数据融合、数据分析挖掘等阶段的各项任务状态信息,对异常状态进行预警和处置,实现对...

功能简介

同时,全景监控提供统一的监控接入标准,全方位对接各种应用系统监控信息,实现覆盖所有系统、全流程的监控管理。数据全链路保障是指通过采集数据汇聚、数据融合、数据分析挖掘等阶段的各项任务状态信息,对异常状态进行预警和处置,实现对...

使用系统事件报警

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。本文为您介绍创建和调试系统事件报警规则的方法。背景信息 云监控支持的事件类型...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 应用实时监控服务 视图计算 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用