GPU监控

监控通过安装在阿里云主机(ECS实例)上的云监控插件,采集GPU的监控数据,您还可以为这些监控设置报警规则。当某个监控项达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提条件 请确保您已在云服务器ECS上创建GPU计算...

概览

您可以对主机监控中的监控项、站点监控中的探测点、云服务监控中的实例和自定义监控中的监控设置报警规则。您可以在全部资源、应用分组和单实例维度设置报警规则。报警服务支持 电话、短信、邮件和Webhook地址。如果您安装了阿里云App,...

监控报警接入

设置报警规则(接入云监控)背景信息 您可以使用媒体处理云监控服务获取系统性能、用量两方面的监控数据指标。您还可以使用自定义报警服务,监控服务稳定性、分析使用情况,及时发现以及诊断相关问题。如需了解基本概念或进行报警联系人和...

常见问题排查

确保目标监控项中设置的 统计方法 和 日志筛选 有匹配的日志数据。在 日志监控 列表中,单击目标监控项对应 操作 列的 编辑,在 预览 中查看是否有匹配的日志数据。您可以查看最近1小时内的日志数据。登录 日志服务控制台,您可以查看更长...

常见问题排查

确保目标监控项中设置的 统计方法 和 日志筛选 有匹配的日志数据。在 日志监控 列表中,单击目标监控项对应 操作 列的 编辑,在 预览 中查看是否有匹配的日志数据。您可以查看最近1小时内的日志数据。登录 日志服务控制台,您可以查看更长...

概览

本文为您介绍日志监控的应用场景、解决方案以及业务流程。重要 日志监控功能将于2024年09月14日下线,建议您使用企业云监控中的 SLS日志监控 替代。应用场景 在企业级的业务运维和运营场景中,日志正扮演着越来越重要的角色。业务日志的...

概览

本文为您介绍日志监控的应用场景、解决方案以及业务流程。重要 日志监控功能将于2024年09月14日下线,建议您使用企业云监控中的 SLS日志监控 替代。应用场景 在企业级的业务运维和运营场景中,日志正扮演着越来越重要的角色。业务日志的...

通过日志监控实现网站访问日志的统计与报警

本文为您介绍如何使用日志监控统计网站访问日志(例如:Nginx,Apache)的QPS、状态码和响应时间,并对这些监控设置报警规则。重要 仅2022年09月13日22:00:00之前已订购包年包月套餐(cms_edition)的用户或已开通按量计费(cms_post)的...

API概览

SaveTraceAppConfig 应用监控自定义设置 进行应用监控的自定义设置(如调用链采样设置、Agent开关等)。DeleteTraceApp 删除指定ID和类型的应用 删除指定ID或类型的应用。QueryReleaseMetric 查看不同版本的指标 查询EDAS和K8s应用发布过程...

版本说明

本文为您介绍云监控插件的版本...当系统负载较重或其他原因导致云监控插件的系统资源占用超过限制时,插件会自动退出。修复问题 解决Go版本的云监控插件自动修改系统时间等问题。早期版本 云监控插件的早期版本说明,请参见 早期版本说明。

通过飞书群接收报警通知

您在已有报警联系人上新增飞书机器人的Webhook地址后,如果资源的监控指标达到报警条件,即可通过飞书群接收报警通知。前提条件 请确保您已创建报警联系人。具体操作,请参见 创建报警联系人或报警联系组。步骤一:创建飞书机器人 本文以PC...

通过企业微信群接收报警通知

您在已有报警联系人上新增企业微信机器人的Webhook地址后,如果资源的监控指标达到报警条件,即可通过企业微信群接收报警通知。前提条件 请确保您已创建报警联系人。具体操作,请参见 创建报警联系人或报警联系组。步骤一:创建企业微信...

通过钉钉群接收报警通知

您在已有报警联系人上新增钉钉机器人的Webhook地址后,如果资源的监控指标达到报警条件,即可通过钉钉群接收报警通知。前提条件 请确保您已创建报警联系人。具体操作,请参见 创建报警联系人或报警联系人组。步骤一:创建钉钉机器人 关于...

资源消耗

您可以查看当前账号的网络分析与监控、基础云监控和企业云监控的资源消耗情况,还可以开通或关闭他们的按量付费,购买网络分析与监控和基础云监控的资源包。背景信息 关于网络分析与监控、基础云监控和企业云监控的计费方式和计费标准,请...

通过企业监控大盘实现本地日志监控

之后您还可以通过企业云监控提供的监控大盘(简称企业监控大盘)创建多样化的监控图表,并设置Prometheus报警,接收报警通知。前提条件 请确保您已创建报警联系人和报警联系组。具体操作,请参见 创建报警联系人和报警联系组。请确保您已...

创建报警规则

当您需要监控应用分组中各云产品资源的使用情况时,可以创建报警规则。如果资源的监控指标达到报警条件,云监控自动发送报警通知,帮助您及时得知异常监控数据,并快速处理。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>...

创建报警规则

当您需要监控各云产品资源的使用情况时,可以创建报警规则。如果资源的监控指标达到报警条件,云监控自动发送报警通知,帮助您及时得知异常监控数据,并快速处理。操作步骤 登录 云监控控制台。在左侧导航栏,选择 报警服务>报警规则。在 ...

名词解释

创建报警时,选择自定义监控报警,设置变量a的数据集为当前总价,变量b的数据集为当前商品总数,报警规则为N=3时(当前总价)/(当前商品总数)的最小值小于等于10则报警。若当前商品总数为0时,复合指标(当前总价)/(当前商品总数)的值...

报警通知合并

当同一个阿里云账号的多个资源在同一报警规则和周期内同时报警时,为减少报警资源的消耗和冗余信息的干扰,云监控在第一条报警通知发出后,以一分钟为周期对后续的报警通知进行合并发送。本文将介绍不同报警规则下的报警通知合并示例。报警...

告警事件

KMS支持与 云监控 CMS(Cloud Monitor)集成,提供系统事件的监控以及告警功能,帮助您及时得知相关事件以便快速处理。本文介绍如何查询系统事件以及设置告警。KMS的系统事件类型 KMS的系统事件包含:clientkey到期前提醒:事件级别为严重...

什么是云监控

使用云监控,不但可以帮助您提升系统服务可用时长,还可以降低企业IT运维监控成本。云监控通过提供跨云服务和跨地域的应用分组管理模型和报警模板,帮助您快速构建支持几十种云服务、管理数万实例的高效监控报警管理体系。云监控用于监控各...

如何处理云监控插件异常停止问题?

当某个主机的云监控插件的状态为 已停止 时,云监控将不能对该主机进行监控。您需要判断该主机的云监控插件的停止原因,并恢复其运行状态。问题分析 云监控插件默认每3分钟一次心跳。如果15分钟没有心跳,则主机判断插件已停止运行。云监控...

管理报警黑名单策略

背景信息 目前云监控仅支持为阈值指标设置报警黑名单策略,不支持系统事件。关于云监控支持的云产品和阈值指标,请参见 云产品监控项。创建报警黑名单策略 前提条件:请确保您已创建阈值报警规则。具体操作,请参见 创建报警规则。登录 云...

支持的云产品及其系统事件

本文为您介绍云监控支持的各云产品的系统事件。说明 云监控在中国内地设立了管控平台,以提供云产品的监控服务。云监控使用管控平台对各阿里云产品的系统事件进行处理。系统事件使用说明 当您需要调用云监控API接口时,可以通过下表链接...

CreateMetricRuleBlackList-创建报警黑名单策略

目前云监控仅支持为阈值指标设置报警黑名单策略,不支持系统事件。关于云监控支持的云服务和阈值指标,请参见 云服务监控项。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动...

管理系统事件报警规则(旧版)

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。背景信息 说明 旧版系统事件报警规则功能已不再升级,功能会逐步下线,建议您使用...

为指定资源的指定监控设置多条阈值报警规则

调用PutResourceMetricRules接口为指定资源的指定监控设置多条阈值报警规则。接口说明 本文将提供一个示例,为云服务器 ECS acs_ecs_dashboard 的实例 i-uf6j91r34rnwawoo*中的监控项 cpu_total 设置阈值报警规则。该报警规则的报警联系...

PutResourceMetricRule-为指定资源的指定监控设置一...

调用PutResourceMetricRule接口为指定资源的指定监控设置一条阈值报警规则。接口说明 本文将提供一个示例,为云服务器 ECS acs_ecs_dashboard 的实例 i-uf6j91r34rnwawoo*中的监控项 cpu_total 设置阈值报警规则。该报警规则的报警联系组...

什么是可观测监控 Prometheus 版

阿里云 可观测监控 Prometheus 版 全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,且提供全面托管的Prometheus服务。说明 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活...

什么是可观测监控 Prometheus 版

阿里云 可观测监控 Prometheus 版 全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,且提供全面托管的Prometheus服务。说明 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活...

使用系统事件报警

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。本文为您介绍创建和调试系统事件报警规则的方法。背景信息 云监控支持的事件类型...

报警设置

为了不错失重要通知,建议您对重要的监控指标设置报警规则。当 云原生内存数据库Tair 性能指标(CPU、内存使用率等)异常或实例触发高可用切换时,云监控平台会向您发送警告信息。背景信息 云监控(CloudMonitor)是针对阿里云资源和互联网...

报警设置

为了不错失重要通知,建议您对重要的监控指标设置报警规则。当 云数据库 Redis 版 性能指标(CPU、内存使用率等)异常或实例触发高可用切换时,云监控平台会向您发送警告信息。背景信息 云监控(CloudMonitor)是针对阿里云资源和互联网...

进程监控

监控通过安装在阿里云主机(ECS实例)和非阿里云主机上的云监控插件,为您采集最近一段时间内活跃进程的CPU使用率、内存使用率和文件打开数。您还可以添加进程监控,查看其进程数,并为这些进程设置报警规则,及时关注进程数的变化,确保...

版本升级说明

监控插件可以采集主机操作系统监控数据,对主机监控有重要价值。云监控插件将不断升级版本,以便给您带来更好的监控体验。升级原因 云监控插件版本的升级原因如下:云监控插件会一直迭代新版本,从而增加新特性、修复稳定性问题和优化...

全景监控

全景监控支持业务链路配置监控场景,通过自定义监控链路和告警消息配置,可快速实现从数据生产到业务应用的全链路编排及溯源,实现全局监控和问题快速锁定。全景监控提供丰富的告警信息输出方式,包括:钉钉消息、标准协议等方式,出现问题...

订阅规则

智能洞察Insights会基于系统默认设置或自定义设置对您名下的所有应用自动进行异常识别,发现任何异常都会根据您配置的订阅规则第一时间发送通知信息。添加订阅 登录 ARMS控制台。在左侧导航栏选择 智能洞察>订阅配置。在顶部菜单栏,选择...

基础监控

基础监控仅限于阿里云主机(ECS实例),监控数据由云服务器ECS上报,您无需安装云监控插件,即可查看基础监控指标的监控数据,并为其设置报警规则。当某个监控指标达到报警条件时,会给您发送报警通知,以便您及时关注其动态。监控指标说明...

功能简介

全景监控支持业务链路配置监控场景,通过自定义监控链路和告警消息配置,可快速实现从数据生产到业务应用的全链路编排及溯源,实现全局监控和问题快速锁定。全景监控提供丰富的告警信息输出方式,包括:钉钉消息、标准协议等方式,出现问题...

使用自定义事件报警

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。本文为您介绍自定义事件报警规则的创建方法。前提条件 请确保您已上报自定义事件...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
视频点播 视频直播 视图计算 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用