健康检查(TCP)

连续失败次数 在执行TCP监控时,如果连续多次监控出现异常系统才将应用服务判断为异常,防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为...

HTTP(s)健康检查

监控IP地址出现异常时,自动屏蔽异常IP地址,当IP地址恢复正常时,自动取消屏蔽设置。功能说明 检查协议 检查协议请选择HTTP(s),它是指对目标IP地址进行HTTP(s)监控监控IP地址的Web服务器网络可达性、服务可用性、首包延时等指标...

健康检查(PING)

连续失败次数 在执行PING监控时,如果连续多次监控出现异常系统才将应用服务判断为异常,防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为...

HTTP(S)健康检查

监控IP地址出现异常时,自动屏蔽异常IP地址,当IP地址恢复正常时,自动取消屏蔽设置。配置参数说明 检查协议 检查协议请选择HTTP(S),它是指对目标IP地址进行HTTP(S)监控监控IP地址的Web服务器网络可达性、服务可用性、首包延时等...

Ping健康检查

连续失败次数 在执行Ping监控时,如果连续多次监控出现异常系统才将应用服务判断为异常,防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为...

异常数据告警

阿里云音视频通信已接入云监控服务。您可以监控用户入会异常占比、推(拉)流成功率、卡顿率、模糊率等指标,同时您还可以配置报警规则实时监控并上报异常指标。注意事项 云监控服务仅提供指标的异常监控和报警功能。如果您需要实时查看全...

可观测性的设计原则

监控系统的指标可以让组织了解系统的健康状况和性能情况,以便在系统出现异常时快速发现问题。监控指标可以通过监控工具来实现,并允许在发生异常时发送警报。有很多监控工具可以使用,例如Prometheus、Grafana、Zabbix等,以及阿里云提供...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

H5 性能

JS 异常监控 实时监控并展示出现 JS 异常的 H5 页面、异常最近上报时间以及上报次数,帮助您快速定位 JS 错误位置。可查看所有或指定异常页面的所有 JS 异常,同时支持按异常上报时间对异常页面进行排序。如需异常页面数据,单击列表右上方...

性能监控最佳实践

同时,还需要设置告警规则,以便在系统出现异常时及时通知管理员。整合监控工具:将多个监控工具整合在一起,形成一个统一的监控平台。这可以通过使用开源的监控集成工具,如Prometheus、Grafana等来实现。这些工具可以将不同的监控数据...

云资源监控

监控报告 PTS除了在压测过程中提供监控数据,也在报告中整合了压测数据,以便在压测结束后,复盘压测过程时比对业务数据与负载数据使用,帮助您快速地定位负载情况、系统是否异常等。监控报告中的明细数据展现了在压测前配置的监控对象数据...

邮件推送监控服务

监控服务入口 邮件推送监控服务处于云监控控制台中。可以通过如下两种方式进入:在 邮件推送控制台 概览页点击云监控入口链接,跳转到云监控控制台的邮件推送监控页面。进入 云监控控制台。在左侧导航栏,单击 云产品监控,然后搜索 邮件推...

使用API查询监控数据

大型企业内部通常有自建的运维监控系统,上云过程中会面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据,从而将阿里云的监控数据与现有系统进行集成。指标类监控数据查询的接口 云...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

快速构建主机监控能力

主机监控是维护和管理IT系统的重中之重,您可以借助云监控快速构建主机监控能力。对于已安装云监控插件的阿里云主机(ECS实例),您可以通过 主机监控 以可视化的方式查看其监控数据,也可以通过一键报警为主机的关键指标快速设置报警规则...

插件概览

监控的主机监控服务通过在主机上安装云监控插件,为您提供主机的系统监控服务。插件版本 云监控插件共有三个版本,从前往后依次为Java、Go和C++版本,当前最新版本为C++版本。由于C++版本的云监控插件比Go和Java版本占用的CPU和内存资源...

如何处理云监控识别多台相同镜像主机异常问题?

当您的非阿里云主机采用镜像方式部署时,在安装云监控插件后,将自动生成序列号相关信息,会导致云监控识别多台相同镜像的非阿里云主机时出现异常。不同操作系统主机的处理方法如下:Windows 在注册表中删除目录 计算机\HKEY_LOCAL_MACHINE...

JVM监控

相关文档 ARMS应用监控采集的数据来自JMX,其中非堆内存所包含的内存区域比Java进程中实际的非堆内存区域少,因此可能会出现监控中堆内存+非堆内存总和与通过 top 命令看到的RES大小存在一定差值,相关细节请参见 JVM监控内存详情说明。

实例监控

为Java应用安装探针后,ARMS即可开始监控Java应用,您可以在 实例监控 页面了解应用的基础监控、实例GC和JVM内存等信息。前提条件 重要 ARMS应用监控面向已开通新版计费的用户提供全新的监控详情页面,新版计费详情,请参见 产品计费(新版...

创建智能阈值报警规则

如果资源的监控指标达到报警条件,云监控自动发送报警通知,帮助您及时得知异常监控数据并快速处理。前提条件 请确保您已开通基础云监控的按量计费或开启试用中心的试用智能阈值。更多信息,请参见 按量计费 或 试用智能阈值。使用限制 ...

创建报警规则

如果资源的监控指标达到报警条件,云监控自动发送报警通知,帮助您及时得知异常监控数据,并快速处理。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在目标应用分组...

2022年

新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用观测Windows。请参见 开服地域。2022年09月 功能名称 功能概述 支持地域 云服务集成中心全面改版 推出全新云服务...

创建报警规则

如果资源的监控指标达到报警条件,云监控自动发送报警通知,帮助您及时得知异常监控数据,并快速处理。操作步骤 登录 云监控控制台。在左侧导航栏,选择 报警服务>报警规则。在 报警规则 页面,单击 创建报警规则。在 创建报警规则 面板,...

ARMS统一告警管理最佳实践

本文介绍告警统一管理的最佳实践,以帮助企业更好地处理异构监控系统所带来的挑战和问题。背景信息 在云原生时代,企业IT基础设施的规模越来越大,越来越多的系统和服务被部署在云环境中。为了监控这些复杂的IT环境,企业通常会选择使用...

监控信息

物联网边缘计算提供对网关的主机监控和对驱动、函数计算、场景联动等资源的监控服务。前提条件 已根据 环境搭建 内容,创建了边缘实例并上线网关。为边缘实例分配了驱动、函数计算、场景联动等资源,并成功部署实例。已根据 云资源访问 ...

异常指标监控

PAI提供了特征编码、模型训练及模型评估全套功能,您只需要抽取异常行为特征,并对其进行标记,即可快速构建异常指标监控模型。背景信息 用户系统中的异常数据(例如运维系统的CPU消耗突然增高或某平台突然产生大量不良信息)属于平台异常...

监控与日志

支持对运维任务执行情况、资源是否出现异常、资源状态变化等问题进行实时监控。更多监控信息,请参见 使用事件中心。同时支持对监控项设置报警规则,报警通知方式包括电话、短信、邮件、钉钉机器人、阿里云App通知。具体操作,请参见 创建...

TCP健康检查

连续失败次数 在执行TCP健康检查时,如果连续多次探测出现异常系统才将应用服务判断为异常,防止因为网络瞬间抖动等因素影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为异常。...

如何排查设备SNMP监控异常

背景信息 云网管支持对设备SNMP自定义采集,一般出现数据异常有以下原因:SNMP配置监控项信息有误,主要配置信息是SNMP版本,Community、采集周期和解析模板。SNMP监控项未部署到设备,如厂商或者型号未勾选。设备端SNMP Community配置错误...

监控ECS的Windows主机CPU监控数值异常

本文为您介绍云监控ECS的Windows主机CPU监控数值异常的原因及解决办法。云监控中的ECS CPU监控数值如果出现为0或者负数(实际CPU使用率不是0),其他监控值都正常。这个问题主要出现在Windows的机器上,一般原因是Windows内部的性能计数器...

监控与日志

您可以通过VPN网关的系统事件和监控指标信息来判断系统是否按照预期运行,同时您也可以对系统事件和监控指标设置报警规则,以便在系统运行异常时,您可以收到报警通知,及时处理问题。系统事件监控 阿里云云监控服务的事件监控功能自动汇集...

AIMaster:弹性自动容错引擎

ExitCodeAndErrorMsg:任务出现异常时,判断失败实例的退出码及错误日志信息(请参见 步骤三:配置容错监控增强功能),如果满足重试条件:异步任务会重启失败的实例。同步任务会重启任务。Never:对失败任务不做任何处理,直接将任务标记...

监控与日志

您可以通过云企业网的系统事件和监控指标信息来判断系统是否按照预期运行,同时您也可以对系统事件和监控指标设置报警规则,以便在系统运行异常时,您可以收到报警通知,及时处理问题。系统事件监控 阿里云云监控服务的事件监控功能自动...

监控与日志

性能监控数据 在 性能监控 页面,选择文件系统类型和目标文件系统ID,查看该文件系统的读写IOPS、读写延迟、读写吞吐等监控数据。容量监控数据 在容量监控页面,选择文件系统类型和目标文件系统ID,查看该文件系统的存储空间使用量、文件数...

查看告警信息

发现异常数据:当该指标监控过程中发现异常数据时,卡片左上角会出现 告警字样,当您鼠标 hover 在字样上方时可以 查看异常详情提示。指标告警详情:您可以直接单击 指标名称 或则单击卡片右下方 指标详情 按钮,右侧将弹窗展示指标告警...

概览

本文为您介绍站点监控的含义、典型应用场景和监控类型。站点监控是一款定位于网络探测的监控产品,主要用于通过遍布全国的探测点,发送模拟真实用户访问的探测请求,监控全国各省市运营商网络终端用户到您服务站点的访问情况。计费说明 当...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
视频点播 视频直播 视图计算 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用