节点不可用数监控 数值 监控如下信息:计算节点掉线数 存储节点掉线数 计算内存使用率%监控如下信息:计算节点平均计算内存使用率 计算节点最大计算内存使用率 存储节点平均计算内存使用率 存储节点最大计算内存使用率 资源组监控项说明 ...
当已有可用性监控任务不能满足您探测本地或远程指定路径和端口的需求时,您可以根据所需修改任务。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在目标应用分组的...
查看小程序监控列表 一个用户最多可以对 100 个小程序进行监控,即一个用户可以有多个 App,每个 App 下可以创建多个小程序,但单个用户下可监控的小程序数量不能超过 100 个。完成以下步骤,查看小程序监控列表:登录控制台,单击 产品与...
监控指标不承诺服务可用性,告警服务可用性不低于99.9%,详情请参见 云监控服务等级协议。成本费用 监控告警费用 Prometheus监控指标采集以及告警服务按量计费,详情请参见 计费说明 和 告警计费说明。无订阅费用、免运维、监控与告警管理...
使用场景 机房级业务整体不可用。机房级云服务不可用。机房级云基础设施不可用。使用限制 可用区断网基于VPC网络ACL的高级特性。若VPC不支持高级特性,则无法使用可用区断网方式。更多信息,请参见 VPC高级功能。如果您可用区内的ECS实例...
当您需要探测已设置IP地址保护的站点时,需要参考IPv4和IPv6地址库设置IP白名单,保证站点监控可用。您可以调用DescribeSiteMonitorISPCityList接口查询所有运营商探测点的IPv4和IPv6地址。关于DescribeSiteMonitorISPCityList接口中的参数...
本文介绍了基础云监控和企业云监控的功能差异。基础云监控和企业云监控的功能差异如下表所示。功能 基础云监控 企业云监控 跨账号统一监控 不支持。仅阿里云产品支持。自定义数据存储时长 不支持(默认3个月)。支持(最长367天)。秒级...
例如:企业正使用的云产品实例不可用。可用区的某产品的集群级别的性能衰减或不可用。基础设置故障导致的整个可用区故障。容灾演练示意图 同城容灾架构评估项 评估项 要求 SLB 多可用区SLB实例。应用层 ECS多可用区部署,相关应用多可用区...
接入外部报警是指外部系统(非云监控)通过云监控的报警渠道进行报警。您可以通过云监控提供的报警服务调用地址,实现该功能。前提条件 请确保您已创建报警联系组。具体操作,请参见 创建报警联系组。操作步骤 登录 云监控控制台。在左侧...
注意事项 应用监控 eBPF 版 数据和 Kubernetes监控 不兼容,迁移后,之前的数据仍需在 Kubernetes监控 中查看,新产生的数据则在 应用监控 eBPF 版 中查看。已通过 Kubernetes监控 配置的告警规则,暂时不支持迁移至 Kubernetes监控,如果...
本文为您介绍日志监控常见问题的排查方法。操作步骤 创建日志监控时页面报错。创建日志监控时,页面报错是因为AccessKey状态为 已禁用。启用方法如下:使用阿里云账号登录 控制台。将鼠标置于页面右上方的账号图标,单击 AccessKey管理。在...
本文为您介绍日志监控常见问题的排查方法。操作步骤 创建日志监控时页面报错。创建日志监控时,页面报错是因为AccessKey状态为 已禁用。启用方法如下:使用阿里云账号登录 控制台。将鼠标置于页面右上方的账号图标,单击 AccessKey管理。在...
2021-07-30 全部地域 接入外部报警 2021年05月 功能名称 功能描述 发布时间 发布地域 相关文档 监控大盘 线下IDC、阿里云产品和其他云厂商产品的监控数据接入云监控后,您可以为监控数据创建监控大盘,通过监控大盘查看指定监控指标的监控...
小程序监控主要面向如钉钉、微信等超级App中的小程序应用,提供包括页面访问、资源加载、API请求调用、JS错误等性能数据的采集、分析能力,支持单用户会话追踪,还原真实用户操作场景,采集问题堆栈及上下文信息,快速追溯问题根源,帮助...
使用智能阈值报警规则可以快速的对对象存储OSS和CDN做监控报警覆盖,在服务不可用之前提前发现异常,现推荐以下监控指标配置智能阈值报警规则。云产品 典型异常 异常可能原因 监控指标 报警条件 对象存储OSS 请求成功数突降或请求错误数...
相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...
性能监控对象 性能监控的对象包括计算机系统、网络、应用程序等,主要分为以下几类:服务器:包括物理服务器和虚拟服务器,监控服务器的CPU、内存、磁盘、网络等资源使用情况。操作系统:监控操作系统的运行状态、进程、服务、文件系统等。...
流量不均导致的“热点击穿”问题,很容易造成服务不可用。在生产环境中出现过多起这样的案例,比如因负载均衡配置错误,注册中心异常导致重启节点的服务无法上线,DHT哈希因子异常等。流量不均的最大风险在于能否及时发现“热点”现象。它...
当您不再需要应用分组中的某条可用性监控任务时,可以对其执行删除操作。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在目标应用分组的左侧导航栏,单击 可用性...
对于应用防护来说,您可根据自己的业务环境和要求接入ARMS应用安全以及 阿里云Web应用防火墙,协同构建边界与应用内生双重防护能力,最大程度降低应用被入侵、数据泄露、服务不可用等风险。使用限制 应用安全目前仅支持Java应用接入。功能...
当您需要继续探测资源的本地或远程指定路径和端口时,可以重新启用应用分组中的可用性监控任务。前提条件 请您确保可用性监控任务的 监控状态 为 禁用。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 ...
不支持 线程池监控/连接池监控 支持对特定的线程池(例如Tomcat、Dubbo)以及特定的连接池(例如Druid)进行监控。不支持 异常分析/错误分析 提供独立的异常分析以及错误分析视图。不支持 前后端链路串连 与ARMS前端监控集成,实现用户界面...
不涉及 v2.8.5.1 2022年06月 模块 功能名称 功能概述 支持地域 版本号 应用监控 新增商业化地域 应用监控的部分地域于2022年06月08日0点起支持开通基础版和专家版,目前应用监控所有开服地域均已商业化。具体信息,请参见【产品变更】应用...
主机监控 指标说明 指标名称 单位 是否为常用指标 指标说明 节点机CPU使用率(%)无 不是 节点机(服务器)上CPU处理器的使用率,过高的CPU使用率会导致系统响应变慢、服务不可用等问题。节点机CPU用户态占用率(%)无 不是 节点机上CPU...
当云监控默认提供的可用条件不能满足您的需求时,请单击 添加可用组,多个条件组之间是和的关系(and)。选择探测点 探测点 使用默认的探测点。设置报警 报警规则使用默认的可用率报警规则。云监控默认提供一条报警规则。如果默认规则不能...
创建应用分组后,您可以查看应用分组的组内资源、监控视图、故障列表、可用性监控等数据,并执行相关操作。通过应用分组集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择...
步骤三:查看Cassandra监控大盘 通过监控大盘您可以查看可用性、客户端读写延迟和吞吐量、节点CPU/内存/硬盘占用率等监控数据,具体步骤如下。在 集成中心 页面单击 已安装 区域的 E-MapReduce 组件卡片,然后在弹出的对话框中单击 大盘 页...
步骤三:查看Cassandra监控大盘 通过监控大盘您可以查看可用性、客户端读写延迟和吞吐量、节点CPU/内存/硬盘占用率等监控数据,具体步骤如下。在 集成中心 页面单击 已安装 区域的 E-MapReduce 组件卡片,然后在弹出的对话框中单击 大盘 页...
本文介绍如何使用Prometheus监控Windows。前提条件 已将VPC实例接入 可观测监控 Prometheus 版。具体操作,请参见 Prometheus实例 for ECS。使用限制 目前仅Prometheus实例 for ECS类型实例支持该组件接入。Windows Metric监控参考模型 ...
本文介绍如何使用Prometheus监控Windows。前提条件 已将VPC实例接入 可观测监控 Prometheus 版。具体操作,请参见 Prometheus实例 for ECS。使用限制 目前仅Prometheus实例 for ECS类型实例支持该组件接入。Windows Metric监控参考模型 ...
i-hp3dunahluwajv6f*HostAvailabilityTaskId string 否 可用性监控的任务 ID。126*关于公共请求参数的详情,请参见 公共参数。返回参数 名称 类型 描述 示例值 object 返回结果。Code string 状态码。说明 200 表示成功。200 Message ...
当您暂时不需要探测资源的本地或远程指定路径和端口时,可以禁用应用分组中的可用性监控任务。前提条件 请您确保可用性监控任务的 监控状态 为 启用。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页...
不可用探测点数量 不可用探测点数量是指域名或IP地址在一个探测周期内不能正常访问的次数。可用探测点数量 可用探测点数量是指域名或IP地址在一个探测周期内可以正常访问的次数。任意错误码(独立报警)当任意一个探测点的探测结果符合该...
不可用探测点数量 不可用探测点数量是指域名或IP地址在一个探测周期内不能正常访问的次数。可用探测点数量 可用探测点数量是指域名或IP地址在一个探测周期内可以正常访问的次数。任意错误码(独立报警)当任意一个探测点的探测结果符合该...
背景信息 云监控针对主机监控和报警,以及应用分组、可用性监控、Dashboard等基础功能均不收费。想要了解更多云监控信息,请参见 什么是云监控。开启主机监控 登录 云监控控制台。在左侧导航栏,单击 主机监控。在 主机监控 页面,通过在...
通过本文您可以了解云监控中可用性监控功能的监控项。说明 您可以调用 DescribeHostAvailabilityList 接口查询 Id(可用性监控任务ID)和 Instances(云服务器ECS的实例ID)。当您调用云监控的API接口时,需要获取当前云产品的 Namespace ...
本文介绍故障演练的产品架构,以下简称故障演练为AHAS Chaos。产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要...在服务不可用情况下,您可以通过手动执行命令恢复演练。
建议通过网络分析与监控中的站点监控来实现服务可用性监控。通过创建站点监控任务对域名进行探测,进而实现网络质量分析和性能分析。具体操作,请参见 创建站点监控任务。说明 创建站点监控任务之前,请您确保已开通网络分析与监控。具体...
提供多方位数据聚合:相比自定义大盘,企业云监控大盘支持将站点监控、可用性监控等监控数据集中配置在一个大盘中。提供更丰富的维度信息:在原有云产品监控数据基础上,补充了IP地址、地域、标签等维度信息,使得监控大盘的配置和展现更...
停止全部应用(次日不自动启动)执行操作后,ARMS将立刻停止对所有应用的监控并且不自动开启。保持运行状态(达到限额后自动停止应用且次日不自动启动)若您的消费未达到每日消费上限,ARMS将持续监控您的应用;若您的消费达到每日消费上限...