监控与报警

监控指标及说明 监控指标主要包括CPU、内存、磁盘、网络、RDMA、CPFS,以及GPU相关指标,如显存使用率、算力使用率、SM设备使用率、PCIe及NVLink接收/发送数据量等。当前维度主要支持:作业(任务)维度、Pod(Worker)维度和GPU单卡维度。...

如何处理云监控插件异常停止问题?

当某个主机的云监控插件的状态为 已停止 时,云监控将不能对该主机进行监控。您需要判断该主机的云监控插件的停止原因,并恢复其运行状态。问题分析 云监控插件默认每3分钟一次心跳。如果15分钟没有心跳,则主机判断插件已停止运行。云监控...

插件概览

监控的主机监控服务通过在主机上安装云监控插件,为您提供主机的系统监控服务。插件版本 云监控插件共有三个版本,从前往后依次为Java、Go和C++版本,当前最新版本为C++版本。由于C++版本的云监控插件比Go和Java版本占用的CPU和内存资源...

查看云企业网资源监控信息

本文为您介绍如何通过监控图表查看云企业网实例下的转发路由器实例监控信息、带宽包监控信息、跨地域连接监控信息、边界路由器VBR(Virtual Border Router)关联的物理专线监控信息以及转发路由器连接的网络实例流量的监控信息。...

通过移动端探测目标站点的网络质量

监控通过站点监控的探测点(请求方)模拟最终用户的访问行为,从而获得各地域探测点到目标地址(监控地址)的访问数据。当您希望通过蜂窝网络探测目标站点时,用移动端探测。前提条件 请确保您已创建报警联系人和报警联系人组。具体操作...

用户分析

通过对用户及其设备的历史网络指标进行分析,分别从时间、探测协议、网络类型和探测目的端(服务器端)等维度,对用户的网络状况进行画像,协助业务定位与用户网络质量分析。操作入口 一、网络质量分析器首页——探测结果明细——分析 通过...

API详情

API详情页提供指定时间段内应用中所有API请求的成功率、平均成功耗时、平均失败耗时、缓慢次数、错误次数,并以API请求发起端的地域、域名、网络制式等维度展示统计数据。功能入口 登录 ARMS控制台。在左侧导航栏选择 前端监控>前端列表。...

版本说明

本文为您介绍云监控插件的版本发布信息。3.5.11 分类 说明 发布时间 2024-03-25 新特性 Windows正式支持x64。支持IPv6。支持HTTP2。支持macOS和FreeBSD(基于sigar库)。代理扩展为支持七种代理协议:HTTP、HTTPS、HTTPS/2、Socks4、Socks4...

产品版本对比

应用实时监控服务ARMS包含多种子产品。为满足不同的需求,各子产品提供多种版本,例如基础版和专家版等。本文对比前端监控各个版本的功能与特性。重要 ARMS基础版已不支持开通,并将于2024年03月31日起停止提供技术支持。更多信息,请参见...

2021年

2021-07-15 不涉及 v2.8.0.3 Prometheus监控 支持接入VPC网络下的ECS集群 Prometheus监控支持接入VPC网络的ECS集群,创建大盘后可以监控ECS集群的众多性能指标。更多内容,请参见 Prometheus实例 for ECS。2021-07-15 华东2(上海)华南1...

概述

如果出现大量设备同时不在线,或设备不断重复上、下线的情况,需对设备网络进行检修;如果温度在短时间内迅速上升,则可能是出现了安全隐患,需做应急处理。根据业务需要,需保证各个检测点的温度感应器实时在线,感应器上报的数据都能...

前端监控场景

本文介绍了前端监控场景。用户访问业务时,整个访问过程大致可以分为三个阶段:页面生产时(Server端状态)、页面加载时和页面运行时。为了保证线上业务稳定运行,应用上线前通常会在Server端对业务的运行状态进行各种监控。现有的Server端...

如何使用Prometheus监控Windows

本文介绍如何使用Prometheus监控Windows。前提条件 已将VPC实例接入 可观测监控 Prometheus 版。具体操作,请参见 Prometheus实例 for ECS。使用限制 目前仅Prometheus实例 for ECS类型实例支持该组件接入。Windows Metric监控参考模型 ...

如何使用Prometheus监控Windows

本文介绍如何使用Prometheus监控Windows。前提条件 已将VPC实例接入 可观测监控 Prometheus 版。具体操作,请参见 Prometheus实例 for ECS。使用限制 目前仅Prometheus实例 for ECS类型实例支持该组件接入。Windows Metric监控参考模型 ...

用ARMS前端监控诊断页面缓慢问题

在此情况下,可以在 API详情 页面,单击 请求详情 区域右上角的 查看会话,查看本次访问的网络制式、地域、浏览器、设备和操作系统等信息。如果后端应用处理时间较长,则说明后端处理的性能较差。此时可在 方法栈 栏中单击放大镜图标,然后...

应用监控接入概述

只要网络可达,您可以将非阿里云环境(包括本地IDC和其他云)的应用接入到ARMS应用监控。ARMS提供了公网接入点,您可以通过公网接入,也可以通过云企业网等方式打通阿里云VPC和非阿里云环境之间的连接,以获得更好的网络质量。接入方式 ...

使用前后端链路追踪诊断API错误原因

在前端监控中,即便已知API的请求耗时,也无从知晓准确的网络传输性能、后端服务的调用链路及性能,因而无法快速准确地排查应用API问题。前后端链路追踪功能可以解决此类问题,它会将API请求从前端发出到后端调用的链路串联起来,真实还原...

会话追踪

在 概要信息 区域,查看该会话的用户名、用户ID、会话ID、PV、JS错误数、API请求次数、API失败次数、慢加载次数、设备、地域、浏览器、访问IP和网络制式等基础信息。在 会话轨迹 区域,查看用户的访问路径。单击目标页面左侧的+图标,可以...

VPC对等连接监控与运维

您可以在专有网络管理控制台查看VPC对等连接的监控指标,您也可以使用阿里云云监控服务来监控已创建的VPC对等连接实例。云监控可以从VPC对等连接实例中实时收集监控指标,并在专有网络控制台生成可视化的时序曲线图。您可以根据各监控指标...

用ARMS前端监控诊断JS错误

步骤四:查看错误详情 JS错误详情信息包括首次发现时间、首次发现版本(可选上报指标)、错误名称、错误类型、错误时间、设备、操作系统、浏览器、IP、网络制式、地区、错误URL、错误所在文件及行列信息、应用版本号等。如下图所示,可以从...

如何处理云监控插件心跳检查失败问题?

当主机宕机、网络异常或插件停止服务时,云监控都会为您上报系统事件“心跳检查失败”。本文以阿里云主机为例,为您介绍云监控插件心跳检查失败的处理方法。操作步骤 检查主机的运行状态是否正常。具体操作,请参见 查看实例信息。是:执行...

内网监控

背景信息 随着越来越多的用户从经典网络迁移到更安全、更可靠的VPC网络环境,如何监控VPC内部服务是否正常响应就成为需要关注的问题。本文将通过具体案例说明如何监控VPC内ECS上的服务是否可用、VPC内ECS到RDS、Redis的连通性如何、VPC内...

什么是用户体验监控

ARMS 用户体验监控(Real User Monitoring,RUM)专注于对Web场景、App移动应用场景和小程序场景的监控,以用户体验为切入点,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性...

错误码和状态码说明

说明 当探测成功或探测失败时,请您优先关注云监控自定义的错误码。如果因DNS或网络等原因造成探测失败,服务端不会返回响应结果,则不会有HTTP状态码。云监控自定义错误码说明 协议 错误码 含义 HTTP 610 探测超时或请求响应超时,包含TCP...

VPC网络下的SAE应用接入Prometheus监控

本文介绍如何将VPC网络下的SAE应用接入Prometheus监控。步骤一:创建SAE应用并获取VPC、交换机等信息 在 SAE控制台 中创建应用并暴露Metrics(可以为其他地址)服务。具体操作,请参见 在SAE控制台使用WAR包部署Java Web应用。在 SAE控制台...

VPC网络下的SAE应用接入Prometheus监控

本文介绍如何将VPC网络下的SAE应用接入Prometheus监控。步骤一:创建SAE应用并获取VPC、交换机等信息 在 SAE控制台 中创建应用并暴露Metrics(可以为其他地址)服务。具体操作,请参见 在SAE控制台使用WAR包部署Java Web应用。在 SAE控制台...

如何处理在阿里云主机上自动安装云监控插件失败问题?

如果您在阿里云主机上自动安装云监控插件失败,则请按照以下方法逐步排查。操作步骤 以root用户登录云监控插件所在的阿里云主机。重要 云监控仅支持通过管理员账号root操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致...

基本概念

报警服务 您可以对主机监控中的监控项、站点监控中的探测点、云产品监控中的实例和自定义监控中的监控项设置报警规则。当监控项满足报警规则时,发送报警通知。监控项 您设置或系统默认的监控数据类型。例如:云服务器ECS的CPU使用率、内存...

环境分类说明

在 ARMS 中,环境指的是根据监控目标的不同类型进行的分类,旨在集中管理监控探针及其关联数据存储。容器环境 考虑到容器集群可能涉及大量数据采集,通常是将单个容器集群定位为一个监控环境。针对此类环境,为 ACK、ACK Serverless集群 ...

如何使用Prometheus监控MySQL

步骤三:查看MySQL监控大盘 通过监控大盘您可以查看可用性、数据库查询、网络流量、连接、内存等监控数据,具体步骤如下。登录 ARMS控制台。在左侧导航栏选择 Prometheus监控>实例列表,进入可观测监控 Prometheus 版的实例列表页面。单击...

环境分类说明

在 ARMS 中,环境指的是根据监控目标的不同类型进行的分类,旨在集中管理监控探针及其关联数据存储。容器环境 考虑到容器集群可能涉及大量数据采集,通常是将单个容器集群定位为一个监控环境。针对此类环境,为 ACK、ACK Serverless集群 ...

如何使用Prometheus监控MySQL

步骤三:查看MySQL监控大盘 通过监控大盘您可以查看可用性、数据库查询、网络流量、连接、内存等监控数据,具体步骤如下。登录 Prometheus控制台。在左侧导航栏单击 实例列表,进入可观测监控 Prometheus 版的实例列表页面。单击目标 ...

探针(Agent)版本说明

本文主要介绍了ARMS应用监控Java探针的版本更新历史。查看探针版本 登录 ARMS控制台。在左侧导航栏选择 应用监控>探针在线状态,然后在顶部菜单栏选择目标地域。单击 探针版本发布说明 页签,查询ARMS在2021年09月份之后正式发布的所有探针...

2021年

v2.8.1.1 2021年07月 功能名称 功能概述 发布时间 支持地域 版本号 支持接入VPC网络下的ECS集群 可观测监控 Prometheus 版 支持接入VPC网络的ECS集群,创建大盘后可以监控ECS集群的众多性能指标。更多内容,请参见 Prometheus实例 for ECS...

实例监控

为Java应用安装探针后,ARMS即可开始监控Java应用,您可以在 实例监控 页面了解应用的基础监控、实例GC和JVM内存等信息。前提条件 重要 ARMS应用监控面向已开通新版计费的用户提供全新的监控详情页面,新版计费详情,请参见 产品计费(新版...

功能特性

ARMS应用监控是一款应用性能管理(Application Performance Management,简称APM)产品。您无需修改代码,只需为应用安装一个探针,ARMS就能够对应用进行全方位监控,帮助您全面掌控应用运行状态,快速定位出错接口和慢接口,洞察性能瓶颈...

ARMS统一告警管理最佳实践

为了监控这些复杂的IT环境,企业通常会选择使用异构监控系统,例如Prometheus、Grafana、Zabbix等,以获取更全面的监控数据,以便更好地了解其IT基础设施的运行状况和性能表现。然而,这种异构监控系统也带来了一些问题,其中最显着的是告...

2022年

新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用观测Windows。请参见 开服地域。2022年09月 功能名称 功能概述 支持地域 云服务集成中心全面改版 推出全新云服务...

监控VPC网络下ECS实例

本文介绍在VPC网络下的ECS实例接入 可观测监控 Prometheus 版 后,如何监控ECS实例。前提条件 已创建ECS。已将VPC网络下ECS实例接入 可观测监控 Prometheus 版。具体操作,请参见 Prometheus实例 for ECS 说明 本文中的参数取值均为示例,...

主机监控

主机监控功能用于监控CPU、内存、Disk(磁盘)、Load(负载)、网络流量和网络数据包的各项指标。本文介绍主机监控功能和查看主机监控指标的操作步骤。功能入口 登录 ARMS控制台,在左侧导航栏选择 应用监控>应用列表。在 应用列表 页面...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
NAT网关 高速通道 共享流量包 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用