云监控通过安装在阿里云主机(ECS实例)上的云监控插件,采集GPU的监控数据,您还可以为这些监控项设置报警规则。当某个监控项达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提条件 请确保您已在云服务器ECS上创建GPU计算...
当您安装或配置云监控C++版本插件时,为了使其生效,需要重启插件。本文为您介绍在Windows和Linux操作系统中,重启云监控C++版本插件的操作方法。重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用...
当主机宕机、网络异常或插件停止服务时,云监控都会为您上报系统事件“心跳检查失败”。本文以阿里云主机为例,为您介绍云监控插件心跳检查失败的处理方法。操作步骤 检查主机的运行状态是否正常。具体操作,请参见 查看实例信息。是:执行...
云监控通过安装在阿里云主机(ECS实例)上的云监控插件,采集GPU的监控数据,您还可以为这些监控项设置报警规则。当某个监控项达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提条件 请确保您已在云服务器ECS上创建GPU计算...
本文为您介绍无法在云监控的 主机监控 列表中删除非阿里云主机的问题现象、根本原因和解决方案。问题现象 已在非阿里云主机上卸载云监控插件,但无法在云监控的 主机监控 列表中删除该主机。...如何重启云监控C++版本插件?
云监控出于对您资源的保护,当您的资源消耗超过某个阈值时,云监控插件进程自动退出。本文为您介绍在Windows和Linux操作系统中,云监控...rm/usr/local/cloudmonitor/agent.status 执行以下命令,重启云监控插件。cloudmonitorCtl.sh restart
监控配置管理等管控类操作 100.103.0.94:80 出方向 收集监控数据到云监控服务端 us-west-1(美国西部1 硅谷)100.103.0.95:3128 出方向 监控配置管理等管控类操作 100.100.29.7:80 出方向 收集监控数据到云监控服务端 eu-central-1(欧洲...
本文为您介绍非阿里云主机通过Nginx代理服务器上报监控数据至云监控的操作方法。步骤一:部署Nginx代理服务器 由于云监控部署在Linux服务器上,因此建议您的代理服务器选用Linux服务器。本文以CentOS操作系统为例。重要 您只能通过管理员...
本文介绍如何通过配置X-Pack来监控阿里云Logstash服务。开启X-Pack监控,并关联阿里云Elasticsearch实例后,即可在Kibana中监控Logstash服务。前提条件 您已完成以下操作:创建阿里云Logstash实例,具体操作请参见 创建阿里云Logstash实例...
当某个主机的云监控插件的状态为 已停止 时,云监控将不能对该主机进行监控。您需要判断该主机的云监控插件的停止原因,并...ps aux|grep argusagent|grep-v grep 相关文档 如何重启云监控C++版本插件?如何处理云监控插件心跳检查失败问题?
v2.8.1.2 重启探针 Kubernetes监控 支持手动重启探针。更多信息,请参见 探针管理。2021-08-19 请参见 Kubernetes监控目前支持的地域。v2.8.1.2 Kubernetes监控 容器监控更名 容器监控正式更名为 Kubernetes监控。2021-08-05 请参见 ...
进行应用监控的自定义设置(如调用链采样设置、Agent开关等)。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,...
journalctl-u chronyd 检查节点的监控 云监控 阿里云容器服务ACK集群集成了监控服务,可登录 云监控控制台 查看对应ECS实例的基本监控信息,关于云监控节点的使用方式,请参见 监控节点。Prometheus监控 登录 容器服务管理控制台。在控制台...
当您需要通过云监控采集主机操作系统层面的监控指标,并对重要监控指标设置报警规则,以便及时关注其动态时,需要为主机安装云监控插件。当您不再需要通过云监控来监控某台主机时,可以登录目标主机卸载云监控插件。本文为您介绍为主机自动...
本文介绍如何使用Prometheus监控Windows。前提条件 已将VPC实例接入 可观测监控 Prometheus 版。具体操作,请参见 Prometheus实例 for ECS。使用限制 目前仅Prometheus实例 for ECS类型实例支持该组件接入。Windows Metric监控参考模型 ...
本文介绍如何使用Prometheus监控Windows。前提条件 已将VPC实例接入 可观测监控 Prometheus 版。具体操作,请参见 Prometheus实例 for ECS。使用限制 目前仅Prometheus实例 for ECS类型实例支持该组件接入。Windows Metric监控参考模型 ...
本文以Python SDK为例,为您介绍如何通过OpenAPI调用DescribeMetricList接口查询云产品的监控数据。步骤一:查看OpenAPI文档 通过阅读 API概览 得知,查询云产品监控数据的OpenAPI为 DescribeMetricList。请您根据文档,了解调用该接口需要...
运行 reboot 重启ECS实例,并在重启过程中出现内核选项界面时按下键盘e键,进入GRUB界面。跳转界面如下。使用键盘的方向键,移动光标至 linux 开头的一行,并在本行中将 ro 至末尾的内容替换为 rw init=bin/sh crashkernel=auto。替换后的...
当您重启ECS实例或为ECS实例续费后,云监控插件会继续运行。关于ECS实例如何续费,请参见 如何续费包年包月实例 或 自动续费。相关文档 如何处理云监控插件未随着阿里云主机的释放而自动删除问题?如何卸载云监控插件?
EDAS已于北京时间2020年02月13日对监控和报警功能进行了全面升级,监控数据、监控大盘和监控报警等功能都将所有增强。此次升级可能会对您的使用带来一些影响,请务必详细了解以下内容。升级影响 注意 本次更新仅对ECS集群上的HSF应用有影响...
[相关文档:内存快照]新增监控方法自定义配置功能,让您可以自行动态配置要监控和捕获异常的具体方法,使监控细粒度范围进一步扩大,并且配置立即生效,无需重启机器。新增应用监控概览页,问题排查和定位更加方便准确。新增MQ链路监控,可...
前提条件 已为应用安装探针,具体操作,请参见 应用监控接入概述。功能入口 登录 ARMS控制台,在左侧导航栏选择 应用监控>应用列表。在 应用列表 页面顶部选择目标地域,然后单击目标应用名称。说明 语言 列显示 图标的应用为接入应用监控...
如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...
本文主要介绍了ARMS应用监控Java探针的版本更新历史。查看探针版本 登录 ARMS控制台。在左侧导航栏选择 应用监控>探针在线状态,然后在顶部菜单栏选择目标地域。单击 探针版本发布说明 页签,查询ARMS在2021年09月份之后正式发布的所有探针...
重要 应用监控的启停修改即时生效,无需重启应用。如果暂停应用监控,则系统将无法监控您的应用,请谨慎操作。要使对各插件开关的修改生效,必须手动重启应用。线程分析设置 在 线程分析设置 区域,可以打开或关闭线程分析总控开关、定期...
如果发现有Pod由于OOM Killer导致重启,如何通过ARMS应用监控排查?答:ARMS应用监控对于堆内存、直接缓冲区的容量规划问题,比较容易排查。但由于ARMS应用监控是从JMX获取内存数据,无法覆盖整个JVM进程的RSS消耗,因此OOM Killer问题需要...
EDAS于2020年2月13日对监控报警功能进行了升级,经过4个月的迁移过渡期,绝大部分用户已经对应用进行了重启,并完成迁移。EDAS项目组决定于2020年8月31日将老版本的监控报警系统下线。下线影响 旧版监控报警功能下线以后,将会对EDAS产品...
Fluid组件重启情况 表示集群在2分钟监控周期内,各组件发生重启的次数,仅显示发生重启次数最多的5个组件。Fluid控制器详细指标 Runtime控制器处理耗时 表示在一个监控周期内,Runtime控制器处理对应Runtime资源的耗时,以分位数显示。...
应用监控 eBPF 版 已对接Prometheus,并支持通过Grafana大盘展示 应用监控 eBPF 版 监控数据。本文以 可观测监控 Prometheus 版 为例介绍如何将 应用监控 eBPF 版 监控指标导入指定Prometheus实例。前提条件 Kubernetes集群已接入 可观测...
本文介绍如何使用Prometheus监控阿里云kafka及自建Kafka。自建Prometheus观测Kafka的痛点 使用自建Prometheus观测Kafka,可能面临的典型问题有以下几点:由于安全、组织管理等因素,您的业务通常部署在多个相互隔离的VPC,因此这需要您在多...
本文介绍如何使用Prometheus监控阿里云kafka及自建Kafka。自建Prometheus观测Kafka的痛点 使用自建Prometheus观测Kafka,可能面临的典型问题有以下几点:由于安全、组织管理等因素,您的业务通常部署在多个相互隔离的VPC,因此这需要您在多...
基础探针是指那些与环境类型紧密相关,并提供基本功能的探针。这些探针通常是接入中心接入项目所依赖的核心。因此,在执行数据接入流程时,系统会默认安装所需的基础探针。...安装成功后,您可以重启、卸载探针以及查看自监控。
基础探针是指那些与环境类型紧密相关,并提供基本功能的探针。这些探针通常是接入中心接入项目所依赖的核心。因此,在执行数据接入流程时,系统会默认安装所需的基础探针。...安装成功后,您可以重启、卸载探针以及查看自监控。
本文为您介绍启用、停用和查看云监控插件的操作方法。重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统...
当您不需要再使用ARMS监控您的应用,并且需要在ARMS中删除您的应用时,可以在应用设置页面彻底删除。重要 ARMS应用监控面向已开通新版计费的用户提供全新的监控详情页面,新版计费详情,请参见 产品计费(新版)。对于未开通新版计费的用户...
云监控与Grafana的集成方式包括企业云监控提供的监控大盘(简称企业监控大盘)和Grafana插件,企业监控大盘还支持云下自建Grafana。本文为您介绍如何通过Grafana插件可视化查看监控数据。背景信息 如果您想了解云监控与Grafana的其他集成...
监控云电脑或 云电脑池 核心资源的利用率和网络数据运行情况,有助于全面了解云电脑资源的使用情况和健康状态。本文介绍如何查看云电脑监控信息。前提条件 您需要先获取相应的查看或者操作权限。详细信息,请参见 监控报警概述。查看监控...
当您不需要再使用ARMS监控您的应用,并且需要在ARMS中删除您的应用时,可以在应用设置页面彻底删除。操作步骤 登录 ARMS控制台,在左侧导航栏选择 应用监控>应用列表。在 应用列表 页面顶部选择目标地域,然后单击目标应用名称。说明 语言 ...
事件Code 事件名称 事件等级 云监控事件名称 事件说明和影响 用户侧处理建议 SystemMaintenance.Reboot 因系统维护实例重启 严重 Instance:SystemMaintenance.Reboot:Inquiring:因系统维护实例需重启问询中 Instance:SystemMaintenance....
步骤二:授予ARMS资源的访问权限 如果需监控ASK(容器服务Serverless版)或对接了ECI的集群应用,请在 云资源访问授权 页面完成授权,然后重启ack-onepilot组件下的所有Pod。如果需监控ACK集群应用,但ACK集群中不存在ARMS Addon Token,请...