性能监控最佳实践

为了保证业务的稳定性和可靠性,企业需要对其系统进行全面的性能监控。而一体化性能监控就是一种集成了多种监控工具和技术的综合性监控方案,可以帮助企业更加全面、高效地监控其系统的性能。提高监控效率:传统的性能监控方案往往需要使用...

产品优势

开箱即用 稳定性保障 规模无上限 基于探针技术,在运行态进行字节码增强,无需修改代码,实现应用性能管理能力。容器服务ACK和ECS环境下探针自动注入,一键接入,支持探针自动升级。从探针注入、数据计算、数据存储、可视化呈现,到告警...

实时分析链路数据

变更三板斧“可灰度、可监控、可回滚”是保障线上稳定性的重要准则。其中,分批次灰度变更是降低线上风险、控制爆炸半径的关键手段。一旦发现灰度批次的服务状态异常,应及时进行回滚,而不是继续发布。然而,生产环境很多故障的发生都是...

包年包月概述

使用说明 在后续使用过程中,若您实际上报的自定义指标数量超出当前所选容量规格限制的指标额度时,可观测监控 Prometheus 版 会进行限流以保障服务稳定性;若您实际使用的容量规格已经超出购买容量规格时,您可以在 实例列表 页面的 操作 ...

计费概述

在后续使用过程中,若您实际上报的自定义指标数量超出当前所选容量规格限制的指标额度时,可观测监控 Prometheus 版 会进行限流以保障服务稳定性。若您实际使用的容量规格已经超出购买容量规格时,您可以在 实例列表 页面的 操作 列选择 ...

计费概述

在后续使用过程中,若您实际上报的自定义指标数量超出当前所选容量规格限制的指标额度时,可观测监控 Prometheus 版 会进行限流以保障服务稳定性。若您实际使用的容量规格已经超出购买容量规格时,您可以在 实例列表 页面的 操作 列选择 ...

包年包月概述

使用说明 在后续使用过程中,若您实际上报的自定义指标数量超出当前所选容量规格限制的指标额度时,可观测监控 Prometheus 版 会进行限流以保障服务稳定性;若您实际使用的容量规格已经超出购买容量规格时,您可以在 实例列表 页面的 操作 ...

版本说明

当进程下次启动时,将minidump主动上报到云监控,供后台进行分析和错误修复,以提升插件稳定性。修复问题 修复特定时区上报数据失败问题。修复进程Top5打开文件数异常问题。修复进程ID值超过100万时上报数据存在的精度损失问题。修复...

什么是ARMS前端监控

ARMS前端监控专注于对Web场景、Weex场景和小程序场景的监控,从页面打开速度(测速)、页面稳定性(JS诊断错误)和外部服务调用成功率(API)这三个方面监测Web和小程序页面的健康度。为什么要有前端监控?用户访问您的业务时,整个访问...

计费说明(容器服务实例)

在后续使用过程中,若您实际上报的自定义指标数量超出当前所选容量规格限制的指标额度时,可观测监控 Prometheus 版 会进行限流以保障服务稳定性;若您实际使用的容量规格已经超出购买容量规格时,您可以在 实例列表 页面的 操作 列选择 ...

计费说明(容器服务实例)

在后续使用过程中,若您实际上报的自定义指标数量超出当前所选容量规格限制的指标额度时,可观测监控 Prometheus 版 会进行限流以保障服务稳定性;若您实际使用的容量规格已经超出购买容量规格时,您可以在 实例列表 页面的 操作 列选择 ...

错误码和状态码说明

内网探测可以使用 创建可用性监控任务。PING 550 网络不通。610 网络稳定,但发出的所有包在2秒内均无响应,丢包率100%。613 无法通过主机解析IP地址。615 发出包部分超时,当默认丢包率大于10%时,定义为部分超时。617 探测目标的IP路由不...

如何重启云监控C++版本插件?

当您安装或配置云监控C++版本插件时,为了使其生效,需要重启插件。本文为您介绍在Windows和Linux操作系统中,重启云监控C++版本插件的操作方法。重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用...

配置网络

如果您的主机设置了防火墙,则需要将云监控的IP地址和端口加入防火墙的白名单,云监控插件才能和云监控服务器正常通信。操作步骤 以root用户登录云监控插件所在主机。重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,...

常用操作

本文为您介绍启用、停用和查看云监控插件的操作方法。重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统...

如何处理在阿里云主机上自动安装云监控插件失败问题?

如果您在阿里云主机上自动安装云监控插件失败,则请按照以下方法逐步排查。操作步骤 以root用户登录云监控插件所在的阿里云主机。重要 云监控仅支持通过管理员账号root操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致...

如何处理云监控插件异常停止问题?

当某个主机的云监控插件的状态为 已停止 时,云监控将不能对该主机进行监控。您需要判断该主机的云监控插件的停止原因,并恢复其运行状态。问题分析 云监控插件默认每3分钟一次心跳。如果15分钟没有心跳,则主机判断插件已停止运行。云监控...

安装和卸载云监控插件

当您需要通过云监控采集主机操作系统层面的监控指标,并对重要监控指标设置报警规则,以便及时关注其动态时,需要为主机安装云监控插件。当您不再需要通过云监控监控某台主机时,可以登录目标主机卸载云监控插件。本文为您介绍为主机自动...

概览

智能阈值报警是针对云监控中的云资源实例的监控指标推出的智能报警功能,它自动适配并拟合监控指标的历史数据,展示报警阈值边界,发现监控指标突增或突降的异常行为,为您业务的稳定性提供保障。什么是智能阈值 智能阈值基于机器学习算法...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

全局查询基于分布式的查询,并进行了性能优化,针对大量查询可以随时实现水平、纵向扩缩,查询性能、稳定性较好。开箱即用,基于阿里云 可观测监控 Prometheus 版 服务,您无需额外部署任何其他组件,极大地降低运维成本。优势三:轻量化...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

全局查询基于分布式的查询,并进行了性能优化,针对大量查询可以随时实现水平、纵向扩缩,查询性能、稳定性较好。开箱即用,基于阿里云 可观测监控 Prometheus 版 服务,您无需额外部署任何其他组件,极大地降低运维成本。优势三:轻量化...

如何处理云监控插件进程自动退出问题?

监控出于对您资源的保护,当您的资源消耗超过某个阈值时,云监控插件进程自动退出。本文为您介绍在Windows和Linux操作系统中,云监控插件进程自动退出的处理方法。重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,...

非阿里云主机如何通过Nginx代理服务器上报监控数据?

本文为您介绍非阿里云主机通过Nginx代理服务器上报监控数据至云监控的操作方法。步骤一:部署Nginx代理服务器 由于云监控部署在Linux服务器上,因此建议您的代理服务器选用Linux服务器。本文以CentOS操作系统为例。重要 您只能通过管理员...

如何卸载云监控插件?

您可以通过本操作卸载云监控Java、Go或C++版本插件。重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统...

如何使用Prometheus监控Kafka

可观测监控 Prometheus 版 持续对Kafka JMX Agent进行性能优化,增强其性能和稳定性。服务发现 ECS环境下,通过开源Static_Configs、三方注册中心等方式采集服务发现,使用不便,且维护成本高 除兼容开源SD外,还内置了aliyun_sd_configs,...

如何使用Prometheus监控Kafka

可观测监控 Prometheus 版 持续对Kafka JMX Agent进行性能优化,增强其性能和稳定性。服务发现 ECS环境下,通过开源Static_Configs、三方注册中心等方式采集服务发现,使用不便,且维护成本高 除兼容开源SD外,还内置了aliyun_sd_configs,...

什么是可观测监控 Prometheus 版

在完全兼容开源Prometheus生态,以开放的方式为用户提供服务的原则下,阿里云 可观测监控 Prometheus 版 帮助用户轻松构建全面、稳定、安全、高可用和高扩展的可观测平台。多场景应用监控 支持为Kubernetes容器应用、ECS集群(VPC)、...

什么是可观测监控 Prometheus 版

在完全兼容开源Prometheus生态,以开放的方式为用户提供服务的原则下,阿里云 可观测监控 Prometheus 版 帮助用户轻松构建全面、稳定、安全、高可用和高扩展的可观测平台。多场景应用监控 支持为Kubernetes容器应用、ECS集群(VPC)、...

管理线下IDC的数据接入任务

监控数据接入云监控后,您可以创建监控大盘,通过监控大盘查看指定监控指标的监控图表。前提条件 请确保云监控与线下IDC,以及线下IDC中间件所在主机之间可以正常通信。请确保您已创建指标仓库。具体操作,请参见 创建指标仓库。创建数据接...

通过企业监控大盘监控线下IDC的中间件

监控通过线下IDC中间件上的Exporter采集各主机上的监控指标,然后通过云监控插件将这些监控指标上报到云监控的指标仓库,并以图表形式展示。之后您还可以通过企业云监控提供的监控大盘(简称企业监控大盘)创建多样化的监控图表,并设置...

计费相关配置问题

如果您负责的是核心应用,数据流量大,稳定性要求高,需要尽最大可能保证系统可用。建议开通专家版,获取更丰富的监控诊断能力和海量额度的数据处理和存储。收到账单,如何查看应用监控的用量情况?如果想了解用量情况,您可以在 ARMS控制...

管理其他云厂商服务的数据接入任务

监控数据接入云监控后,您可以创建监控大盘和监控图表,通过监控大屏查看该云服务的监控指标。前提条件 请确保云监控与AWS或腾讯云服务所在主机之间可以正常通信。请确保您已创建指标仓库。具体操作,请参见 创建指标仓库。重要 您只能通过...

通过IO HANG诊断并排查磁盘繁忙问题

从业务稳定性角度来看,对于有IO访问需求的业务进程,IO HANG可能会引起进程长期阻塞,且在IO路径恢复之前,都无法对外提供服务。从系统稳定性角度来看,IO HANG可能会引起大量的进程进入等待状态,导致系统高负载,甚至系统夯住,shell...

什么是用户体验监控

RUM)专注于对Web场景、App移动应用场景和小程序场景的监控,以用户体验为切入点,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用...

2023年

2023年08月 功能名称 变更类型 功能描述 相关文档 泰国(曼谷)区域开服 新增 可观测监控 Prometheus 版 泰国(曼谷)区域开服 开服地域 Prometheus Agent组件4.0.0版本正式发布 新增 提升稳定性和性能,同时支持多项新能力。【组件升级】...

持续监控公网服务的可用

在互联网上暴露的服务通常是业务的入口,为了保证业务的持续和服务的稳定,需要持续监控当前及潜在用户的访问请求是否正常。因此需要持续模拟用户请求和访问服务,以便及时了解服务的可用和用户体验。建议通过网络分析与监控中的站点监控...

什么是应用安全

应用安全自身对性能、兼容性和稳定性有良好的控制,对应用运行的影响几乎可以忽略不计。实际测试中,CPU的额外开销小于1%,内存开销小于30 MB,应用延迟(RT)小于1 ms。此外,应用安全还提供观察模式、软熔断逃生机制等功能,最大限度降低...

【组件发布】Prometheus Agent发布公告

BugFix SendConfig下发采集配置逻辑,提升下发稳定性。BugFix RemoteWrite中解析Secret类型问题和传输Header问题。BugFix 多租场景Pod的Label缓存中更新不及时问题。BugFix Master对于OOM或者Restart副本偶发Targets下发异常,导致部分采集...

按量计费

计费规则 说明 适用场景 浏览器探测通过模拟用户在不同地域、不同网络环境下使用浏览器访问探测目标,观测探测目标在浏览器访问时的稳定性和性能。计费周期 按日计费。计费公式 浏览器探测费用=探测点探测次数×探测点单价。产品定价 中国...

ARMS统一告警管理最佳实践

等级 定义方式 认领(接手)时间 解决(关闭)时间 通知渠道 P4 需要采取行动的小问题,但不影响客户使用产品 24h 7Day IM通知(钉钉等)P3 需要运维人员立即关注的稳定性问题或影响客户的小问题 1h 24h 短信+IM通知(钉钉等)P2 严重影响...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 云服务器 ECS 轻量应用服务器 视图计算 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用