可观测性的设计原则

可观测性设计是指为了更监控、分析和管理系统运行状态而进行的设计。在云原生、微服务等技术越发流行的今天,系统的可观测性变得越来越复杂。云上的可观测性主要从监控指标、链路追踪、日志记录、监控看板和事件告警五大方面来进行设计...

性能监控概念

性能监控是指在软件、硬件或系统运行期间对其性能指标进行监测和记录,以便分析和优化系统性能。通过收集和分析性能数据,可以识别系统瓶颈、优化资源分配、提高系统可靠性和稳定性等。性能监控通常包括对系统资源的监控,如CPU、内存、...

2021年

v2.8.1.1 2021年07月 模块 功能名称 功能概述 发布时间 支持地域 版本号 容器监控 新增国际地域 阿里云容器监控新增以下6个地域:新加坡 印度尼西亚(雅加达)日本(东京)美国(硅谷)美国(弗吉尼亚)德国(法兰克福)容器监控支持的所有...

系统运维工具集SysAK使用说明

除此之外,还实现了许多增强的系统指标,实时监控系统的干扰和抖动等情况。问题诊断:针对负载异常、网络抖动、内存泄露、IO夯、性能异常等情况提供线上诊断功能。同时减少工具的专业性,可操作性强。故障修复:对于非整机异常的问题(例如...

Java应用监控和诊断方案

基于ARMS的应用监控方案 ARMS提供的 应用监控 功能,脱胎于阿里巴巴内部的分布式跟踪与监控系统(内部称为“鹰眼系统”),可以在不修改任何现有代码的情况下帮助网站开发人员和运维人员解决上述问题。调用拓扑图 您可以在ARMS中看到应用的...

使用API查询监控数据

大型企业内部通常有自建的运维监控系统,上云过程中会面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据,从而将阿里云的监控数据与现有系统进行集成。指标类监控数据查询的接口 云...

规则管理

自定义监控规则帮助您根据实际业务需求,自定义监控规则,监控任务运行状态或资源使用情况,以便及时发现并处理异常。本文为您介绍如何在规则管理页面自定义报警规则,以及添加钉钉群机器人获取Webhook地址。使用限制 自定义监控规则仅对...

发现和排查实例问题

监控控制台的主机监控页的 操作系统监控 页签下展示的运行指标如下:实例计算、存储、网络的资源使用情况,例如CPU使用率、磁盘读写情况、网络收发包数量等。实例内活跃进程的信息。GPU实例的显存使用情况。利用报警服务自动通知 使用云...

查看仪表盘

水位监控 用于实时可视化展示Kubernetes中资源的水位情况,包括Pod运行数、CPU总数、文件系统使用量等。运行监控 用于实时可视化展示Kubernetes中处于运行状态的资源信息,包括Deployment运行数量、Daemonset运行数量等。核心组件监控 ...

前端监控场景

现有的Server端监控系统相对已经很成熟了,而页面加载和页面运行时的状态监控一直比较欠缺。主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况...

ARMS统一告警管理最佳实践

为了监控这些复杂的IT环境,企业通常会选择使用异构监控系统,例如Prometheus、Grafana、Zabbix等,以获取更全面的监控数据,以便更地了解其IT基础设施的运行状况和性能表现。然而,这种异构监控系统也带来了一些问题,其中最显着的是告...

监控与日志

您可以通过VPN网关的系统事件和监控指标信息来判断系统是否按照预期运行,同时您也可以对系统事件和监控指标设置报警规则,以便在系统运行异常时,您可以收到报警通知,及时处理问题。系统事件监控 阿里云云监控服务的事件监控功能自动汇集...

2023年

管理Prometheus实例 支持MicroMeter数据集成 新增 MicroMeter可收集更多的应用程序度量数据,例如请求处理时间、线程池大小、内存使用情况等,这些数据可以为Prometheus提供更详细的监控数据,帮助用户更精细地了解系统运行情况和性能瓶颈...

监控与日志

您可以通过云企业网的系统事件和监控指标信息来判断系统是否按照预期运行,同时您也可以对系统事件和监控指标设置报警规则,以便在系统运行异常时,您可以收到报警通知,及时处理问题。系统事件监控 阿里云云监控服务的事件监控功能自动...

如何处理云监控插件异常停止问题?

查看插件的运行状态和日志 重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,...

2023年

如何创建跨账号GlobalView实例 支持MicroMeter数据集成 新增 Micrometer可收集更多的应用程序度量数据,例如请求处理时间、线程池大小、内存使用情况等,这些数据可以为Prometheus提供更详细的监控数据,帮助用户更精细地了解系统运行情况...

智能监控概述

智能监控功能支持您通过配置自定义规则,实现对任务运行状态及资源使用情况的监控;通过配置智能基线,保障复杂依赖场景下重要数据在预期时间内正常产出。同时,您还可以根据业务需求自定义资源组运维规则,实现资源组的自动化运维。功能...

什么是ARMS前端监控

现有的服务器端监控系统相对已经很成熟,而页面加载和页面运行时的状态监控一直比较欠缺。例如:无法第一时间获知用户访问您的站点时遇到的错误。各个国家、各个地区的用户访问您的站点的真实速度未知。每个应用内有大量的异步数据调用,而...

操作流程

使用全景监控服务时,首先进行监控相关的基础设置,然后再监控管理配置监控任务关联告警配置,按照业务视角配置业务链路。配置完成后,可以在监控明细、业务链路和监控概览中查看监控信息。本文介绍全景监控的业务操作基本流程。全景监控的...

操作流程

使用全景监控服务时,首先进行监控相关的基础设置,然后再监控管理配置监控任务关联告警配置,按照业务视角配置业务链路。配置完成后,可以在监控明细、业务链路和监控概览中查看监控信息。本文介绍全景监控的业务操作基本流程。全景监控的...

全景监控

全景监控支持业务链路配置监控场景,通过自定义监控链路和告警消息配置,可快速实现从数据生产到业务应用的全链路编排及溯源,实现全局监控和问题快速锁定。全景监控提供丰富的告警信息输出方式,包括:钉钉消息、标准协议等方式,出现问题...

功能简介

全景监控支持业务链路配置监控场景,通过自定义监控链路和告警消息配置,可快速实现从数据生产到业务应用的全链路编排及溯源,实现全局监控和问题快速锁定。全景监控提供丰富的告警信息输出方式,包括:钉钉消息、标准协议等方式,出现问题...

功能简介

全景监控支持业务链路配置监控场景,通过自定义监控链路和告警消息配置,可快速实现从数据生产到业务应用的全链路编排及溯源,实现全局监控和问题快速锁定。全景监控提供丰富的告警信息输出方式,包括:钉钉消息、标准协议等方式,出现问题...

查看应用分组

在目标应用分组的左侧导航栏,您可以根据所需查看该应用分组的 组内资源、监控视图、故障列表、可用性监控、组进程监控系统事件、自定义事件、日志监控、自定义监控、报警历史、报警规则 和 业务监控。功能 说明 组内资源 您可以查看目标...

安装和卸载云监控插件

当您需要通过云监控采集主机操作系统层面的监控指标,并对重要监控指标设置报警规则,以便及时关注其动态时,需要为主机安装云监控插件。当您不再需要通过云监控监控某台主机时,可以登录目标主机卸载云监控插件。本文为您介绍为主机自动...

Spring Boot应用如何快速接入Prometheus监控

在使用Spring Boot应用过程中,为了对系统的状态进行持续地观测,您可以将Spring Boot应用接入Prometheus监控。本文介绍如何将Spring Boot应用快速接入Prometheus监控。背景信息 对于开发者而言,大部分传统SSM结构的MVC应用背后的糟糕体验...

Spring Boot应用如何快速接入Prometheus监控

在使用Spring Boot应用过程中,为了对系统的状态进行持续地观测,您可以将Spring Boot应用接入Prometheus监控。本文介绍如何将Spring Boot应用快速接入Prometheus监控。背景信息 对于开发者而言,大部分传统SSM结构的MVC应用背后的糟糕体验...

查询云监控插件运行状态

调用DescribeMonitoringAgentStatuses接口查询云监控插件运行状态。接口说明 本文将提供一个示例,查询实例 i-hp3dunahluwajv6f*的云监控插件的运行状态。返回结果显示云监控插件的运行状态为 running(运行中)。调试 您可以在OpenAPI ...

版本说明

本文为您介绍云监控插件的版本发布信息。3.5.11 分类 说明 发布时间 2024-03-25 新特性 Windows正式支持x64。支持IPv6。支持HTTP2。支持macOS和FreeBSD(基于sigar库)。代理扩展为支持七种代理协议:HTTP、HTTPS、HTTPS/2、Socks4、Socks4...

版本升级说明

监控插件可以采集主机操作系统监控数据,对主机监控有重要价值。云监控插件将不断升级版本,以便给您带来更监控体验。升级原因 云监控插件版本的升级原因如下:云监控插件会一直迭代新版本,从而增加新特性、修复稳定性问题和优化...

监控与日志

监控与日志可有效保障您文件存储NAS资源的可用性、业务的正常运行和健康度。您可通过对应的监控能力,持续收集监控数据。阿里云提供了各种监控与日志审计相关的服务,例如云监控、配置审计等,帮助您实时监控云资源的使用情况和业务运行...

告警规则指标说明

异常监控 指标说明 指标名称 单位 是否为常用指标 指标说明 异常发生次数 无 是 在软件系统运行过程中发生的各种异常的次数,如空指针异常、数组越界异常、IO异常等。可以根据该指标判断调用堆栈是否抛错,从而判断是否存在应用调用异常。...

使用系统事件报警

事件类型 说明 支持的云产品 系统事件 云监控为您提供各云产品系统事件的统一查询入口,以便您及时了解各云产品的运行状态,并接收报警通知。支持的云产品和系统事件 自定义事件 您可以通过云监控的自定义事件上报接口,将目标云产品的异常...

管理系统事件报警规则(旧版)

事件类型 说明 支持的云产品 系统事件 云监控为您提供各云产品系统事件的统一查询入口,使您及时得知各云产品的运行状态,并接收报警通知。支持的云产品和系统事件 自定义事件 您可以通过云监控的自定义事件上报接口,将目标云产品的异常...

监控与日志

监控站点资源 监控服务器级别资源 Linux操作系统独享云虚拟主机 除了监控站点资源的使用情况,包括站点运行情况,流量使用情况、网页空间使用情况、数据库空间使用情况外,还支持监控服务器级别的资源,包括CPU、内存和带宽等监控信息,...

基本概念

概念 说明 Exporter 和监控对象伴生运行的应用。通常用于将监控对象存量的监控数据转换成 可观测监控 Prometheus 版 可以识别的OpenMetrics数据格式,暴露指标。目前有100+官方或者三方Exporter可供使用,请参见 Exporter详情。Job 一组...

基本概念

概念 说明 Exporter 和监控对象伴生运行的应用。通常用于将监控对象存量的监控数据转换成 可观测监控 Prometheus 版 可以识别的OpenMetrics数据格式,暴露指标。目前有100+官方或者三方Exporter可供使用,请参见 Exporter详情。Job 一组...

离线任务监控概述

离线任务监控功能支持您通过配置监控规则实现对离线任务的运行状态进行监控。在离线任务触发所配置的监控规则时,系统将根据所配置的接收人发送报警,以协助您 保障 任务的正常运行和数据的产出。功能介绍 离线任务中支持对Basic项目或者...

离线任务监控概述

离线任务监控功能支持您通过配置监控规则实现对离线任务的运行状态进行监控。在离线任务触发所配置的监控规则时,系统将根据所配置的接收人发送报警,以协助您 保障 任务的正常运行和数据的产出。功能介绍 离线任务中支持对Basic项目或者...

项目空间运维与监控

日志监控 当我们在项目空间中运行测试作业时,若运行过程中作业报错或作业失败,在下方的调试框内会给出相应的执行日志以及错误判断信息,在运行记录当中可以查看过往的提交信息,以供用户排查作业问题,如下图:日志监控运行记录列表图...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 轻量应用服务器 视图计算 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用