如何使用Linux系统的atop监控工具

安装atop Alibaba Cloud Linux操作系统 本步骤以Alibaba Cloud Linux 3.2104 LTS 64位操作系统的ECS实例为例,介绍如何安装atop监控工具。远程连接ECS实例。具体操作,请参见 连接方式概述。执行如下命令,安装atop。sudo yum install atop...

性能监控最佳实践

而一体化性能监控就是一种集成了多种监控工具和技术的综合性监控方案,可以帮助企业更加全面、高效地监控其系统的性能。提高监控效率:传统的性能监控方案往往需要使用多个不同的监控工具,例如网络监控、服务器监控、数据库监控等。这些...

业务监控概述

ARMS业务监控优势 传统的监控工具大多从基础架构、应用系统和请求等角度去衡量应用健康度,然而这些衡量指标缺乏业务语义,无法直观地体现。例如当日下单平均响应时间、成功率等业务问题。ARMS业务监控提供从业务视角衡量应用性能和稳定性...

告警管理概述

告警管理默认支持一键化集成阿里云常见的监控工具,并支持更多的监控工具手动接入,方便统一维护。事件接入模块稳定,能提供7×24小时的无间断事件处理服务。处理海量事件数据时可以保证低延时。及时准确地将告警通知给联系人。配置通知...

版本功能对比

ARMS应用监控是一款面向应用性能管理的监控工具,结合了业界先进的分布式应用监控和链路追踪理论模型与阿里巴巴集团内部实践,为您提供更加全面的面向应用的实时监控服务。各版本的计费详情,请参见 ARMS定价详情。产品功能 基础版 专家版 ...

Alibaba Cloud Linux 2系统的ECS实例创建大量进程失败...

本文为您介绍Alibaba Cloud Linux 2系统的ECS实例创建大量进程失败的原因及解决方案。问题描述 Alibaba Cloud Linux 2系统的ECS实例中执行系统调用(fork/clone)时,进程创建失败,返回“-1 EAGAIN(Resource temporarily unavailable)”...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

集成事件后管理更高效 告警管理默认支持一键化集成阿里云常见的监控工具,并支持更多的监控工具手动接入,方便统一维护。事件接入模块稳定,能提供7×24小时的无间断事件处理服务。处理海量事件数据时可以保证低延时。及时准确地将告警通知...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

集成事件后管理更高效 告警管理默认支持一键化集成阿里云常见的监控工具,并支持更多的监控工具手动接入,方便统一维护。事件接入模块稳定,能提供7×24小时的无间断事件处理服务。处理海量事件数据时可以保证低延时。及时准确地将告警通知...

名词解释

故障 业务的规则会引起监控数据异常,监控工具检测到异常后会生成事件。[回到顶部]H 环比上升/下降%若β为最近N分钟的数据(可选择为平均值、总和、最大值和最小值),α为前2N分钟到前N分钟的数据,环比为β与α做比较。J 集成 大多数监控...

ARMS统一告警管理最佳实践

常用监控工具告警快捷接入能力 ARMS默认提供了云上云下多种监控系统的告警接入能力,可以参考 集成概述 进行快速接入。ARMS告警管理如何统一告警等级?ARMS中将告警分为P1、P2、P3、P4四个等级。通过配置映射表,将多个不同类型的等级归一...

Block IO限流增强监控接口

为了更方便地监控Linux block IO限流,Alibaba Cloud Linux 2(内核版本 4.19.81-17.al7 开始)和Alibaba Cloud Linux 3增加相关接口,用于增强block IO限流的监控统计能力。本文主要介绍新增接口及使用示例。背景信息 很多场景中您会用到...

如何查看Linux系统网络流量负载情况?

iftop工具的使用 iftop是Linux系统中一个免费的网卡实时流量监控工具,可以监控包括指定网卡的实时流量、端口连接信息、反向解析IP等信息。iftop命令 iftop常用命令如下。iftop[-i interface]interface表示网络接口名,比如eth0、eth1等。...

Linux实例存在OOM问题的处理方法

信息点 获取途径 备注 OOM发生的时间和频率 Linux系统日志 您的业务应用日志 Linux系统日志路径如下:/var/log/message Linux实例的系统负载情况 云监控 负载查询工具 推荐使用云监控查询您的ECS实例负载信息。如果您没有使用云监控产品,...

监控数据导出到自建Prometheus

基于该场景,云监控推出了监控数据实时导出工具。该工具可以在客户的线下运行,根据配置实时获取云监控监控数据,并持续写入本地Prometheus。方案优势 更快更实时的基于企业云监控的实时数据导出功能流式导出监控数据,无需担心数据丢失...

通过命令行(CLI)上报监控数据

安装和配置阿里云命令行(CLI)工具 安装阿里云命令行(CLI)工具,操作方法请参见 在Windows上安装阿里云CLI 或 在Linux上安装阿里云CLI。上报监控数据 使用 PutCustomMetric 接口上报自定义监控数据,请参见 PutCustomMetric。示例如下:...

通过命令行(CLI)上报事件监控数据

安装和配置阿里云命令行(CLI)工具 安装阿里云命令行(CLI)工具,操作方法请参见 在Windows上安装阿里云CLI 或 在Linux上安装阿里云CLI。上报监控数据 使用 PutCustomEvent 接口上报事件监控数据,请参见 PutCustomEvent。示例如下:...

常见问题

产品FAQ 实例FAQ 镜像生命周期问题 块存储FAQ 快照FAQ 计费FAQ 安全FAQ 网络FAQ 运维与监控FAQ API FAQ 迁云工具FAQ 最新发布 使用ping命令测试ECS实例时ping不通的排查方法 如何在Linux实例中自定义配置DNS 如何迁移Linux实例系统盘中的...

DescribeCommonOverallConfigList-查询防御开关的配置

5507:Linux 恶意驱动 USER-ENABLE-SWITCH-TYPE_50876:Linux 对抗安全软件 USER-ENABLE-SWITCH-TYPE_53168:Linux 进程调试 USER-ENABLE-SWITCH-TYPE_54699:Linux 劫持动态链接库 USER-ENABLE-SWITCH-TYPE_62981:Linux 绕过安全监控 ...

如何重启云监控C++版本插件?

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。Windows 以...

内核功能与接口概述

追踪IO时延 Alibaba Cloud Linux 2所有内核版本 Alibaba Cloud Linux 3所有内核版本 Alibaba Cloud Linux优化了IO时延分析工具iostat的原始数据来源/proc/diskstats接口,增加了对设备侧的读、写及特殊IO(discard)等耗时的统计,此外还...

操作系统监控

监控通过安装在阿里云主机(ECS实例)和非阿里云主机上的云监控插件,为您采集丰富的操作系统层面的监控指标,您可以为操作系统监控指标设置报警规则。当某个监控指标达到报警条件时,会给您发送报警通知,以便您及时关注其动态。前提...

如何处理云监控插件进程自动退出问题?

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。Windows 以...

追踪IO时延

Alibaba Cloud Linux 2和Alibaba Cloud Linux 3优化了IO时延分析工具iostat的原始数据来源/proc/diskstats 接口,增加了对设备侧的读、写及特殊IO(discard)等耗时的统计,此外还提供了一个方便追踪IO时延的工具bcc。本文将分别介绍优化后...

捕获内核的内存污染问题(KFENCE)

功能介绍 KFENCE(Kernel Electric-Fence)是Linux内核内置的、可在线上环境开启的工具,用于捕获内核及内核模块的内存污染问题,在 上游Linux内核社区 的 5.12 版本中引入。KFENCE的目标是通过在内存边界附近插入特殊的标记(fence),来...

非阿里云主机如何通过Nginx代理服务器上报监控数据?

步骤一:部署Nginx代理服务器 由于云监控部署在Linux服务器上,因此建议您的代理服务器选用Linux服务器。本文以CentOS操作系统为例。重要 您只能通过管理员账号root部署Nginx代理服务器。使用管理员账号具有一定风险,如果操作不当可能导致...

查看NAS性能监控

文件存储 NAS 已与云监控无缝集成。通过性能监控功能,您可以实时查看文件系统的IOPS、吞吐、延迟等性能概况。本文介绍如何查看 NAS 文件系统的性能监控数据。前提条件 已创建 NAS 文件系统。具体操作,请参见 创建文件系统。已开通云监控...

监控VPC网络下ECS实例中的Java应用

Micrometer作为底层的度量工具,是监控度量的门面,相当于SLF4J在日志框架中的作用,其支持按照各种格式来暴露数据,包括Prometheus格式。修改Spring Boot配置文件。如果您的Spring Boot配置文件为application.properties格式,请参考以下...

特性与优势

通过更新的Linux内核、用户态软件及工具包,为云上应用程序环境提供Linux社区的最新操作系统增强功能:Alibaba Cloud Linux 3选择Linux kernel 5.10 LTS,同时默认搭载GCC 10.2、binutils 2.35、glibc 2.32等基础软件。Alibaba Cloud Linux...

系统运维工具集SysAK使用说明

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。运维场景 阿里云通过对百万服务器运维经验...

配置blk-iocost权重限速

254:48 is_active=1 active=50 inuse=50 hweight_active=5957 hweight_inuse=5957 vrate=159571 ftrace监测工具 Alibaba Cloud Linux内核提供了blk-iocost相关的ftrace工具。对于 blk-iocost 功能,ftrace可以帮助捕捉调度器的决策过程,...

如何处理云服务器ECS内网流量增高问题?

处理方法 云服务器ECS部署在Linux和Windows上的处理方法如下:Linux 说明 NetHogs是一个开源的命令行工具(类似于Linux的top命令),用来按进程或程序实时统计网络带宽使用率。下载NetHogs。执行以下命令,安装NetHogs。yum install ...

Alibaba Cloud Linux 2镜像发布记录

阿里云定期发布Alibaba Cloud Linux 2镜像的更新版本,以确保用户可以获取到最新的操作系统特性、功能和安全补丁。您可以通过本文查看Alibaba Cloud Linux 2镜像最新的可用版本及更新内容。背景信息 如无特殊声明,更新内容适用于云服务器...

Alibaba Cloud Linux 3镜像发布记录

阿里云定期发布Alibaba Cloud Linux 3镜像的更新版本,以确保用户可以获取到最新的操作系统特性、功能和安全补丁。您可以通过本文查看Alibaba Cloud Linux 3镜像最新的可用版本及更新内容。背景信息 如无特殊声明,更新内容适用于云服务器...

如何使用Prometheus监控SNMP

本文介绍如何使用Prometheus监控SNMP。前提条件 已创建 容器服务类型的Prometheus实例,具体操作,请参见 Prometheus实例 for 容器服务。使用限制 目前仅Prometheus实例 for 容器服务类型实例支持该组件接入。SNMP简介 SNMP系统组成 SNMP...

如何使用Prometheus监控SNMP

本文介绍如何使用Prometheus监控SNMP。前提条件 已创建 容器服务类型的Prometheus实例,具体操作,请参见 Prometheus实例 for 容器服务。使用限制 目前仅Prometheus实例 for 容器服务类型实例支持该组件接入。SNMP简介 SNMP系统组成 SNMP...

持续剖析

JDK版本 ARMS的持续剖析功能使用Java虚拟机工具接口(Java Virtual Machine Tool Interface,简称 JVM TI)获取应用的方法栈,从而获得应用运行期间的CPU以及内存使用详情。JVM TI存在已知的 Crash问题,可能导致应用崩溃,这个问题在...

如何使用Prometheus监控Windows

监控大盘 这里参考Linux广泛使用的Node Exporter监控大盘,并结合Windows自身的特点,建议服务提供的默认监控大盘至少包含以下指标Panel:指标分类 指标项 CPU CPU使用率(%):Windows正常运行最重要的指标之一。DPC队列长度、等待线程...

如何使用Prometheus监控Windows

监控大盘 这里参考Linux广泛使用的Node Exporter监控大盘,并结合Windows自身的特点,建议服务提供的默认监控大盘至少包含以下指标Panel:指标分类 指标项 CPU CPU使用率(%):Windows正常运行最重要的指标之一。DPC队列长度、等待线程...

接入持续剖析功能

JDK版本 ARMS的持续剖析功能使用Java虚拟机工具接口(Java Virtual Machine Tool Interface,简称 JVM TI)获取应用的方法栈,从而获得应用运行期间的CPU以及内存使用详情。JVM TI存在已知的 Crash问题,可能导致应用崩溃,这个问题在...

如何避免因cgroup引起的应用性能抖动?

系统通过cgroup可以对系统内的资源进行分配、管理、监控等操作。不合理的cgroup层级或数量可能引起系统中应用性能的不稳定。本文主要介绍问题现象以及如何避免该类问题的出现。问题现象 在容器相关的业务场景下,系统中的应用偶然会出现...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 应用实时监控服务 视图计算 云数据库 RDS 轻量应用服务器 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用