性能监控指标

双核CPU 1s内非空闲态运行时间分别为0.4s和0.6s,那么,总体CPU使用率就是(0.4s+0.6s)/(1s*2)=50%,其中2表示CPU核数,多核CPU同理。在Linux系统下,使用top命令查看CPU使用情况,可以得到如下信息:Cpu(s):0.2%us,0.1%sy,0.0%ni,77.5%id,2...

评分规则

评分规则表 RDS MySQL、自建MySQL和 PolarDB MySQL版:扣分项 含义 扣分子项 条件 所扣分数 CPU使用率(cpuUsage)一天CPU平均使用率,多核CPU换算成单核计算。警告 70%(cpuUsage-0.7)*20 危险 cpuUsage>=80%min[3+(cpuUsage-0.8)*30,10]...

轻量容器服务概述

套餐配置 80元/月的套餐 120元/月的套餐 CPU 2 2 内存 1 GB 2 GB 峰值带宽 3 Mbps 4 Mbps 使用限制 同一个阿里云账号下,轻量应用服务器实例、轻量应用负载均衡实例和轻量容器服务实例存在的总数量上限为20台。同一个轻量容器服务,最...

如何使用Linux系统的atop监控工具

CPUCPU整体的使用情况,即多核CPU作为一个整体CPU资源的使用情况。CPU行各个字段数字相加结果为N*100%,其中N为CPU的核数。sys、user:CPU在用于处理进程时,进程在内核态及用户态所占CPU的时间比例。irq:CPU用于处理中断的时间比例。...

操作系统监控

Linux 进程的CPU使用率和内存使用率可参考 top 命令,CPU使用率为多核使用情况。Host.process.openfile可参考 lsof 命令。Host.process.number可参考 ps aux|grep '<关键字>' 命令。监控指标名称 监控指标含义 单位 MetricName Dimensions ...

进程监控

云监控采集CPU消耗Top5进程的CPU使用率,可能存在以下问题:如果您的进程占用CPU,则会出现CPU使用率超过100%的情况,因为采集结果为多核CPU的总使用率。如果您查询的时间范围内,CPU消耗Top5的进程不固定,进程列表会显示该时间范围内...

Linux系统CPU使用率和负载高排查方法

本文主要介绍当Linux实例CPU使用率或CPU负载较高时,如何排查分析及常见案例说明。操作场景 在您使用轻量应用服务器实例过程中,可能会遇到实例CPU使用率或CPU负载持续较高的情况,您可以按照以下步骤排查定位具体问题。找到影响CPU使用率...

安装备份客户端

使用 云备份 备份本地数据中心的服务器或虚拟机中的文件目录前,您需要在本地服务器安装备份客户端。客户部包括Windows版本和Linux版本,按照您服务器的操作系统选择即可。(推荐)使用RAM用户AccessKey RAM是阿里云提供的用户身份管理与...

Linux系统的ECS实例CPU使用率或CPU负载较高问题的排查...

本文主要介绍当Linux系统ECS实例CPU使用率或CPU负载较高时,如何排查分析及常见案例说明。操作场景 在您使用ECS实例过程中,可能会遇到实例CPU使用率或CPU负载持续较高的情况,您可以按照以下步骤排查定位具体问题。找到影响CPU使用率或CPU...

诊断项与诊断结果说明

检查CPU使用率的方法,请参见 Linux系统CPU负载的查询和案例分析 Linux系统的ECS实例CPU使用率或CPU负载较高问题的排查及解决方案。selinux状态检查 检查SELinux是否开启。检查该实例是否开启了SELinux服务。如果开启了SELinux服务,会导致...

常见问题

Understanding Linux CPU Load-when should you be worried?QPS 该实例所有 Node.js 进程每秒钟处理的 HTTP 请求数之和。GC gc_avg:所有 Node.js 进程垃圾回收时间占比平均值。gc_max:每分钟内垃圾回收时间最的 Node.js 进程的垃圾回收...

CPU Burst性能优化策略

例如对于CPU Limit=2的容器,操作系统内核会限制容器在每100 ms周期内最多使用200 ms的CPU时间片。CPU使用率是衡量容器运行状态的关键指标,管理员通常会参考该指标来设置容器CPU Limit。相较于常用的秒级别指标,百毫秒级别下容器的CPU...

备份ECS文件

注意事项 为达到最佳备份速度,使用云备份客户端时,建议运行备份客户端的机器使用双核及以上64位CPU,并配备8GB以上的可用内存。系统能够备份的数据规模取决于内存资源。在4GB可用系统内存的情况下可备份的最大文件数量为100万个,总数据...

主机健康诊断

物联网边缘计算的主机管理页面为您提供了主机健康诊断功能,可以对主机的系统配置、系统运行状态、系统软件运行状态、主机网络状态、主机历史运行状态进行全方位的诊断,帮助您了解主机的健康状态,及时发现并解决常见的问题。使用限制 仅...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

诊断指标与诊断结果条目说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断指标,并提供了详细的诊断范围及建议操作供您参考。基本...

Group Identity功能说明

Alibaba Cloud Linux 2(内核版本 4.19.91-24.al7 开始)和Alibaba Cloud Linux 3(内核版本 5.10.46-7.al8 开始)支持Group Identity功能,您可以通过该功能为每一个CPU cgroup设置不同的身份标识,以区分不同CPU cgroup中进程任务的优先...

内核功能与接口概述

如果您对Linux的内核系统有一定的了解,并且需要使用Linux内核功能,可以通过本文了解Alibaba Cloud Linux已支持的内核功能与接口。内存 文档链接 支持版本 说明 Memcg Exstat功能 Alibaba Cloud Linux 2内核版本 4.19.91-18.al7 及以上 ...

在离线混部概述

对于尚未支持CPU Burst策略的内核版本,ACK也会通过类似的原理,监测容器CPU Throttle状态,并动态调节容器的CPU Limit,实现与内核CPU Burst策略类似的效果。Memory QoS 容器在使用内存时主要存在以下两个方面的约束:自身内存限制:当...

什么是AI分布式训练通信优化库AIACC-ACSpeed

优化效果 使用多流通信优化,对整体多机的性能大幅提升5%到20%不等。多机CPU-Reduce优化 问题分析 针对PCIe-topo机型,在机器内部通信带宽受限的场景下,相比较原生NCCL,单机内CPU-Reduce的优化效果较明显。因此,基于PCIe-topo机型搭建的...

节点诊断

ECS实例CPU状态 检查ECS实例底层是否存在CPU争抢或CPU绑定失败。ECS实例存在CPU争抢,可能导致实例无法获得CPU或出现其他异常,您可以尝试通过重启实例进行恢复。ECS实例CPU是否存在Split Lock问题 检查ECS实例CPU是否存在Split Lock问题。...

Pod诊断

节点CPU水位过高 检查节点过去一周CPU使用率。节点CPU水位过高时如部署较Pod会导致资源争抢,可能会影响业务的正常运行。为避免业务受到影响,请设置合理的Pod request和limit,避免一个节点上运行的Pod过多。节点内网IP是否存在 检查...

如何使用Prometheus监控Windows

监控大盘 这里参考Linux广泛使用的Node Exporter监控大盘,并结合Windows自身的特点,建议服务提供的默认监控大盘至少包含以下指标Panel:指标分类 指标项 CPU CPU使用率(%):Windows正常运行最重要的指标之一。DPC队列长度、等待线程...

如何使用Prometheus监控Windows

监控大盘 这里参考Linux广泛使用的Node Exporter监控大盘,并结合Windows自身的特点,建议服务提供的默认监控大盘至少包含以下指标Panel:指标分类 指标项 CPU CPU使用率(%):Windows正常运行最重要的指标之一。DPC队列长度、等待线程...

Alibaba Cloud Linux 3镜像发布记录

阿里云定期发布Alibaba Cloud Linux 3镜像的更新版本,以确保用户可以获取到最新的操作系统特性、功能和安全补丁。您可以通过本文查看Alibaba Cloud Linux 3镜像最新的可用版本及更新内容。背景信息 如无特殊声明,更新内容适用于云服务器...

指标说明

process_cpu_seconds_total 该指标计算使用到 utime(Go进程执行在用户态模式下的滴答数)和 stime(Go进程执行在内态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_...

指标说明

process_cpu_seconds_total 该指标计算使用到 utime(Go进程执行在用户态模式下的滴答数)和 stime(Go进程执行在内态时候的滴答数,例如系统调用时),他们的单位jiffies,jiffy 描述了两次系统定时器中断之间的滴答时间。process_cpu_...

阿里云Elasticsearch实例FAQ

集群负载或状态异常问题 使用ES时,一部分节点的CPU和负载正常,另一部分处于空闲状态,如何处理?ES集群状态yellow,如何处理?ES集群负载高导致状态red,如何处理?通过监控查看到或收到集群报警,集群CPU占比过高,如何处理?ES磁盘使用...

使用实例时镜像相关问题

使用ECS实例过程中,可能会遇到一些与镜像有关的问题或咨询,比如实例启动慢、系统负载高、如何编译内核等。本文介绍在使用ECS实例过程中遇到的镜像相关问题及解决方案。Windows镜像问题 如何手动更新Windows实例的virtio驱动?Windows ...

2020年

10-10 创建MyBase MySQL实例 2020年9月 引擎 类别 功能名称 功能描述 发布时间 相关文档 MySQL、SQL Server、PostgreSQL、Redis、新增 超配 使用专属集群超配创建个相同规格的实例,可有效提高主机CPU使用率,同时降低资源成本。...

搭建高可用的支付宝小程序服务(Alibaba Cloud Linux ...

本文介绍如何在阿里云云服务器ECS上基于Alibaba Cloud Linux3.2104 LTS 64位 ARM版操作系统搭建高可用的小程序服务端,并在本地开发一个简单的支付宝小程序(ECS小助手),通过远程调用部署在ECS上的服务端,实现在小程序中输入框输入ECS...

DNS最佳实践

不同类型的业务对域名请求的QPS需求存在较大差异,您可以观察每个CoreDNS副本的峰值CPU使用量,如果其在业务峰值期间占用CPU大于一,建议您对CoreDNS进行副本扩容。无法确定峰值CPU使用量时,可以保守采用副本数和集群节点数1:8的比值来...

DNS最佳实践

不同类型的业务对域名请求的QPS需求存在较大差异,您可以观察每个CoreDNS副本的峰值CPU使用量,如果其在业务峰值期间占用CPU大于一,建议您对CoreDNS进行副本扩容。无法确定峰值CPU使用量时,可以保守采用副本数和集群节点数1:8的比值来...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

搭建高可用的微信小程序服务(Alibaba Cloud Linux 3...

本文介绍如何在阿里云云服务器ECS上基于Alibaba Cloud Linux 3操作系统搭建高可用的微信小程序服务端,并在本地开发一个名为ECS小助手的简单微信小程序。通过远程调用部署在ECS上的服务端,实现在小程序中输入框输入ECS实例ID查询实例详细...

节点资源预留策略

由于Windows节点需要使用额外的资源来运行Windows操作系统和Windows Server相关组件,Windows节点通常会比Linux节点需要更的预留资源。更信息,请参见 创建Windows节点池。预留资源包括给kube组件预留的资源(kubeReserved)和给system...

挖矿程序处理最佳实践

如何判断资产中是否存在挖矿威胁 如果您服务器的CPU使用率明显升高,例如达到80%以上,并且出现未知进程持续向外发送网络包的情况,可以判定您的服务器中存在挖矿威胁。详细内容,请参见 如何判断资产中是否存在挖矿威胁?方案一:使用云...

实例FAQ

本章节汇总了使用云服务器ECS实例时的常见问题。购买实例问题 如何查看某个地域或可用区是否能购买实例?购买实例时,资源已经售罄怎么办?如何选择适合我业务的ECS实例?购买ECS实例如何付款?开通一台云服务器需要多久?购买实例付款成功...

快速入门

为达到最佳的混部使用效果,建议您使用 神龙裸金属服务器 和 Alibaba Cloud Linux。资源优先级与QoS 资源优先级和服务质量QoS(Quality of Service)是ACK差异化SLO混部模型的两个核心概念。资源优先级是对节点资源容量的描述,为了解决...

Hologres管控台的监控指标

Hologres因其设计原理可以充分发挥多核并行计算的能力,通常来说单个查询可以迅速将CPU使用率提高到100%,这说明计算资源得到了充分利用。当实例CPU使用率长期接近100%时(例如CPU使用率连续3小时满载100%,或者连续12小时达到90%以上等)...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS Web应用防火墙 云数据库 RDS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用