通过告警触发自动重启CPU使用率高的ECS实例

背景 当ECS实例因已知或未知的原因CPU使用率过高时,往往会影响实例上应用的运行状态,造成应用运行缓慢甚至卡死。此时通过重启实例能够快速恢复CPU使用率到较低水平,能够避免对应用的影响。这个场景可以使用OOS告警触发功能,将CPU使用率...

基于MSE云原生网关实现同城多活

云原生网关默认采用多可用区部署,提供了地域级的、跨可用区的全局流量管理能力。在同城多活的场景下,能够确保对跨可用区的多个业务集群的请求实现...可以看到MSE在I可用区的集群挂掉后,可实现秒级切流,切流过程中仅有不到1%的流量损失。

RDS SQL Server CPU使用率高问题

同时段 Sqlcompliations 的值也无明显升高,并且其绝对值也很低,因此查询编译开销也不是导致CPU升高的原因。Page_Lookups/sec 的值增高与CPU使用率的增高时间基本一致,因此较大的可能性是9:10~9:20和9:30~9:40这两个时段内有某些执行开销...

DescribeInstance-查询集群信息

CPU_NOT_ENOUGH、MEMORY_NOT_ENOUGH、TENANT_COUNT_EXCEEDS_LIMIT DataDiskAutoScaleConfig object 数据盘自动协调配置。AutoScale boolean 是否开启。true Upperbound long 扩容上限。16 UpperThreshold long 日常扩容阈值。80 ...

一键诊断

CPU使用率倾斜检测 检测不同Executor节点间CPU使用率是否均衡,若所有Executor节点的最高CPU使用率比其平均CPU使用率高出1倍,且持续时间超过指定时间段的百分之八十,则认为Executor节点间的CPU使用率存在倾斜,建议您持续关注并排查是否...

常见问题

迁移与同步 为什么OSS外表导入ORC、PARQUET等格式的数据,出现内存报错或OOM挂掉?如何处理导入数据报错:too many parts?为什么DataX导入速度慢?为什么Hive导入后其数据行数跟ClickHouse对不上?为什么Kafka导入后其数据行数跟...

DNS最佳实践

CoreDNS的CPU占用和其承载的域名QPS呈正相关。CoreDNS的内存占用和集群规模、Service数量呈正相关。部署CoreDNS时采用的默认资源Request和Limit如下表,建议您根据集群实际运行情况及时做出调整,具体操作,请参见运维管理-组件管理-网络-...

DNS最佳实践

CoreDNS的CPU占用和其承载的域名QPS呈正相关。CoreDNS的内存占用和集群规模、Service数量呈正相关。部署CoreDNS时采用的默认资源Request和Limit如下表,建议您根据集群实际运行情况及时做出调整,具体操作,请参见运维管理-组件管理-网络-...

CPU积分变化示例

结束时,CPU积分余额(168)=F阶段结束时的CPU积分余额(120)-8*每小时消耗的CPU积分(6)+8*每小时获得的CPU积分(12)。H阶段:CPU使用率为80%,基准性能无法满足需求,实例运行2小时,每小时消耗96个CPU积分,CPU积分余额也消耗完毕。...

创建防护策略

防护策略创建后,初次进行数据备份时由于要全量备份防护目录下的数据,会消耗一定量的CPU和内存资源。为避免对您的业务造成影响,建议您选择业务量较小的时段进行数据备份。后续再次进行备份时,云安全中心只备份有变化(修改、增加或删除...

创建RDS MariaDB实例

分类 说明 特点 通用规格 独享:内存和I/O 共享:CPU和存储 价格低,性价比高 独享规格 独享:CPU、内存、存储和I/O 说明 独占型是独享型的顶配,独占整台服务器的CPU、内存、存储和I/O。性能更好更稳定 说明 基础系列不支持独享规格。选择...

云监控ECS的Windows主机CPU监控数值异常

本文为您介绍云监控ECS的Windows主机CPU监控数值异常的原因及解决办法。云监控中的ECS CPU监控数值如果出现为0或者负数(实际CPU使用率不是0),其他监控值都正常。这个问题主要出现在Windows的机器上,一般原因是Windows内部的性能计数器...

主机健康诊断

从长远的角度需分析进程消耗过多CPU或内存的原因,并进行优化。CPU使用率诊断 磁盘使用率检测 磁盘空间使用率过高 使用命令 sudo du-h-max-depth=1 从根目录逐步查找对应的大目录或文件,结合业务情况对相关文件或目录进行删除。从长远的...

查看监控信息

CPU抖动诊断 通过 CPU抖动诊断 视图提供的监控指标,分析处理CPU抖动问题,与CPU使用率强关联的指标有两类:业务指标:Page Request:通常情况下,Buffer Pool请求数的趋势和CPU使用率同频波动。Rows Processed:查看CPU使用率和系统处理行...

常见问题

查询信息 描述 基本信息 包括ID、User、Name、Application Type、State、Queue、App-Priority、StartTime、FinishTime、State、FinalStatus、Running Containers、Allocated CPU VCores、Allocated Memory MB和Diagnostics(诊断信息)等。...

处理挖矿程序最佳实践

如何判断资产中是否存在挖矿威胁 如果您服务器的CPU使用率明显升高,例如达到80%以上,并且出现未知进程持续向外发送网络包的情况,可以判定您的服务器中存在挖矿威胁。已安装云安全中心客户端的服务器,可以在云安全中心控制台 安全告警...

典型慢查询

本文介绍 AnalyticDB MySQL版 中几种典型的慢查询以及导致慢查询的原因。消耗内存的慢查询 查询的峰值内存(Peak Memory)可以帮助您评估内存的消耗情况。通常来说,查询峰值内存越大,内存消耗越大。您可以通过SQL诊断功能来检索某个时间...

排查MongoDB CPU使用率高的问题

分析慢请求日志,查找引起MongoDB实例的CPU使用率升高的原因。以下为某个慢日志示例:{"atype":"slowOp","param":{"op":"query","ns":"abbott_analysis.uaidScanInfo","query":{"find":"uaidScanInfo","filter":{"dateType":2,"companyCode...

ECS实例CPU占用率较高的原因

概述 本文主要介绍ECS实例CPU占用率较高的原因。详细信息 通常ECS实例的CPU占用率较高有以下几种原因。ECS实例有多个用户在同时使用,其他用户占用了较多的系统资源。ECS实例的IP地址被泄漏,被不法份子利用或攻击。建议购买独享型ECS实例...

在离线混部概述

可以看出,即使容器在最近1s内整体的CPU使用率较低,受CPU Throttled机制的影响,Thread 2仍需要等待下一个周期才能继续将Req 2处理完成,进而导致请求的响应时延(RT)变大,这通常是造成容器RT长尾现象严重的原因之一。CPU Burst机制可以...

解读实例诊断报告

由于该值大于1.3,系统判断该实例的CPU使用率发生倾斜。某个数据节点存在较多的大Key。某个数据节点存在热点Key。设置的Hash Tag不合理。说明 当某些Key的Hash Tag设置相同时,这些Key会被存储在同一数据节点中。如果大量的Key设置相同的...

解读实例诊断报告

由于该值大于1.3,系统判断该实例的CPU使用率发生倾斜。某个数据节点存在较多的大Key。某个数据节点存在热点Key。设置的Hash Tag不合理。说明 当某些Key的Hash Tag设置相同时,这些Key会被存储在同一数据节点中。如果大量的Key设置相同的...

指标含义与异常处理建议

指标异常原因 监控期间,当指标数值超过节点规格的CPU核数时,服务异常,常见原因如下:节点的CPU或HeapMemory使用率过高,甚至达到100%。查询QPS 或 写入QPS 流量突增或上涨较大。存在耗时较大的慢查询。可在阿里云Elasticsearch控制台中...

CPU类场景

指定时长到达设置 CPU 负载百分比 指定时长到达设置的CPU负载百分比,单位秒。CPU占用百分比 指定CPU使用率,取值区间为[0,100]。填写时不用填写百分号,例如填写80,则指定CPU的整体使用率达到80%。示例 指定全部核数CPU满载的演练场景...

Prometheus Agent采集量与内存和CPU的关系

不同的采集量对应的CPU和内存使用建议如下:50万(Grafana页面显示为500K)的采集量,建议使用1 GB内存和1核CPU。100万的采集量,建议使用2 GB内存和2核CPU。200万的采集量,建议使用4 GB内存和4核CPU。以此类推。示例:假设通过Grafana...

Prometheus Agent采集量与内存和CPU的关系

不同的采集量对应的CPU和内存使用建议如下:50万(Grafana页面显示为500K)的采集量,建议使用1 GB内存和1核CPU。100万的采集量,建议使用2 GB内存和2核CPU。200万的采集量,建议使用4 GB内存和4核CPU。以此类推。示例:假设通过Grafana...

专有宿主机CPU核数满足最低要求

应用场景 您需要充分评估业务发展的需要,确保专有宿主机的CPU核数足以支撑业务增长,避免因规格过小造成业务中断。风险等级 默认风险等级:低风险。当您使用该规则时,可以按照实际需求变更风险等级。检测逻辑 专有宿主机的CPU核数大于...

在cgroup v1接口开启CPU Burst功能

比如,容器在日常运行中使用的CPU资源未超过CPU限流,则空余的CPU资源将会被积累。后续当容器运行需要大量CPU资源时,将通过CPU Burst功能突发使用CPU资源,这部分突发使用的资源来源于已积累的资源。以休假体系作为类比:假如您每年休假...

CPU拓扑感知调度

Kubernetes虽然有CPU Manager解决方案处理以上问题,但是因为CPU Manager特性是节点级别的CPU调度选择,所以无法在集群维度中选择最优的CPU Core组合。同时CPU Manager特性要求Pod是Guaranteed时(Pod中的每个容器必须指定CPU请求和CPU限制...

查看监控信息

创建容器服务后,您可以通过控制台查看容器服务的CPU和内存使用情况。本文介绍如何查看容器服务的CPU和内存使用情况。操作步骤 您可以根据实际需求,选择通过以下方式查看实例监控信息。在概览页查看:提供流量、vCPU使用率、内存使用情况...

云数据库OceanBase集群CPU使用率过高的解决方法

在租户工作台的性能监控界面,查看CPU使用率的折线图,判断图中告警时间点的CPU使用率在较长时间内(1~7 天)是否突然增大。有,则为非正常负载。否,为正常负载。正常流量引起负载过高,建议对租户规格进行扩容,详情请参见 租户相关操作...

基本概念

用户可以选择多个Mongos作为请求的入口,防止其中一个挂掉所有的MongoDB请求都无法操作。Shard MongoDB分片集群中的分片。单个Shard是由三节点的副本集组成,保证单个分片的高可用性,用户可以根据自己的应用性能及存储要求,购买多个Shard...

查看Presto监控

DLA提供了Presto虚拟集群的性能监控功能,本文介绍如何通过DLA管理控制台查看集群的资源监控。前提条件 您已经成功...类别 监控项 说明 集群监控 Cluster CPU Usage Presto集群的CPU使用率。Cluster Memory Usage Presto集群的内存使用率。

监控突发性能实例

本文介绍如何通过ECS管理控制台查看突发性能实例的CPU使用率和CPU积分,并通过云监控管理控制台设置CPU积分报警规则。前提条件 如果您需要设置通知对象,您必须提前创建联系人组。具体操作,请参见 创建报警联系人或报警联系组。背景信息 ...

使用限制

CPU/MEM 场景的CPU和MEM组合 详情请参考CPU/MEM限制说明。系统盘 默认40G大小 可选范围为40-500G。数据盘 默认无配额 单盘可选范围为20-32768G,单个计算作业最多指定1块数据盘。最大执行时间 240小时 超过后计算作业会被平台终止,用户...

弹性资源限制

ack-koordinator在宿主机节点提供了弹性资源限制能力,确保低优先级BE(BestEffort)类型Pod的CPU资源使用在合理范围内,保障节点内容器稳定运行。本文主要介绍如何通过ack-koordinator使用弹性资源限制能力。背景信息 在ack-koordinator...

羲和分析计算引擎

相对于传统的以数据为中心的计算方式,面向算子为中心的计算方式对现代CPU计算更友好:缓存友好的同时,利用乱序执行扩大了CPU的指令并发,利用SIMD又扩大CPU的数据并发,充分挖掘了现代CPU的算力。面向混合负载的查询执行 羲和分析计算...

进程监控

云监控通过安装在阿里云主机(ECS实例)和非阿里云主机上的云监控插件,为您采集最近一段时间内活跃进程的CPU使用率、内存使用率和文件打开数。您还可以添加进程监控,查看其进程数,并为这些进程设置报警规则,及时关注进程数的变化,确保...

ECS实例CPU核数满足最低要求

ECS实例的CPU核数大于等于您设置的期望值,视为“合规”。应用场景 您需要充分评估业务发展的需要,确保ECS实例的CPU核数足以支撑业务增长,避免因规格过小导致业务中断。风险等级 默认风险等级:低风险。当您使用该规则时,可以按照实际...

CPU拓扑感知调度

Kubernetes虽然有CPU Manager解决方案处理以上问题,但是因为CPU Manager特性是节点级别的CPU调度选择,所以无法在集群维度中选择最优的CPU Core组合。同时CPU Manager特性要求Pod是Guaranteed时(Pod中的每个容器必须指定CPU请求和CPU限制...
共有166条 < 1 2 3 4 ... 166 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用