云数据库MySQL实例的内存使用率告警

内存使用出现异常出现内存使用率超过90%的告警时,一般考虑如下两方面。确认是否存在Session过多的情况,如果空闲Session过多,需要评估空闲Session数量设置的是否合理。如何查看Session可参考MySQL 官方文档。确认是否单个Session占用...

如何处理Windows Server 2003/2008...虚拟内存不足问题...

系统提示 虚拟内存不足 错误信息,应用程序由于内存分配出现异常关闭的情况。打开服务器管理器时,提示 MMC在一个管理单元检测到错误,请卸载此管理单元。服务器管理器控制台打开后自动关闭,提示 Microsoft管理控制台已停止工作。上述问题...

Linux系统的ECS实例的系统、内存或进程出现异常,查看...

本文介绍Linux系统的ECS实例的系统、内存或进程出现异常,查看系统日志提示"page allocation failure"错误时的问题原因及解决方案。问题现象 Linux系统的ECS实例的系统、内存或进程出现异常,通过查看系统日志提示"page allocation failure...

诊断项与诊断结果说明

出现此类异常可能会导致实例崩溃或出现异常暂停,您可以尝试通过重启实例进行恢复。实例操作系统异常 实例系统出现了内核错误(kernel panic)、OOM(Out of Memory)异常或内部宕机等故障。检查该实例的操作系统(Guest OS)内部是否存在...

全局流量管理&全球加速联动实现智能解析

报警通知组:当业务出现异常时,用于接收通知消息的联系组。说明 如果您未配置报警通知组,请先前往云监控控制台设置。详细信息,请参见 创建报警联系人或报警联系组。如果您已经配置了报警通知组,但您使用子账号配置基础信息,请先使用主...

网络架构容灾

开启健康检查功能后,当后端某个ECS实例健康检查出现异常时,负载均衡会自动将新的请求分发到其他健康检查正常的ECS实例上,而当该ECS实例恢复正常运行时,负载均衡会将其自动恢复到负载均衡服务中。为了使健康检查功能正常运作,需要开启...

捕获内核的内存污染问题(KFENCE)

通过配置脚本开启KFENCE(x86/ARM架构)说明 通过该方式开启KFENCE时,无法捕获内核启动过程中可能出现内存污染问题。开启KFENCE后,如果需要修改 num_objects 或 sample_interval 配置,需先 关闭KFENCE 再进行修改。运行以下命令,开启...

RDS MySQL内存使用问题

本文介绍查看内存使用情况的方式,以及各种内存问题的原因和解决方案。背景信息 实例内存使用率和缓冲池命中率是RDS ...还有非常多的原因会造成内存上涨,如果出现内存使用率异常增加或实例内存耗尽,您可以参考 MySQL官方文档 排查上涨原因。

快速入门

本文介绍如何使用ack-koordinator快速搭建一套在离线混部环境,并将应用切换为混部模式运行...关于在离线混部功能的更多信息,请参见:动态资源超卖 容器CPU QoS 弹性资源限制 CPU Burst性能优化策略 容器内存QoS 容器L3 Cache及内存带宽隔离

如何修复异常DBS备份计划

如果您的DBS备份计划在使用过程中出现异常,可以通过本文提供的方法进行修复。问题描述 备份计划列表页显示DBS备份计划状态异常。问题原因 DBS备份计划状态显示异常,表示该DBS备份计划下至少存在一个异常任务,通常可能是全量备份任务异常...

监控指标说明

以英伟达GPU V100为例,其最大内存带宽为900 GB/sec,如果当前的内存带宽为450 GB/sec,则内存带宽利用率为50%。DCGM_FI_DEV_ENC_UTIL Gauge%表示编码器利用率。DCGM_FI_DEV_DEC_UTIL Gauge%表示解码器利用率。内存(Memory)指标名称 指标...

异常状态码

由于ER是流式透传的默认行为,出现异常行为后客户端会收到一个截断的请求。具体说明如下:您的ER代码逻辑Bug,导致请求回复生成的过程中出现JS异常。受资源限制,您可以 提交工单 解决。说明 如果您经常看到ER在回复过程中被截断,需要检查...

配置DDoS高防后访问网站提示502错误

源站本身出现异常 源站本身出现异常,将导致响应高防的请求超时,源站异常包括以下几种情况:源站IP暴露,被恶意攻击导致瘫痪。源站服务器机房物理故障。源站服务器中Apache、Nginx等Web服务出现问题。服务器内存、CPU占用过高,导致性能...

【公告】云防火墙异常流量排查体验优化和流量计量模型...

影响说明 本次优化对当前费用无影响 流量排查监控链路更简单、高效、准确 优化前流量排查链路 优化后流量排查链路 以下以排查入方向峰值带宽异常为例。如果您需要排查流出的异常峰值带宽,步骤相同。只是流出峰值带宽是主动外联请求峰值...

容器L3 Cache及内存带宽隔离

如果不进行隔离控制,不同优先级的任务在使用L3 cache和MBA内存带宽等资源时可能会出现资源竞争,从而无法保证给LS业务分配足够的资源,导致LS应用的服务质量受到影响。RDT(Resource Director Technology)提供了对不同优先级应用的资源...

设置客户端连接的空闲时间

如果客户端出现异常,没有及时回收连接池资源,可能因空闲连接占满连接池导致服务崩溃。如果核心业务出现该问题,影响严重。因此,在业务核心应用中,建议配置 timeout 参数,使 Tair 可以主动回收连接资源。空闲连接超时后,Tair 不一定会...

高性能计算优化型实例概述

提供高达3.75 GHz的最新的第四代EPYC™(Genoa)处理器、64 Gbps的eRDMA节点间网络带宽以及增强的内存带宽能力。hpc8ae的特点如下:计算:处理器与内存配比为1:4 处理器:3.4 GHz主频的AMD EPYC TM Genoa处理器,单核睿频最高3.75 GHz,...

推荐配置(可选)

配置带宽封顶 通过在云监控产品中创建报警规则,实现对网络带宽的报警监控,帮助您及时了解带宽异常并快速进行处理。设置报警 提高CDN的访问性能 结合您的实际业务需求,通过配置页面优化、Range回源、智能压缩功能,可缩小访问文件的体积...

访问ECS实例异常时的问题排查和指引

如果排查分析安全组和操作系统内安全软件配置后,均未见明显异常,则请参见 网络异常时抓包操作说明,在出现异常时,从客户端和服务端同时并发抓包,然后 提交工单 联系阿里云技术支持,提交抓包结果。只有源服务器访问目标服务器存在异常...

内核统一异常框架(UKFEF)

Normal:当前应用进程可能会出现异常。建议对当前应用采取措施,例如 kill、重启或迁移。Fatal:可能会对系统产生致命影响。建议立即进行业务迁移。事件报告 UKFEF将通过以下方式输出事件报告:通过内核日志输出单次事件的详细信息。信息...

概览

实例消息堆积量 消息堆积量 Topic消息堆积量 高于上边界 连接数过高、连接数波动较大或连接数持续峰值 系统负载过高、TCP连接池不足、应用程序或服务出现异常、某些应用程序或服务在某些时候进行了大量的TCP连接操作。实例公网TCP连接的...

诊断服务端报错问题

步骤三:诊断异常出现的原因 掌握应用异常的统计信息还不足以诊断异常出现的原因。虽然日志中异常堆栈包含调用的代码片段,但并不包含这次调用的完整上下游信息和请求参数。ARMS探针采用了字节码增强技术,让您能够以很小的性能消耗捕获...

在离线混部概述

L3 Cache及内存带宽隔离 不同类型的应用容器在节点运行时会共享宿主机的三级缓存L3 Cache(Last Level Cache)和内存带宽MBA(Memory Bandwidth Allocation)。神龙裸金属节点提供了动态调整容器可用的CPU缓存LLC(Last Level Cache)和...

Pod异常问题排查

Pod OOM异常问题处理 问题原因 当集群中的容器使用超过其限制的内存,容器可能会被终止,触发OOM(Out Of Memory)事件,导致容器异常退出。关于OOM事件,请参见 为容器和Pod分配内存资源。问题现象 若被终止的进程为容器的阻塞进程,可能...

Pod异常问题排查

Pod OOM异常问题处理 问题原因 当集群中的容器使用超过其限制的内存,容器可能会被终止,触发OOM(Out Of Memory)事件,导致容器异常退出。关于OOM事件,请参见 为容器和Pod分配内存资源。问题现象 若被终止的进程为容器的阻塞进程,可能...

调度概述

容器内存QoS 容器L3 Cache及内存带宽隔离 通过控制L3 cache和MBA,对不同优先级的任务进行隔离,在保障高优先级任务QoS的前提下,提高资源利用率。容器L3 Cache及内存带宽隔离 容器资源参数动态修改 在不重启Pod的情况下,动态修改Pod的CPU...

系统类故障排查

概述 本文主要介绍使用阿里云服务器ECS时的系统类故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

无法远程连接Windows实例的排查方法

步骤十二:Windows注册表配置异常 步骤十三:Windows RDP自签证书到期 步骤一:使用阿里云Workbench工具测试远程登录 通过阿里云提供的Workbench工具进行远程登录,Workbench工具在远程登录出现异常时会返回具体的错误信息及解决方案。...

诊断项与诊断结果说明

出现此类异常可能会导致实例崩溃或出现异常暂停,您可以尝试通过重启实例进行恢复。实例所在宿主机告警 实例所在的物理设备出现故障告警。检查该实例所在的底层物理机是否有故障。如果底层物理机存在故障,则可能会影响实例的运行状态或...

为什么Redis内存报警与监控的内存使用率不一致

现象二:您的应用程序出现异常 command not allowed when used memory>'maxmemory',但查看控制台的 监控页面 发现 内存并没有满 或 只有一个数据分片的内存使用率较高。问题原因 为什么内存监控与内存告警不一致?如果 Redis 性能监控与...

DAS Auto Scaling弹性能力

从上图可以看出,该实例在07:10突然出现异常流量,导致CPU利用率和活跃会话飙升,CPU利用率上升至80%以上,资源相对紧张。经过对实例上的读写流量进行分析发现,当前流量中以读流量为主,DAS Auto Scaling算法判断通过增加2个只读节点缓解...

Pod诊断

节点出现内存碎片化,请先尝试登录节点,执行命令 echo 3>/proc/sys/vm/drop_caches 清理缓存。如问题仍未解决,请收集节点日志并 提交工单 处理。关于收集节点日志操作,请参见 一键采集节点的诊断日志。节点内存交换区开启情况 检查节点...

节点诊断

ECS实例网卡链路层状态 检查ECS实例网卡链路层是否出现异常。ECS实例未正常启动或网络配置有问题,您可以尝试通过重启实例进行恢复。ECS实例启动状态 检查ECS实例的boot操作是否能正常执行加载。ECS实例无法正常启动,您需要创建一个新的...

无法连接Linux实例的排查方法

登录Linux实例失败并报“login:Module is unknown”错误如何处理 Linux实例系统环境配置 Linux内的系统环境,例如中毒、账户配置、环境变量配置等,如果出现异常,也可能会导致SSH登录失败。根据不同报错信息,可参见如下常见案例进行解决...

常见问题

磁盘/CPU/内存/带宽问题 Windows实例负载的查询及分析 Linux实例CPU负载的查询和案例分析 如何配置Windows实例的虚拟内存 入网带宽和出网带宽 Linux实例网络流量负载情况的查询和案例分析 Linux实例中如何查看物理CPU和内存信息 Linux实例...

远程桌面无法连接到Windows实例的快速排查方法

该问题可能是由于安全狗软件出现异常导致的。可通过Windows系统卸载安全狗软件后,重启服务器,网络即可恢复。步骤十一:尝试重启实例 若用阿里云提供的远程连接功能仍无法成功连接实例,请尝试重启实例。重启操作会使实例停止工作,从而...

指标含义与异常处理建议

异常处理建议 在 Kibana控制台 的Monitoring页面查看监控信息,或者 查看实例的日志,获取问题的具体信息,并排查解决(例如索引占用内存太大,可删除一些索引)。对于磁盘使用率过高导致集群异常的情况,建议参见 集群磁盘使用率过高和...

诊断指标与诊断结果条目说明

Instance.ECSService.VirtualizationException 出现此类异常可能会导致实例崩溃或出现异常暂停。您可以尝试通过 重启实例 进行恢复。Instance.RecentUtilHigh 检查历史负载是否超过80%。Instance.UtilizationHigh.IntranetBandwidth 您选择...

集群巡检项及解决方案

SLB带宽使用率过高 异常影响:过去三天网络流出带宽的最大值达到上限的80%以上。当带宽达到上限后,可能产生SLB上的丢包,导致请求抖动、延迟。解决方案:若SLB实例网络带宽使用率过高,您需要提升实例规格。具体操作,请参见 使用指定的...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
NAT网关 共享带宽 边缘网络加速 全球加速 Web应用防火墙 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用