节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作...

THP reclaim功能

THP(Transparent Huge Page)reclaim功能用于解决因透明大页THP带来的内存问题(例如OOM)。本文介绍实现THP reclaim功能的接口,以及接口的示例操作说明。背景信息 Linux操作系统的内存采用分页管理模式,其中的THP是指内核中2 MiB或1 ...

使用SysOM定位容器内存问题

当容器内存使用量超过了设置的内存限制或者节点出现内存压力时,Kubernetes会根据Workingset来决定是否驱逐或者杀死容器。通过SysOM监控来排查Pod Workingset高的问题,可以提供更全面、精确的内存监控和分析能力,帮助运维和开发人员快速...

时序异常检测

本文介绍异常检测算法的概念和时序异常检测的语法。引擎与版本 时序异常检测仅支持时序引擎。无版本要求。使用限制 时序异常检测必须和 SAMPLE BY 语句搭配使用。功能简介 时序异常检测用于检测指定时间线上异常点的值,支持阿里达摩院自研...

异常内存溢出OutOfMemoryException

问题现象 机器人在执行任务时,有时会出现内存不足错误导致机器人闪退的问题。问题排查 1.查看任务管理器-详细信息,查看chrome.exe进程是否为多个,若有多个chrome进程,则需要排查代码中是否有重复打开多个chrome网页未关闭的逻辑,需要...

快速入门Java堆分析

本文演示如何通过ATP的Java堆分析,寻找应用出现内存不足错误的原因 1.生成数据源,上传到ATP 假设我们观察到生产环境中的应用出现如下内存不足的报错:java.lang.OutOfMemoryError:Java heap space Exception in thread"Thread-3...

SysOM内核层容器监控

监控指标除了提供基础的系统指标,还提供多种深度增强指标,提供节点维度、Pod维度的操作系统内核级监控,能够覆盖常见的系统抖动、延时、资源泄露、Pod内存异常等问题场景。ack-sysom-monitor监控功能费用说明 启用ack-sysom-monitor监控...

Pod异常问题排查

Pod OOM异常问题处理 问题原因 当集群中的容器使用超过其限制的内存,容器可能会被终止,触发OOM(Out Of Memory)事件,导致容器异常退出。关于OOM事件,请参见 为容器和Pod分配内存资源。问题现象 若被终止的进程为容器的阻塞进程,可能...

Pod异常问题排查

Pod OOM异常问题处理 问题原因 当集群中的容器使用超过其限制的内存,容器可能会被终止,触发OOM(Out Of Memory)事件,导致容器异常退出。关于OOM事件,请参见 为容器和Pod分配内存资源。问题现象 若被终止的进程为容器的阻塞进程,可能...

Linux内存碎片化的应对措施

Linux系统长时间运行会出现内存碎片化的问题,本文主要提供了应对该问题的一些措施。问题现象 实例内部署的业务偶然出现响应时间过长或者系统调用时间过长,系统的 sys 指标也会相应的增高,伙伴系统会缺少高阶内存(order 大于3的内存)。...

云盒计算资源配置最佳实践

反之,如果选择最大实例规格为ecs.g6.26xlarge的SKU,由于该规格族的vCPU和内存配比1:4,则会出现内存浪费的情况。根据业务需求选择SKU时,可能会需要多种不同配比的ECS实例,此时可以选择多种规格族混合的SKU,以减少资源浪费。例如:您...

使用性能监控分析Golang应用内存泄露问题

通过上述数据,可知此时段memLeak函数出现内存泄露问题。为了有更明显的对比,并调查内存泄露的严重程度,您可以单击 快速对比,进入数据对比页面,对比该问题所在时段与过去时段的资源占用差异。通过数据对比进行排查 您在 数据查询 页面...

列存索引中TopK算子的实现

在内存算法的执行过程中,如果出现内存不足的情况(例如,K比较大时,可用执行内存不足以缓存足够的sorted run使其包含的记录数量大于K,或者可用执行内存不足以完成pre-merge的过程),那么执行回退机制。回退机制:采集内存中已积累的...

指标含义与异常处理建议

异常处理建议 在 Kibana控制台 的Monitoring页面查看监控信息,或者 查看实例的日志,获取问题的具体信息,并排查解决(例如索引占用内存太大,可删除一些索引)。对于磁盘使用率过高导致集群异常的情况,建议参见 集群磁盘使用率过高和...

为什么Redis内存报警与监控的内存使用率不一致

现象二:您的应用程序出现异常 command not allowed when used memory>'maxmemory',但查看控制台的 监控页面 发现 内存并没有满 或 只有一个数据分片的内存使用率较高。问题原因 为什么内存监控与内存告警不一致?如果 Redis 性能监控与...

如何解决备份客户端OOM问题

重要 当遇到OOM问题时,您可以根据实际情况为备份客户端所在机器扩充内存或CPU容量,也可以参照该文档的思路尝试解决。通用类备份失败问题,建议您尝试参考 如何处理备份失败问题 解决。方法1:拆分备份目录 将备份计划中的备份文件路径...

PolarDB MySQL版CPU使用率高

比较常见的问题会出现内存使用争抢。在MySQL体系中,内存主要作为数据缓存使用,也就意味着数据需要不断的迭代,最常用是 buffer pool 和 innodb_adaptive_hash_index 内存区域。整个数据库系统的缓存区域,是数据交换最为频繁的位置,如果...

备份占用过多磁盘和内存空间解决方案

在备份文件过多、过大或程序运行异常时,会出现备份占用服务器的磁盘空间过大的情况。解决方案一:清理磁盘空间 您可以参考以下步骤清理防勒索备份占用的磁盘空间。如果服务器开启了云安全中心客户端自保护功能,您需要关闭服务器的客户端...

接口说明

51020001 TTS:TtsServerError 受机器负载或网络等因素导致的异常,通常为偶发出现。一般重试调用即可恢复。语音合成/离线语音合成 SDK相关 状态码 状态消息 原因 解决方案 140000 TTS_CREATE_FAILED 引擎初始化失败。资源路径错误或资源...

回切至本地物理机

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到用户本地数据中心的物理服务器上。前提条件 服务器已进入实时复制状态。更多信息,请参见 启动复制。背景信息 目前阿里云的混合...

错误码查询

51020001 TTS:TtsServerError 受机器负载或网络等因素导致的异常,通常为偶发出现。一般重试调用即可恢复。移动端SDK错误码 一句话识别/实时语音识别/录音文件识别极速版 配置或参数错误 状态码 状态消息 原因 解决方案 240999 DEFAULT_...

混沌工程缓存实战系列-Redis

在日常的发布、架构升级中除了功能测试、性能测试的回归,还需要进行常态化的故障演练,同时演练的形态和场景复杂性也要不断扩充。对于故障演练来说,难的不是注入手段,而是对业务架构、业务场景的理解。故障注入不是目的,演练的目的是...

重启实例

当实例连接数满或出现访问异常时,您可以重启 云原生内存数据库 Tair。重启的影响与注意事项 重启可能发生 数据丢失。重启过程中实例会发生 秒级闪断,请判断业务影响后执行重启操作,重启前请做好业务安排并 确保应用有重连 机制。操作...

Node应用内存泄漏分析方法论与实战

如若出现异常,通过node-heapdump对v8堆内存抓取快照,并通过chrome开发者工具profiles来导入快照进行分析。线上 通过alimonitor、eagleeye等监控平台监控应用健康度。如若出现异常,通过 Node.js 性能平台堆快照排查问题。如若异常难以复现...

MySQL 实际内存分配情况介绍

RDS 的内存是重要的性能参数,常常出现由于异常的 SQL 请求以及待优化的数据库导致内存利用率升高的情况,严重时还会出现由于 OOM 导致实例发生 HA 切换的情况。MySQL 的内存大体可以分为共享内存和 session 私有内存两部分,下面将详细...

MySQL实际内存分配情况介绍

RDS 的内存是重要的性能参数,常常出现由于异常的SQL请求以及待优化的数据库导致内存利用率升高的情况,严重时还会出现由于 OOM 导致实例发生 HA 切换的情况。MySQL 的内存大体可以分为共享内存和session私有内存两部分,下面将详细介绍各...

网关一体机告警介绍

监控项 报警阈值 报警通道 恢复是否通知 疲劳度 是否实时 CPU使用率 一分钟内平均使用率超过95%客户邮箱 是 每日最多5封 是 内存使用率 一分钟内平均空闲内存小于20%客户邮箱 是 每日最多3封 是 硬盘故障 磁盘状态出现异常,立即报警 短信 ...

集群巡检项及解决方案

节点内存水位过高 异常影响:过去一周内节点内存水位过高。节点上部署了太多的Pod,资源争抢,内存水位过高,可能导致OOM(Out of Memory),影响部分业务的正常运行。解决方案:若一周内节点内存水位达到上限90%,为避免业务受损,您需要...

出现OOM Killer的原因及解决方案

开启THP会出现内存膨胀(memory bloating),从而导致OOM Killer,您可以对THP进行调优。具体操作,请参见 Alibaba Cloud Linux系统中与透明大页THP相关的性能调优方法。内存节点(Node)的内存不足 内存节点(Node)的内存不足导致的OOM ...

服务实例隔离与诊断

当服务提供者的某些实例出现异常时,MSE治理中心将异常实例的流量隔离,并结合阿里云 应用实时监控服务 ARMS(Application Real-Time Monitoring Service)所提供的内存快照生成能力,及时生成异常实例的线上环境内存快照,帮助您进行后续...

使用SDK时出现Validate PK size fail异常

介绍使用SDK时出现Validate PK size fail异常的现象、原因和解决方案。现象 使用SDK更新数据时出现如下异常:Caused by:[ErrorCode]:OTSInvalidPK,[Message]:Validate PK size fail 原因 设置的主键个数和数据表的主键个数不一致。解决方案...

使用SDK时出现Validate PK name fail异常

介绍使用SDK时出现Validate PK name fail异常的现象、原因和解决方案。现象 使用SDK查询数据时出现如下异常:Caused by:[ErrorCode]:OTSInvalidPK,[Message]:Validate PK name fail 原因 设置的主键名称和数据表的主键名称不一致,或者设置...

使用Java SDK时出现The access key id is invalid异常

现象 使用Java SDK时出现如下异常:java.lang.IllegalArgumentException:The access key id is invalid:xxx.原因 AccessKey(包括AccessKey ID和AccessKey Secret)设置不正确,传入了非法字符。解决方案 请确保已设置正确的AccessKey信息...

Quick BI用关联表创建数据集出现计数异常

问题描述 本文主要介绍Quick BI用关联表创建数据集出现计数异常。问题原因 客户在关联表时,使用重复的字段作为关联字段导致数据膨胀,在计数时导致数据比实际的数据多。使用SQL的关联字段是item_id,该值存在重复。解决方案 在创建数据集...

故障排查

分类 相关文档 集群资源和集群组件异常问题排查 集群检查项及修复方案(包括升级集群、迁移集群、安装组件、升级组件过程中出现异常以及解决方案)Pod异常问题排查 Pod诊断 Service异常问题排查 Service诊断 Ingress异常问题排查 Ingress...

H5 性能

JS 异常监控 实时监控并展示出现 JS 异常的 H5 页面、异常最近上报时间以及上报次数,帮助您快速定位 JS 错误位置。可查看所有或指定异常页面的所有 JS 异常,同时支持按异常上报时间对异常页面进行排序。如需异常页面数据,单击列表右上方...

Spark

说明 如果出现OOM异常,则需要检查业务逻辑是否有大内存占用,特别是某个字段特别大的情况。如果确实需要更大内存,您可以使用更大规格的Executor或Driver节点。Spark应用无异常但运行速度变慢,您可以通过如下三种方法排查:查看资源是否...

异常处理

ClientError ClientError指SDK内部出现异常,例如参数设置错误、断点续传上传或断点续传下载过程中出现的文件被修改的错误。RequestError 当网络出现中断或者异常时,Node.js SDK会抛出RequestError。出现此错误时,请检查网络连通性并...

集群架构

云原生内存数据库Tair 提供双副本集群架构实例,可轻松突破Redis自身单线程瓶颈,满足大容量、高性能...常用帮助 集群架构中分片内存占用异常的排查方法请参见 发现并处理大Key和热Key。需要掌握内存中数据的分布情况请参见 离线全量Key分析。

调用链分析

异常数/异常比例 异常比例表示出现异常的请求比例。例如3%表示有3%的请求出现异常。计算公式:异常比例=异常请求数/总请求数 重要 异常请求数不等于异常数(Span调用异常的次数),当请求倍数大于1时,一个异常请求可能对应多个异常数。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
威胁情报服务 云数据库 Memcache 版 云监控 数据安全中心 Web应用防火墙 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用