Pod异常问题排查

Pod OOM异常问题处理 问题原因 当集群中的容器使用超过其限制的内存,容器可能会被终止,触发OOM(Out Of Memory)事件,导致容器异常退出。关于OOM事件,请参见 为容器和Pod分配内存资源。问题现象 若被终止的进程为容器的阻塞进程,可能...

OOM常见问题排查指南

异常信息里面会列出消耗内存的Top 5的Query,可以通过报错找到内存消耗最大的Query,并在 慢Query日志查看与分析 中查看详细的Query信息。Used/Limit:xy1/xy2 指 单个节点使用的计算内存/单个节点的计算内存上限,单位为Byte。单个节点使用...

列存索引中TopK算子的实现

内存算法的执行过程中,如果出现内存不足的情况(例如,K比较大时,可用执行内存不足以缓存足够的sorted run使其包含的记录数量大于K,或者可用执行内存不足以完成pre-merge的过程),那么执行回退机制。回退机制:采集内存中已积累的...

基于TairString实现高性能分布式锁

如果一台主机上的多个进程需要并发访问某项资源,则可以使用进程间同步的原语,例如信号量、管道、共享内存等。但如果多台主机需要同时访问某项资源,就需要使用一种在全局可见并具有互斥性的锁了。这种锁就是分布式锁,可以在分布式场景中...

反馈一台或者多台ECS实例异常问题

abnormal-cloud-disk:ECS 实例挂载的云盘或共享块存储出现异常。others:其他异常类型。当以上影响类型不符合条件时,您可以设置 Reason=others 并在 Description 中描述更多信息。abnormal-local-disk Description string 是 异常问题的...

诊断项与诊断结果说明

出现此类异常可能会导致实例崩溃或出现异常暂停,您可以尝试通过重启实例进行恢复。实例所在宿主机告警 实例所在的物理设备出现故障告警。检查该实例所在的底层物理机是否有故障。如果底层物理机存在故障,则可能会影响实例的运行状态或...

Node应用内存泄漏分析方法论与实战

如若出现异常,通过node-heapdump对v8堆内存抓取快照,并通过chrome开发者工具profiles来导入快照进行分析。线上 通过alimonitor、eagleeye等监控平台监控应用健康度。如若出现异常,通过 Node.js 性能平台堆快照排查问题。如若异常难以复现...

共享内存通信(SMC)常见问题

如果您在Alibaba Cloud Linux 3系统中启用了共享内存通信SMC(Shared Memory Communication),且使用过程中遇到无法正常通信、部分端口不可用、对比TCP没有应用性能提升等问题,可以参考本文提供的方案进行排查并解决。启用SMC后应用性能...

节点诊断

ECS实例网卡链路层状态 检查ECS实例网卡链路层是否出现异常。ECS实例未正常启动或网络配置有问题,您可以尝试通过重启实例进行恢复。ECS实例启动状态 检查ECS实例的boot操作是否能正常执行加载。ECS实例无法正常启动,您需要创建一个新的...

Java SDK

修复共享线程池模式下存在的内存资源泄漏问题。修复动态代理对象无法执行Reduce问题。修复秒级别任务执行应答合并丢失问题。修复Diamond读取环境地址异常问题。修复对接公有云时存在的心跳超时过长问题。修复log4j日志格式告警。修复单机...

指标含义与异常处理建议

异常处理建议 在 Kibana控制台 的Monitoring页面查看监控信息,或者 查看实例的日志,获取问题的具体信息,并排查解决(例如索引占用内存太大,可删除一些索引)。对于磁盘使用率过高导致集群异常的情况,建议参见 集群磁盘使用率过高和...

诊断指标与诊断结果条目说明

Instance.ECSService.VirtualizationException 出现此类异常可能会导致实例崩溃或出现异常暂停。您可以尝试通过 重启实例 进行恢复。Instance.RecentUtilHigh 检查历史负载是否超过80%。Instance.UtilizationHigh.IntranetBandwidth 您选择...

无法远程连接Windows实例的排查方法

步骤十二:Windows注册表配置异常 步骤十三:Windows RDP自签证书到期 步骤一:使用阿里云Workbench工具测试远程登录 通过阿里云提供的Workbench工具进行远程登录,Workbench工具在远程登录出现异常时会返回具体的错误信息及解决方案。...

为什么Redis内存报警与监控的内存使用率不一致

现象二:您的应用程序出现异常 command not allowed when used memory>'maxmemory',但查看控制台的 监控页面 发现 内存并没有满 或 只有一个数据分片的内存使用率较高。问题原因 为什么内存监控与内存告警不一致?如果 Redis 性能监控与...

查看智能测试报告

注意:这是与 CPU 共享内存,不是 GPU 专用内存。Code 您的应用用于处理代码和资源(如 dex 字节码、经过优化或编译的 dex 代码、.so 库和字体)的内存。PrivateOther 包含了 Stack,System 占用,还有一些应用使用的系统不确定如何分类...

ALB常见问题

本文为您介绍 应用型负载均衡ALB(Application Load Balancer)的常见问题。ALB是否有具体的实例规格?如何提升ALB的公网带宽?...ALB 后端服务器没有及时完成请求处理,请排查后端服务器的日志,并查看对应后端服务器的CPU、内存等的...

基础资源监控

资源监控是Kubernetes中最常见的监控方式,您可以在ACK集群中使用云监控Kubernetes监控功能,快速查看工作负载的CPU、内存、网络等基础资源的使用情况和健康状态,确保集群稳定运行。功能特性 云监控会自动获取您当前阿里云账号下容器服务...

查看调度资源大盘

某任务内存消耗率达到过100%,建议您重点关注,适当增加内存分配,避免后续由于内存溢出等异常运行失败,影响数据产出。任务资源详情 您可按照下图操作指引,查看任务资源详情。任务资源详情展示最近1次运行详情和最近7次运行趋势,为您...

实例FAQ

说明 如果云服务器创建过程中出现异常,请 提交工单。购买实例付款成功,但是没有生成实例,为什么?可能是该可用区下该实例规格库存不足。系统会自动退款,如果半小时内没有收到退款,请 提交工单。您可以前往 ECS实例可购买地域,查看...

安全告警概述

云安全中心支持实时检测资产中的安全告警事件,覆盖网页防篡改、进程异常、网站后门、异常登录、恶意进程等安全告警类型。通过威胁检测模型,提供全面的安全告警类型检测,帮助您及时发现资产中的安全威胁、实时掌握资产的安全态势。背景...

V5.1.x系列实例版本说明

修复当前端连接过多且因流控被堵塞在读取时,JVM的临时内存缓存出现堆积和泄漏的问题。修复个别多语句处理场景中包含ROLLBACK语句可能导致的NPE错误。修复 SHOW VARIABLES LIKE“autocommit”显示的值不正确的问题。修复ResultSet....

基于TairString实现高性能乐观锁

在大量请求并发访问和更新 Tair 中储存的共享资源时,必须有一种精准高效的并发控制机制来防止逻辑异常和数据错误,乐观锁就是这样一种机制。比起原生Redis,云原生内存数据库Tair 的TairString模块能帮助您实现性能更高、成本更低的乐观锁...

配置作业资源

建议在有明确异常或者需求时,再调整Heap Memory和Off-heap Memory的大小,例如作业出现OOM或严重GC等。因为在作业正常运行时,调整Heap Memory和Off-heap Memory的大小,不会明显改变作业的吞吐量。单击 确定。配置算子并发数 资源模式...

Hologres管控台的监控指标

Meta:元数据、文件等占用的内存,元数据的内存使用采用Lazy Open模式,即频繁被访问的元数据会常驻内存中,未被访问的元数据则不会放在内存中,以此来减少元数据对内存的占用。一般建议meta占用的内存维持在总内存的30%以内。如果meta的...

常见问题

磁盘/CPU/内存/带宽问题 Windows实例负载的查询及分析 Linux实例CPU负载的查询和案例分析 如何配置Windows实例的虚拟内存 入网带宽和出网带宽 Linux实例网络流量负载情况的查询和案例分析 Linux实例中如何查看物理CPU和内存信息 Linux实例...

发布日志

新增屏幕共享时支持音频共享(要求系统为Android 10或以上,场景为媒体模式、音乐模式)。V2.5.1@2021-08-18 新增数据打标功能,精确统计各组数据。优化屏幕共享功能,提升弱网和低性能设备的可用性。修复因GRTN(Tenfold)协议切网或断网...

功能发布记录(2.0)

新增屏幕共享时支持音频共享(要求系统为Android 10或以上,场景为媒体模式、音乐模式)。V2.5.1@2021-08-18 新增数据打标功能,精确统计各组数据。优化屏幕共享功能,提升弱网和低性能设备的可用性。修复因GRTN(Tenfold)协议切网或断网...

Bloom

Bloom是一种概率性数据结构(space-efficient probabilistic data structure),在大规模数据中,仅需消耗较低的内存来判断一个元素是否存在。而TairBloom基于Scalable Bloom Filter实现,具有动态扩容的能力,并且可以在扩容时维持误判率...

调度概述

为了解决这个问题,阿里云提供Gang Scheduling功能,保障所有相关联的进程能够同时启动,防止因部分进程的异常而导致整个关联进程组的阻塞的问题。使用Gang scheduling Capacity Scheduling 当集群中有多个用户时,通过Kubernetes原生的...

常见问题

如果您在使用云虚拟主机时遇到网站无法访问、网站访问异常(报错或者缓慢)、FTP使用异常、网站迁移异常、数据库使用问题、主机功能设置问题、耗资源/DDoS/大流量/升级或续费以及产品计费等问题,您可以参考本文方法进行问题排查。...

在离线混部概述

L3 Cache及内存带宽隔离 不同类型的应用容器在节点运行时会共享宿主机的三级缓存L3 Cache(Last Level Cache)和内存带宽MBA(Memory Bandwidth Allocation)。神龙裸金属节点提供了动态调整容器可用的CPU缓存LLC(Last Level Cache)和...

检测范围说明

持久化后门 检测服务器上存在的被攻击者植入的持久化后门或入侵痕迹,对内存马注入、后门程序、异常注册表项修改等威胁行为进行告警。Web应用威胁检测 检测通过Web应用入侵服务器的行为。恶意脚本 检测资产的系统功能是否受到恶意脚本的...

如何将一棵LSM-Tree塞进NVM

我们以X-Engine为基础结合非易失内存的优势与限制,重新设计并实现了存储引擎的主要内存数据结构、事务处理和持久化内存分配器等基础组件,最终实现了不需要记录预写式日志的高性能事务处理,降低了整体系统的写入放大并提高了存储引擎的...

重启实例

当实例连接数满或出现访问异常时,您可以重启 云原生内存数据库 Tair。重启的影响与注意事项 重启可能发生 数据丢失。重启过程中实例会发生 秒级闪断,请判断业务影响后执行重启操作,重启前请做好业务安排并 确保应用有重连 机制。操作...

内存诊断

内存诊断有普通内存诊断和共享内存诊断两种方式,具体内存诊断方式根据需求而定。普通内存 可以通过观察 polar_stat_activity_rt 视图,如下所示:SELECT pid,rss FROM polar_stat_activity_rt ORDER BY rss DESC;\watch 1 进而可通过 ...

内存诊断

内存诊断有普通内存诊断和共享内存诊断两种方式,具体内存诊断方式根据需求而定。普通内存 可以通过观察 polar_stat_activity_rt 视图,如下所示:SELECT pid,rss FROM polar_stat_activity_rt ORDER BY rss DESC;\watch 1 进而可通过 ...

网关一体机告警介绍

监控项 报警阈值 报警通道 恢复是否通知 疲劳度 是否实时 CPU使用率 一分钟内平均使用率超过95%客户邮箱 是 每日最多5封 是 内存使用率 一分钟内平均空闲内存小于20%客户邮箱 是 每日最多3封 是 硬盘故障 磁盘状态出现异常,立即报警 短信 ...

出现OOM Killer的原因及解决方案

如果出现异常,您可以尝试自行更新systemd工具的版本。查看透明大页THP的性能。开启THP会出现内存膨胀(memory bloating),从而导致OOM Killer,您可以对THP进行调优。具体操作,请参见 Alibaba Cloud Linux系统中与透明大页THP相关的性能...

集群架构

云原生内存数据库Tair 提供双副本集群架构实例,可轻松突破Redis自身单线程瓶颈,满足大容量、高性能...常用帮助 集群架构中分片内存占用异常的排查方法请参见 发现并处理大Key和热Key。需要掌握内存中数据的分布情况请参见 离线全量Key分析。

使用SDK时出现Validate PK size fail异常

介绍使用SDK时出现Validate PK size fail异常的现象、原因和解决方案。现象 使用SDK更新数据时出现如下异常:Caused by:[ErrorCode]:OTSInvalidPK,[Message]:Validate PK size fail 原因 设置的主键个数和数据表的主键个数不一致。解决方案...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享带宽 共享流量包 文件存储 CPFS NAT网关 Web应用防火墙 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用