节点异常问题排查

2 Insufficient ephemeral-storage 其中调度器判定节点资源不足的计算方式为:集群节点CPU资源不足的判定方式:当前Pod请求的CPU资源总量>(节点可分配的CPU资源总量-节点已分配的CPU资源总量)集群节点内存资源不足的判定方式:当前Pod...

节点异常问题排查

2 Insufficient ephemeral-storage 其中调度器判定节点资源不足的计算方式为:集群节点CPU资源不足的判定方式:当前Pod请求的CPU资源总量>(节点可分配的CPU资源总量-节点已分配的CPU资源总量)集群节点内存资源不足的判定方式:当前Pod...

重启变更报错:集群状态不健康或存在close索引,不能...

本文介绍重启变更报错的详细说明、可能原因及解决方案。报错说明 当您触发了Elasticsearch实例重启变更时,系统提示“集群状态不健康或存在close索引,不能执行当前操作,建议待集群状态稳定或开启已关闭的索引后再试”。问题原因及解决...

自动定时重启ECS云服务器

通过定时重启可以释放这部分内存。高负载运行:对于一些需要持续高负载运行的服务器,定时进行重启可以避免因长时间高负载运行带来的潜在问题。缓存问题:有一些应用程序可能会产生大量的缓存数据,如果不定期清理可能会影响存储空间,通过...

OOM常见问题排查指南

在早期版本中,计算节点(Worker Node)的内存上限是20GB,但Hologres从 V1.1.24版本开始,计算节点运行时内存取消单节点20 GB的限制,采用动态调整节点内存,定期检查内存水位,如果元数据较少时,会尽量将剩余可用内存都分配给查询运行时...

识货电商引入Tair构建在线业务平台,轻松应对百万QPS...

云原生内存数据库 Tair 提供了丰富的数据模型和企业级能力,帮助识货电商构建在线业务系统,平稳地支撑识货各种大促活动,轻松应对百万级QPS的业务挑战。客户感言“云原生内存数据库 Tair 助力识货APP实现高并发、低时延的系统架构,轻松...

工作负载推荐配置

下面的例子中,声明Nginx这个Pod需要1核CPU,1024MB的内存,运行中实际使用不能超过2核CPU和4096MB内存。apiVersion:v1 kind:Pod metadata:name:nginx spec:containers:name:nginx image:nginx resources:#资源声明 requests:memory:"1024...

YARN资源配置

从EMR-3.49.0及之后版本,EMR-5.15.0及之后版本开始,EMR会根据集群初始化的机型和服务选择情况,在创建集群过程中动态调整组件的默认内存设置,而不是使用之前版本中的默认配置。本文为您介绍YARN组件堆内存大小配置以及YARN资源配置的...

重启实例或节点

重要 节点在重启期间,对应的CPU和内存使用率会存在临时突增的情况,可能会造成服务抖动,正常情况下过一段时间后会恢复正常。目前阿里云Elasticsearch实例的重启耗时与集群规模等因素有关。您可以在 任务列表 中查看实例的重启进度。强制...

Shared Server

用户连接不再使用新的SS共享内存,而是使用本地进程内存。用户连接与后端进程之间的数据传输依旧经过Dispatcher转发。以下场景中会触发兜底机制,执行模式会由Shared转变为Dedicated:更新了SS黑名单内的GUC参数。使用了SS黑名单内的插件。...

Shared Server

PolarDB PostgreSQL版(兼容Oracle)针对上述问题,从数据库内部提供了 Shared Server(本文简称SS)内置连接池功能,采用共享内存+Session Context+Dispatcher转发+Backend Pool的架构,实现了用户连接与后端进程的解绑。后端进程具备了...

使用性能监控分析Golang应用内存泄露问题

本文介绍如何综合运用性能监控(火焰图等)工具,观测并...通过上述对比可知memNormal函数过去和现在的内存没有变化,但是占用总内存比例却减少了38%,同时memLeak函数的当前值比过去半小时的值涨了0.43 GB内存,占用总内存比例增加了37%。

漏洞管理常见问题

重启系统时,如果您的内核引导GRUB菜单曾做过修改,系统将无法自动为最新的内核建立引导菜单,即使重启后,云安全中心控制台仍然会提示 修复成功待重启。这种情况下,会导致无法验证漏洞是否修复成功。如果您需要使用新内核默认附带的设置...

Alibaba Cloud Linux 2使用说明

先开启Kdump服务 sudo systemctl enable kdump.service#重启Kdump服务 sudo systemctl restart kdump.service 依次运行以下命令可以将Kdump服务预留的内存地址空间归还给操作系统,并彻底关闭Kdump服务。先更改/sys/kernel/kexec_crash_...

Resource Manager

过多使用动态内存,可能会导致内存使用量超过操作系统限制,触发内核内存限制机制,造成集群进程异常退出,集群重启,引发集群不可用的问题。进程私有内存MemoryContext管理的内存可以分为以下两部分:工作计算区域内存:业务运行所需的...

Tair配置参数列表

您可以根据业务场景对 云原生内存数据库Tair 实例的参数进行调优与自定义配置,已提升 Tair 实例的性能与安全性。本文介绍各参数的详细说明。注意事项 若设置参数时报错 Parameter is not supported for current version,请升级小版本后重...

Resource Manager

过多使用动态内存,可能会导致内存使用量超过操作系统限制,触发内核内存限制机制,造成集群进程异常退出,集群重启,引发集群不可用的问题。进程私有内存MemoryContext管理的内存可以分为以下两部分:工作计算区域内存:业务运行所需的...

JVM监控内存详情说明

内存泄露分析 ARMS提供了完善的堆内存泄露定位分析能力,用户可以通过JVM堆内存监控查看是否出现堆内存缓慢增长,如果存在相关堆内存持续增长趋势,可以通过ARMS提供的 内存快照 或 持续剖析 功能排查定位堆内内存泄露位置。堆外内存泄露...

Kibana FAQ

可能原因 解决方法 存在多个Kibana系统索引或者数据结构发生了变化 删除.kibana 开头的相关索引,并通过控制台重启Kibana节点,或者重启Elasticsearch实例,重启操作请参见 重启实例或节点。警告 删除.kibana 索引后,会丢失Kibana中已创建...

应用内存不足

本文介绍在使用消息队列时出现应用内存不足时的一些常见问题及解决方法。现象 在应用部署的机器上查看内存已消耗完。在/{user.home}/logs/sofamq.log 能搜索到 OutOfMemory 关键字。在消息队列控制台查看目标 Group ID 的消费者状态,堆积...

关闭AOF落盘

云原生内存数据库Tair 默认开启AOF落盘,即基于AOF(append-only file)的数据持久化。您可以通过设置 appendonly 参数来关闭或重新开启AOF落盘。AOF落盘 AOF持久化是 Tair 除了RDB备份外的另一种持久化方式。开启AOF持久化后,Tair 以日志...

Tair持久化与备份恢复

如遇 Tair 宕机或重启,能够利用磁盘中的持久化文件恢复数据。为满足各类场景下对备份与恢复的需求,云原生内存数据库Tair 提供RDB持久化、AOF持久化和Tair-Binlog持久化策略。持久化策略 云原生内存数据库Tair 支持以下持久化策略:RDB...

阿里云Elasticsearch实例FAQ

本文列举了阿里云Elasticsearch(ES)相关的常见问题,包括购买、退订、配置、访问、查询、写入、插件、分词、日志、重启、负载或状态异常、备份与恢复、监控报警等相关问题。常见问题概览 购买或退订实例问题 购买ES实例时选错配置,如何...

服务运维

Service Mesh 是非常基础的组件,目前的应急手段主要是下述重启方式:Sidecar 单独重启 Pod 重启 变更风险防控 除了传统的变更三板斧之外,蚂蚁还引入了无人值守变更,对 Service Mesh 变更做了自动检测、自动分析与变更熔断。无人值守变更...

耗资源用户处理流程

耗资源即程序异常占用过多CPU及内存,导致资源浪费。例如您在使用云虚拟主机时,因为运行了编写不合理的程序等导致服务器负载急剧上升,影响站点正常工作。当您的站点出现资源过度消耗的情况时,阿里云将关停站点并向您发送邮件和短信通知...

离线全量Key分析

通过离线全量Key分析功能来分析Redis的备份文件,可以快速发现实例中的大Key,帮助您掌握Key在内存中的占用和分布、Key过期时间等信息,为您的优化操作提供数据支持,帮助您避免因Key倾斜引发的内存不足、性能下降等问题。该功能由 ...

执行引擎

批量内存分配:向量化执行引擎预测计算每个算子需求的内存空间,结合执行引擎Batch化数据模型进行批量内存分配,避免过于碎片化的内存分配。最小内存操作原则:减少不必要的内存申请/重置/释放操作,最大化地提升内存操作性能。

JVM内存调优

本文为您介绍如何调整NameNode JVM和DataNode JVM内存大小,以便优化HDFS的稳定性。调整NameNode JVM内存大小 背景:在HDFS中,每个文件对象都需要在NameNode中记录元数据信息,并占用一定的内存空间。默认的JVM配置可以满足部分普通的HDFS...

Linux实例系统总体负载的查询及分析

Linux实例总体负载的查询及分析 Linux实例如果总体负载过高,可能会引发死机或卡顿等异常。可以参阅如下步骤进行整体排查。检查服务器进程与服务否占用过多内存,或者内存没有正常释放,导致出现内存溢出,系统宕机。检查/var/spool/cron ...

Task快速重启配置

本文为您介绍,如何配置Task快速重启,从而降低Failover对作业的影响。背景信息 重要 此功能为预览功能,请在生产环境下谨慎使用,如遇问题请及时 提交工单 和技术支持部门取得联系。通常,当Flink流作业中的某个Task发生异常时,为了保证...

升级节点配置

当节点组内ECS实例的规格(vCPU和内存)无法满足您的业务需求时,您可以使用配置升级功能提升ECS实例规格。本文为您介绍如何升级节点的配置。前提条件 已创建集群,详情请参见 创建集群。使用限制 仅E-MapReduce包年包月集群支持升级配置。...

【通知】云监控中Tair持久内存型的CPU使用率指标升级

受影响的实例 Tair 持久内存型 升级时间 2023年06月13日 升级功能 升级前,云监控中 Tair 持久内存型的CPU使用率是统计 Tair 实例和其所在操作系统的平均CPU使用率,由于持久内存型的机器规格为3核CPU及以上,因此该CPU使用率整体较低。...

应用安全常见问题

实际测试中,CPU的额外开销小于1%,内存开销小于30 MB,应用延迟(RT)小于1 ms。此外,应用安全还提供观察模式、软熔断逃生机制等功能,最大限度降低对应用运行的干扰。如何接入应用安全?您可通过ARMS控制台一键接入应用安全,接入后重启...

Global Plan Cache

每个连接都会缓存一份Plan Cache,导致内存占用较多。PolarDB PostgreSQL版(兼容Oracle)引入了Global Plan Cache(简称GPC)功能,通过让不同的连接共享同一份Plan Cache来解决以上两个问题。Plan可以在不同的Prepared Statement、连接...

2018年

[相关文档:内存快照]新增监控方法自定义配置功能,让您可以自行动态配置要监控和捕获异常的具体方法,使监控细粒度范围进一步扩大,并且配置立即生效,无需重启机器。新增应用监控概览页,问题排查和定位更加方便准确。新增MQ链路监控,可...

使用SysOM定位容器内存问题

内存大类 内存小类 说明 应用程序内存(Application Memory)应用程序内存由以下几个部分组成:匿名内存(Anon):没有关联到文件的内存,例如进程的堆、栈、数据段等。通过BRK和MMAP分配的堆内存。文件缓存(FileCache):用于缓存读取和...

自定义资源组

服务器使用了一段时间,出现突然终止服务,重启无效果或重启失败的情况,可能有以下原因:不同账户启动过Agent,导致目录权限不一致。确认方法如下:登录ECS,切换至有权限账号。执行命令 ps-ef|grep zoo|grep-v cdp。如果返回两个进程,则...

全局执行计划缓存

每个连接都会缓存一份Plan Cache,导致内存占用较多。PolarDB PostgreSQL版 引入了全局执行计划缓存(简称GPC)功能,通过让不同的连接共享同一份Plan Cache来解决以上两个问题。Plan可以在不同的Prepared Statement、连接之间共享。对于有...

全局执行计划缓存

每个连接都会缓存一份Plan Cache,导致内存占用较多。PolarDB PostgreSQL版(兼容Oracle)引入了全局执行计划缓存(简称GPC)功能,通过让不同的连接共享同一份Plan Cache来解决以上两个问题。Plan可以在不同的Prepared Statement、连接...

2023年

无 缺陷修复 修复因缓存文件数满导致服务重启的问题。修复delta表管理中可能出现报错的问题。修复扩缩容中资源队列报错的问题。2023年10月(V2.1.1.0)类别 功能 功能描述 相关文档 优化 查询性能 重构delta表管理,减少Base数据小文件数,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 ClickHouse 大数据开发治理平台 DataWorks Serverless 应用引擎 智能语音交互 云数据库 Memcache 版 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用