如何排查slab_unreclaimable内存占用高的原因?

slab_unreclaimable是指在Linux内存管理中由slab分配器分配的且被标记为不可回收(unreclaimable)的内存。当不可回收内存占用总内存的比例过高时,将会影响可用内存与系统性能。本文介绍如何排查Alibaba Cloud Linux系统slab_...

Alibaba Cloud Linux常见问题

Linux内存碎片化的应对措施 如何在Alibaba Cloud Linux实例中通过“/etc/resolv.conf”文件自定义配置DNS ECS实例中的应用偶尔出现丢包现象并且内核日志(dmesg)存在“kernel:nf_conntrack:table full,dropping packet”的报错信息 ...

Linux内存碎片化的应对措施

Linux系统长时间运行会出现内存碎片化的问题,本文主要提供了应对该问题的一些措施。问题现象 实例内部署的业务偶然出现响应时间过长或者系统调用时间过长,系统的 sys 指标也会相应的增高,伙伴系统会缺少高阶内存(order 大于3的内存)。...

Alibaba Cloud Linux常见问题

本文介绍Alibaba Cloud Linux镜像的常见问题和常见操作指导。功能咨询 在阿里云ECS中运行Alibaba Cloud Linux是否收费?Alibaba Cloud Linux镜像本身是免费的,但是您需要为ECS实例等其他资源的支付费用。Alibaba Cloud Linux支持哪些阿里...

为什么发生OOM却没有生成dump文件?

事件中心的OOM事件是指系统内存不足时,触发了Linux内存回收(OOM Killer)机制,此时系统会终止内存占用较多的进程以保证系统的正常运行。当发生OOM Killer时,并不一定会发生JVM OOM,所以不会生成dump文件。您可以采取以下方式来避免...

常见问题

磁盘/CPU/内存/带宽问题 Windows实例负载的查询及分析 Linux实例CPU负载的查询和案例分析 如何配置Windows实例的虚拟内存 入网带宽和出网带宽 Linux实例网络流量负载情况的查询和案例分析 Linux实例中如何查看物理CPU和内存信息 Linux实例...

使用实例时镜像相关问题

SUSE镜像问题 SLES for SAP常见问题 SUSE Linux Enterprise Server for SAP Applications(SLES for SAP)是SAP和SUSE公司在SLES商业Linux操作系统的基础上定制的SAP系统专用版本。关于SLES for SAP在使用过程中的常见问题如下:SUSE Linux...

Linux实例存在OOM问题的处理方法

OOM发生时的应用日志 根据以下OOM原因进行处理:当前Linux实例的内存不足以支撑业务的运行 您可以升级实例内存配置。注意:升级配置需要重启实例,请在合适的时间段升级内存配置。包年包月实例升级配置 按量付费实例升级配置 您的业务程序...

Linux服务器内存消耗过高

问题描述 Linux服务器的内存持续消耗过高,重启后可以恢复正常,但业务运行后问题依旧存在,而且没有明显高消耗内存进程存在。问题原因 slab消耗内存过多。解决方案 登录问题Linux服务器。执行free和top命令确认不存在占用大量内存的进程。...

内存快照

JVM监控可以直观展示指定时间段内的多项内存指标,虽然图表能体现出内存使用量过大的情况,但无法显示具体信息,因此不能帮助您排查问题的原因。此时您可以创建内存快照,通过详细的日志查看内存占用的详细信息。功能入口 登录 EDAS控制台...

Linux系统的ECS实例的系统、内存或进程出现异常,查看...

问题现象 Linux系统的ECS实例的系统、内存或进程出现异常,通过查看系统日志提示"page allocation failure"错误,表示系统因内存不足导致无法为新的内存页分配内存空间,内存页分配失败。什么是内存内存页(Memory Page)是操作系统中对...

内存快照

目前仅支持为Linux系统新建内存快照。使用限制 内存快照功能是JVM内置的HeapDump的平台化,HeapDump本身可能触发SafePoint和GC等情况,这些情况会暂停所有非VM Thread造成应用暂停,暂停时间无法强控制,因此操作本身会造成服务质量下降。...

出现OOM Killer的原因及解决方案

Linux操作系统内存不足时,会先触发内存回收机制释放内存,并将这部分被释放的内存分配给其他进程。如果内存回收机制不能处理系统内存不足的情况,则系统会触发OOM Killer(Out of Memory Killer)强制释放进程占用的内存,达到给系统解压...

实例启动异常常见错误与对应解决方案

针对实例启动过程中因操作系统内配置异常、异常关机等问题导致操作系统无法正常启动的情况,您可以通过VNC登录实例发现的启动异常或者实例健康诊断工具返回的异常字段,在本文查看此类问题的解决方案。Windows 1662001135:Windows系统因...

如何解决Alibaba Cloud Linux 2中polkit内存泄露问题...

部分旧版本的Alibaba Cloud Linux 2操作系统中,可能出现polkit内存泄露的问题。polkit是Linux系统中一个用于控制系统范围内权限的组件,它通常作为守护进程运行,并且与系统安全相关,所以polkit内存泄露可能导致安全问题和性能下降。本文...

THP reclaim功能

背景信息 Linux操作系统的内存采用分页管理模式,其中的THP是指内核中2 MiB或1 GiB大小的大页面(普通的小页面大小为4 KiB),一般被称为透明大页。基于应用程序使用到的内存范围越来越大,地址转换产生的开销变得不可忽视。因此,当服务器...

捕获内核的内存污染问题(KFENCE)

功能介绍 KFENCE(Kernel Electric-Fence)是Linux内核内置的、可在线上环境开启的工具,用于捕获内核及内核模块的内存污染问题,在 上游Linux内核社区 的 5.12 版本中引入。KFENCE的目标是通过在内存边界附近插入特殊的标记(fence),来...

更改主机操作系统

内存为512 MB的独享经济版云虚拟主机 由于云虚拟主机内存偏小,安装Windows操作系统后云虚拟主机无法正常运行,只能使用Linux操作系统。机房位置不在中国内地的独享云虚拟主机 例如,新加坡机房、美国机房、中国(香港)机房的独享增强版和...

ECS实例操作系统内部(GuestOS)常见问题与修复方案

检查大页内存设置是否过大 当实例的大页内存设置过大,可能会导致无法登录Linux实例,需要调整/etc/sysctl.conf 文件中大页内存的值。具体操作,请参见 调整Linux实例大页内存的方法。检查操作系统是否OOM 如果存在OOM问题,可能会导致无法...

无法连接Linux实例的排查方法

本文主要介绍无法远程登录Linux实例的排查方法。问题原因 下图为SSH远程登录的关联因素示意图,由此可见,SSH远程登录失败的可能原因较多。如PAM安全框架、安全组、SSH配置等。请您根据实际情况,通过相应的排查方法,排查并解决无法远程...

操作系统监控

监控指标名称 监控指标含义 单位 MetricName Dimensions Statistics 说明(仅用于Linux)(Agent)memory.total.space 内存总量。Byte memory_totalspace userId、instanceId Maximum、Minimum、Average 服务器的内存总量。proc/meminfo 的...

在离线混部概述

为了提高应用运行时性能和节点的稳定性,ack-koordinator结合Alibaba Cloud Linux提供了容器内存QoS保障的能力,根据Pod参数自动配置内存子系统(Memcg),为容器开启Memcg QoS、内存后台回收和全局最低水位线分级特性,可以保障容器的内存...

诊断指标与诊断结果条目说明

Instance.ResourceNotEnough 检查该实例所需要的CPU、内存等物理资源是否充足。Instance.ECSService.ResourceOutOfStock 在需要重新为实例分配资源时,例如从节省停机模式启动实例,如果因为库存不足使得物理资源不足,将导致实例无法启动...

设置Logtail启动参数

需要采集的日志文件数目大(同时采集的文件数超过100个或所监控的目录下的文件数超过5000个),占用大量内存。日志数据流量大(例如极简模式下超过2 MB/s,正则模式下超过1 MB/s),导致CPU占用率高。Logtail发送数据到日志服务的速率超过...

内核功能与接口概述

内存 文档链接 支持版本 说明 Memcg Exstat功能 Alibaba Cloud Linux 2内核版本 4.19.91-18.al7 及以上 Alibaba Cloud Linux 3所有内核版本 Alibaba Cloud Linux所支持的Memcg Exstat功能,相较于社区版内核额外在cgroup v1接口支持了...

Memcg全局最低水位线分级

本文介绍Alibaba Cloud Linux 2(内核版本 4.19.91-18.al7 开始)和Alibaba Cloud Linux 3新增的memcg全局最低水位线分级功能。背景信息 在Linux内核中,全局内存回收对系统性能影响很大。当时延敏感型业务和资源消耗型任务共同部署时,...

内存诊断

容器智能运维平台 提供内存诊断功能,可以覆盖Kubernetes集群上常见的内存问题,包括内存泄漏、内存碎片化、OOM等。诊断结果以图表的方式展示系统内存整体使用情况,将容器内的缓存和共享内存归属到具体的文件夹下,清晰展示系统内存使用...

配置使用持久内存

持久内存支持的使用方式和实例规格有关,本文介绍如何将持久内存配置为本地盘以及可以配置为本地盘的持久内存型实例(ecs.re7p规格和ecs.i4p规格)使用llpl库分配内存池失败的解决方案。前提条件 持久内存适用于特定的实例规格和镜像版本,...

容器内存QoS

ack-koordinator为容器提供内存服务质量QoS(Quality of Service)保障能力,在确保内存资源公平性的前提下,改善应用在运行时的内存性能。本文介绍如何使用容器内存QoS功能。背景信息 容器在使用内存时主要有以下两个方面的约束:自身内存...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

读写访问文件类问题

解决方案 建议选用NAS SMB推荐的Linux版本,NAS SMB支持的Linux操作系统版本如下表所示:操作系统类型 操作系统版本 CentOS CentOS 7.6 64位:3.10.0-957.21.3.el7.x86_64及以上 Alibaba Cloud Linux Alibaba Cloud Linux 2.1903 64位:4....

挂载访问FAQ

目前仅支持Linux操作系统挂载NFS文件系统,Windows操作系统挂载SMB文件系统、Windows操作系统挂载NFS文件系统及Linux操作系统挂载SMB文件系统场景,请您登录ECS实例执行命令挂载。更多信息,请参见 Windows系统挂载SMB文件系统、Windows...

(停止维护)Kubernetes 1.22

目前该特性仅适用于Linux节点,实现NUMA感知的内存管理,对有内存使用质量保证要求的应用,能带来显著的使用性能提高。ACK 暂不配置任何和该特性相关的内存预留值。更多信息,请参见 运行时的内存映射 和 使用NUMA感知内存管理器。1.22版本...

ACK灵骏发布Kubernetes 1.22版本说明

目前该特性仅适用于Linux节点,实现NUMA感知的内存管理,对有内存使用质量保证要求的应用,能带来显著的使用性能提高。ACK 暂不配置任何和该特性相关的内存预留值。更多信息,请参见 运行时的内存映射 和 使用NUMA感知内存管理器。1.22版本...

Memcg后台异步回收

Alibaba Cloud Linux 2(内核版本 4.19.81-17.al7 开始)和Alibaba Cloud Linux 3内核版本增加了内存子系统(memcg)后台异步回收功能。本文介绍实现memcg后台异步回收功能的接口。背景信息 在社区内核系统中,系统分配内存并在相应memcg中...

DLC常见问题

Linux系统中,错误码137表示进程被SIGKILL信号强制中止了,最常见的原因是内存使用量过高,即OOM(Out Of Memory)错误。您可以结合任务详情中worker的内存水位来进一步判断内存不足的原因,或更换内存规格更大的实例,或增加worker数量...

Alibaba Cloud Linux 2镜像发布记录

阿里云定期发布Alibaba Cloud Linux 2镜像的更新版本,以确保用户可以获取到最新的操作系统特性、功能和安全补丁。您可以通过本文查看Alibaba Cloud Linux 2镜像最新的可用版本及更新内容。背景信息 如无特殊声明,更新内容适用于云服务器...

Alibaba Cloud Linux 3镜像发布记录

阿里云定期发布Alibaba Cloud Linux 3镜像的更新版本,以确保用户可以获取到最新的操作系统特性、功能和安全补丁。您可以通过本文查看Alibaba Cloud Linux 3镜像最新的可用版本及更新内容。背景信息 如无特殊声明,更新内容适用于云服务器...

使用Intel CPU部署AI容器镜像Qwen-7B-Chat

实例:Qwen-7B-Chat大概需要30 GiB内存,为了保证模型运行的稳定,实例规格至少需要选择ecs.g8i.4xlarge(64 GiB内存)。镜像:Alibaba Cloud Linux 3.2104 LTS 64位。公网IP:选中 分配公网IPv4地址,带宽计费模式选择 按使用流量,带宽...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Memcache 版 云数据库 RDS 弹性公网IP 短信服务 人工智能平台 PAI 对象存储
新人特惠 爆款特惠 最新活动 免费试用