如何排查slab_unreclaimable内存占用高的原因?

slab_unreclaimable是指在Linux内存管理中由slab分配器分配的且被标记为不可回收(unreclaimable)的内存。当不可回收内存占用总内存的比例过高时,将会影响可用内存与系统性能。本文介绍如何排查Alibaba Cloud Linux系统slab_...

简介

API 应用程序编程接口 用户开放API,在API网关录入API,以提供接口的方式对外提供服务或者数据。Group API Group API分组 一组API。用户开放API,首先需要创建API分组 每个API分组拥有一个二级域名,两个Stage 用户需要将已经备案且解析至...

基础术语

中文 释义 API 应用程序编程接口,是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。API 分组 用于将 API 进行逻辑的分组,同个分组下的 API 使用相同的分组标识做隔离。分组标识 是网关全局的唯一标识,用于定位在访问的 API。...

Linux内存碎片化的应对措施

sync_readv_writev([kernel.kallsyms])0xffffffff811e0cfe do_readv_writev([kernel.kallsyms])解决方案 应对Linux内存碎片化,您可以采取如下措施:调整min水位线 多数情况下阿里云建议您将min水位线设置为总内存的1%~3%。推荐您设置为总...

Alibaba Cloud Linux常见问题

Linux内存碎片化的应对措施 如何在Alibaba Cloud Linux实例中通过“/etc/resolv.conf”文件自定义配置DNS ECS实例中的应用偶尔出现丢包现象并且内核日志(dmesg)存在“kernel:nf_conntrack:table full,dropping packet”的报错信息 ...

Alibaba Cloud Linux常见问题

Linux内存碎片化的应对措施 如何开启或关闭IPv6 如何安装并启用高版本的curl?Alibaba Cloud Linux 2实例修改网络服务的方法及影响说明 如何在Alibaba Cloud Linux 2系统中配置Kdump Alibaba Cloud Linux 2镜像的ECS实例启动或重启后系统...

Linux服务器内存消耗过高

问题描述 Linux服务器的内存持续消耗过高,重启后可以恢复正常,但业务运行后问题依旧存在,而且没有明显高消耗内存进程存在。问题原因 slab消耗内存过多。解决方案 登录问题Linux服务器。执行free和top命令确认不存在占用大量内存的进程。...

Linux实例存在OOM问题的处理方法

OOM发生时的应用日志 根据以下OOM原因进行处理:当前Linux实例的内存不足以支撑业务的运行 您可以升级实例内存配置。注意:升级配置需要重启实例,请在合适的时间段升级内存配置。包年包月实例升级配置 按量付费实例升级配置 您的业务程序...

出现OOM Killer的原因及解决方案

Linux操作系统内存不足时,会先触发内存回收机制释放内存,并将这部分被释放的内存分配给其他进程。如果内存回收机制不能处理系统内存不足的情况,则系统会触发OOM Killer(Out of Memory Killer)强制释放进程占用的内存,达到给系统解压...

内存快照

JVM监控可以直观展示指定时间段内的多项内存指标,虽然图表能体现出内存使用量过大的情况,但无法显示具体信息,因此不能帮助您排查问题的原因。此时您可以创建内存快照,通过详细的日志查看内存占用的详细信息。功能入口 登录 EDAS控制台...

Linux系统的ECS实例的系统、内存或进程出现异常,查看...

问题现象 Linux系统的ECS实例的系统、内存或进程出现异常,通过查看系统日志提示"page allocation failure"错误,表示系统因内存不足导致无法为新的内存页分配内存空间,内存页分配失败。什么是内存内存页(Memory Page)是操作系统中对...

内存快照

此时您可以创建内存快照,通过详细的日志查看内存占用的详细信息,帮助您排查内存泄漏和内存浪费等内存问题。前提条件 已下载ARMS Java Probe探针,且探针版本为2021年09月24日之后发布的2.7.1.2或以上版本。目前仅支持为Linux系统新建内存...

如何解决Alibaba Cloud Linux 2中polkit内存泄露问题...

部分旧版本的Alibaba Cloud Linux 2操作系统中,可能出现polkit内存泄露的问题。polkit是Linux系统中一个用于控制系统范围内权限的组件,它通常作为守护进程运行,并且与系统安全相关,所以polkit内存泄露可能导致安全问题和性能下降。本文...

捕获内核的内存污染问题(KFENCE)

Alibaba Cloud Linux 3在内核版本 5.10.84-10(x86架构)和 5.10.134-16(ARM架构)开始支持KFENCE功能。本文为您介绍KFENCE的功能和使用方法等。...当应用程序或内核需要分配一小块内存时,通常会以order 0的方式进行分配。

THP reclaim功能

因此,当服务器上的应用程序申请内存时,内核会根据进程的实际情况动态分配透明大页,透明大页可以减少TLB(Translation Lookaside Buffer)Miss的出现概率,从而提升应用程序的性能。THP在带来性能提升的同时,也产生了一定副作用,即可能...

内核功能与接口概述

内存 文档链接 支持版本 说明 Memcg Exstat功能 Alibaba Cloud Linux 2内核版本 4.19.91-18.al7 及以上 Alibaba Cloud Linux 3所有内核版本 Alibaba Cloud Linux所支持的Memcg Exstat功能,相较于社区版内核额外在cgroup v1接口支持了...

无法连接Linux实例的排查方法

应用程序有大量的磁盘访问、网络访问行为、高计算需求,CPU负载过高是正常结果。建议您升配实例规格来解决资源瓶颈问题,具体操作,请参见 升降配方式概述。说明 CPU负载过高的解决方法,请参见 Linux系统CPU负载的查询和案例分析。不...

ECS实例操作系统内部(GuestOS)常见问题与修复方案

检查大页内存设置是否过大 当实例的大页内存设置过大,可能会导致无法登录Linux实例,需要调整/etc/sysctl.conf 文件中大页内存的值。具体操作,请参见 调整Linux实例大页内存的方法。检查操作系统是否OOM 如果存在OOM问题,可能会导致无法...

产品架构

Mosng 网关根据内存中的 API 信息校验应用的请求信息(验签、解密、RPC 信息校验)。如果信息校验失败,则直接返回错误信息给应用。如果信息校验通过,则根据配置的协议(HTTP/SOFARPC/SOFAREST)将应用的请求转发到后端业务服务器。

诊断项与诊断结果说明

此类故障可能是由于实例配置不当或用户空间的程序配置不当导致的,您可以尝试通过重启实例进行恢复。实例虚拟化异常 实例在运行中出现崩溃或出现异常暂停。检查该实例底层虚拟化层核心服务是否出现异常。出现此类异常可能会导致实例崩溃或...

Memcg全局最低水位线分级

本文介绍Alibaba Cloud Linux 2(内核版本 4.19.91-18.al7 开始)和Alibaba Cloud Linux 3新增的memcg全局最低水位线分级功能。背景信息 在Linux内核中,全局内存回收对系统性能影响很大。当时延敏感型业务和资源消耗型任务共同部署时,...

常见问题

产品FAQ 实例FAQ 镜像生命周期问题 块存储FAQ 快照FAQ 计费FAQ 安全FAQ 网络FAQ 运维与监控FAQ API FAQ 迁云工具FAQ 最新发布 使用ping命令测试ECS实例时ping不通的排查方法 如何在Linux实例中自定义配置DNS 如何迁移Linux实例系统盘中的...

内存诊断

此时,除去应用程序实际需要的内存(2个小页面),透明大页剩下的内存(510个小页面)大小均为0。最终可能会因RSS(Resident Set Size)内存用量增加而导致OOM。THP浪费率=THP零页数x100%THP总页面数。伙伴系统 伙伴系统是Linux内核用来...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

配置使用持久内存

持久内存支持的使用方式和实例规格有关,本文介绍如何将持久内存配置为本地盘以及可以配置为本地盘的持久内存型实例(ecs.re7p规格和ecs.i4p规格)使用llpl库分配内存池失败的解决方案。前提条件 持久内存适用于特定的实例规格和镜像版本,...

Memcg后台异步回收

Alibaba Cloud Linux 2(内核版本 4.19.81-17.al7 开始)和Alibaba Cloud Linux 3内核版本增加了内存子系统(memcg)后台异步回收功能。本文介绍实现memcg后台异步回收功能的接口。背景信息 在社区内核系统中,系统分配内存并在相应memcg中...

变更实例配置

相关API API接口 说明 ModifyInstanceSpec 变更 Tair 实例的规格。相关文档 变更分片数 云原生集群架构的实例,增加或减少集群的分片数,请参见 调整实例的分片数量。变更为读写分离架构 云原生标准架构的实例,变更为读写分离架构,请参见...

DLC常见问题

Linux系统中,错误码137表示进程被SIGKILL信号强制中止了,最常见的原因是内存使用量过高,即OOM(Out Of Memory)错误。您可以结合任务详情中worker的内存水位来进一步判断内存不足的原因,或更换内存规格更大的实例,或增加worker数量...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的CVE-2021-22555安全漏洞内核热补丁修复方案 Alibaba Cloud Linux 2系统的ECS实例中Page Fault异常导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中SGX驱动在特定情况下存在内存泄露问题,如何处理?...

使用Intel AI容器镜像部署Qwen-7B-Chat

实例:Qwen-7B-Chat大概需要30 GiB内存,为了保证模型运行的稳定,实例规格至少需要选择ecs.g8i.4xlarge(64 GiB内存)。镜像:Alibaba Cloud Linux 3.2104 LTS 64位。公网IP:选中 分配公网IPv4地址,带宽计费模式选择 按使用流量,带宽...

使用AMD AI容器镜像部署ChatGLM3-6B

实例:ChatGLM3-6B大概需要30 GiB内存,为了保证模型运行的稳定,实例规格至少需要选择ecs.g8a.4xlarge(64 GiB内存)。镜像:Alibaba Cloud Linux 3.2104 LTS 64位。公网IP:选中 分配公网IPv4地址,带宽计费模式选择 按使用流量,带宽...

系统运维工具集SysAK使用说明

Alibaba Cloud Linux、Anolis OS drml*容器中内存回收延迟时间分布 dcl*容器内存压缩的延迟时间分布 IO资源 IO指标 riops 容器中读IO个数 无 wiops 容器中读写IO个数 rbps 容器中的读字节数 wbps 容器中的写字节数 rwait 容器中读等待时间 ...

漏洞公告|Linux内核漏洞(CVE-2020-14386)

Alibaba Cloud Linux 2.1903(原Aliyun Linux 2.1903)CentOS 8 Red Hat Enterprise Linux 8 Debian 9/10 OpenSUSE 15 SUSE Linux Enterprise Server 12/15 Ubuntu 18.04/20.04 详细描述 CVE-2020-14386是内核模块中存在的内存溢出漏洞。...

Alibaba Cloud Linux系统中与透明大页THP相关的性能...

说明 应用程序使用 MADV_HUGEPAGE 标记时,内核就会知道应用程序希望使用大页进行内存分配。碎片整理配置 除了上述全局配置外,还有下列两个与透明大页THP相关的碎片整理配置。透明大页THP碎片整理:透明大页的碎片整理可以合并系统中分散...

在cgroup v1接口开启PSI功能

Linux的内核中PSI功能只支持cgroup v2接口。为了您在使用cgroup v1接口时,也可以通过PSI功能监控CPU、内存及IO性能异常等信息。Alibaba Cloud Linux 2(内核版本 4.19.81-17.al7 开始)和Alibaba Cloud Linux 3为cgroup v1接口提供了PSI...

代码大页

支持将应用程序和动态链接库的可执行部分放入到大页(通常是2 MB或更大)中,有助于降低程序的iTLB miss,并提升CPU的2 MB iTLB利用率,避免内存碎片化或内存膨胀问题,提高内存利用效率,适用于数据库、大型应用程序等大代码段业务场景。...

容器内存QoS

ack-koordinator为容器提供内存服务质量QoS(Quality of Service)保障能力,在确保内存资源公平性的前提下,改善应用在运行时的内存性能。本文介绍如何使用容器内存QoS功能。背景信息 容器在使用内存时主要有以下两个方面的约束:自身内存...

增强容器资源可见性

从Alibaba Cloud Linux 2(内核版本 4.19.91-22.2.al7)和Alibaba Cloud Linux 3(内核版本 5.10.46-7.al8)开始,在内核层面提供了容器资源视图功能的相关接口,实现对容器资源的可见性增强。本文将对该功能的接口进行说明,并提供示例...

Alibaba Cloud Linux 2系统中systemd服务异常问题说明

如果您的Alibaba Cloud Linux 2操作系统中systemd服务运行异常,可参考文本提供的方案解决问题。问题现象 在符合以下条件的Alibaba Cloud Linux 2实例中,系统在正常运行时实例内部署的业务有概率启动失败。镜像:Alibaba Cloud Linux 2....

什么是Alibaba Cloud Linux

阿里云积极吸收开源社区成果,为云上应用程序提供Linux社区的增强功能,并通过引入更完善的发行版质量体系确保产品品质。同时结合阿里云基础设施进行深度优化,并为用户提供长达10年的企业级支持和维护,让阿里云用户体验更好的操作系统...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
API 网关 视觉智能开放平台 对象存储 云数据库 RDS 短信服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用