如何排查slab_unreclaimable内存占用高的原因?

slab_unreclaimable是指在Linux内存管理中由slab分配器分配的且被标记为不可回收(unreclaimable)的内存。当不可回收内存占用总内存的比例过高时,将会影响可用内存与系统性能。本文介绍如何排查Alibaba Cloud Linux系统slab_...

Alibaba Cloud Linux常见问题

Linux内存碎片化的应对措施 如何在Alibaba Cloud Linux实例中通过“/etc/resolv.conf”文件自定义配置DNS ECS实例中的应用偶尔出现丢包现象并且内核日志(dmesg)存在“kernel:nf_conntrack:table full,dropping packet”的报错信息 ...

Linux内存碎片化的应对措施

Linux系统长时间运行会出现内存碎片化的问题,本文主要提供了应对该问题的一些措施。问题现象 实例内部署的业务偶然出现响应时间过长或者系统调用时间过长,系统的 sys 指标也会相应的增高,伙伴系统会缺少高阶内存(order 大于3的内存)。...

Alibaba Cloud Linux常见问题

本文介绍Alibaba Cloud Linux镜像的常见问题和常见操作指导。功能咨询 在阿里云ECS中运行Alibaba Cloud Linux是否收费?Alibaba Cloud Linux镜像本身是免费的,但是您需要为ECS实例等其他资源的支付费用。Alibaba Cloud Linux支持哪些阿里...

为什么发生OOM却没有生成dump文件?

事件中心的OOM事件是指系统内存不足时,触发了Linux内存回收(OOM Killer)机制,此时系统会终止内存占用较多的进程以保证系统的正常运行。当发生OOM Killer时,并不一定会发生JVM OOM,所以不会生成dump文件。您可以采取以下方式来避免...

常见问题

磁盘/CPU/内存/带宽问题 Windows实例负载的查询及分析 Linux实例CPU负载的查询和案例分析 如何配置Windows实例的虚拟内存 入网带宽和出网带宽 Linux实例网络流量负载情况的查询和案例分析 Linux实例中如何查看物理CPU和内存信息 Linux实例...

使用实例时镜像相关问题

SUSE镜像问题 SLES for SAP常见问题 SUSE Linux Enterprise Server for SAP Applications(SLES for SAP)是SAP和SUSE公司在SLES商业Linux操作系统的基础上定制的SAP系统专用版本。关于SLES for SAP在使用过程中的常见问题如下:SUSE Linux...

Linux实例存在OOM问题的处理方法

OOM发生时的应用日志 根据以下OOM原因进行处理:当前Linux实例的内存不足以支撑业务的运行 您可以升级实例内存配置。注意:升级配置需要重启实例,请在合适的时间段升级内存配置。包年包月实例升级配置 按量付费实例升级配置 您的业务程序...

Linux服务器内存消耗过高

问题描述 Linux服务器的内存持续消耗过高,重启后可以恢复正常,但业务运行后问题依旧存在,而且没有明显高消耗内存进程存在。问题原因 slab消耗内存过多。解决方案 登录问题Linux服务器。执行free和top命令确认不存在占用大量内存的进程。...

内存快照

目前仅支持为Linux系统新建内存快照。在 创建内存快照 对话框中选择一个IP,并单击 保存。说明 如果在 应用详情 页面左侧已选择目标实例,则 IP 字段会默认选中该实例的IP地址。查看内存快照详情 在 JVM监控 页签右上角,单击 历史快照。在...

Linux系统的ECS实例的系统、内存或进程出现异常,查看...

问题现象 Linux系统的ECS实例的系统、内存或进程出现异常,通过查看系统日志提示"page allocation failure"错误,表示系统因内存不足导致无法为新的内存页分配内存空间,内存页分配失败。什么是内存内存页(Memory Page)是操作系统中对...

内存快照

目前仅支持为Linux系统新建内存快照。使用限制 内存快照功能是JVM内置的HeapDump的平台化,HeapDump本身可能触发SafePoint和GC等情况,这些情况会暂停所有非VM Thread造成应用暂停,暂停时间无法强控制,因此操作本身会造成服务质量下降。...

出现OOM Killer的原因及解决方案

Linux操作系统内存不足时,会先触发内存回收机制释放内存,并将这部分被释放的内存分配给其他进程。如果内存回收机制不能处理系统内存不足的情况,则系统会触发OOM Killer(Out of Memory Killer)强制释放进程占用的内存,达到给系统解压...

实例启动异常常见错误与对应解决方案

针对实例启动过程中因操作系统内配置异常、异常关机等问题导致操作系统无法正常启动的情况,您可以通过VNC登录实例发现的启动异常或者实例健康诊断工具返回的异常字段,在本文查看此类问题的解决方案。Windows 1662001135:Windows系统因...

Linux实例SWAP分区的配置和常见问题处理

详细描述 SWAP分区介绍 在Linux系统中的SWAP(交换分区),类似于Windows系统的虚拟内存。系统会把一部分硬盘空间虚拟成内存使用,将系统内非活动内存换页到SWAP,以提高系统可用内存。注:如果您使用普通云盘,不建议使用SWAP分区。如果是...

Alibaba Cloud Linux 3系统的NFS文件系统读取文件性能...

使用 dd 命令从NFS挂载点的文件中读取数据时,Alibaba Cloud Linux 3比Alibaba Cloud Linux 2用时多。例如:dd if=<nfs_mntpoint>/<testfile>of=dev/null bs=1M 说明 该示例命令表示从NFS挂载点的testfile文件中读取数据,并将其发送到/dev...

如何解决Alibaba Cloud Linux 2中polkit内存泄露问题...

部分旧版本的Alibaba Cloud Linux 2操作系统中,可能出现polkit内存泄露的问题。polkit是Linux系统中一个用于控制系统范围内权限的组件,它通常作为守护进程运行,并且与系统安全相关,所以polkit内存泄露可能导致安全问题和性能下降。本文...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

解决Linux实例磁盘空间满问题

Linux系统的云服务器ECS实例内创建文件或者应用时出现 No space left on device 报错提示,即表示您的磁盘空间不足。如果磁盘满不符合您的预期使用,可根据本文判断磁盘满的原因并相应解决。说明 如果磁盘满是符合您的预期使用,您可以...

Page Cache限制功能

Alibaba Cloud Linux 3(内核版本 5.10.134-14 开始)增加了Page Cache(文件缓存)限制功能,用于解决因Page Cache无限制使用带来的系统稳定性问题,例如业务抖动、预期外的内存溢出OOM(Out Of Memory)等。背景信息 在内核系统中,系统...

检测Linux Rootkit入侵威胁

云安全中心企业版支持Linux Rootkit入侵威胁检测功能,帮助您及时发现资产是否被Rootkit入侵。背景信息 Rootkit泛指所有黑客在已入侵的服务器上,为了实现自身或其它恶意行为而隐藏的恶意程序。Rootkit往往采用与操作系统机制相关的底层...

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:4.19.91-21.al7.x86_64及之前的内核版本。系统宕机,且出现如下调用栈信息。[7674143.032169]...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

启用cgroup writeback功能

在Alibaba Cloud Linux 2(内核版本 4.19.36-12.al7 开始)和Alibaba Cloud Linux 3中,对内核接口cgroup v1新增了控制群组回写(cgroup writeback)功能。该功能使您在使用内核接口cgroup v1时,可以对缓存异步I/O(Buffered I/O)进行限速...

ListDoctorComputeSummary-批量获取集群资源使用结果

Analysis":{"HealthyJobCount":3,"SubHealthyJobCount":13,"UnhealthyJobCount":123,"NeedAttentionJobCount":23,"Score":56,"ScoreDayGrowthRatio":0.03 } }],"RequestId":"DD6B1B2A-5837-5237-ABE4-FF0C8944*","NextToken":"DD6B1B2A-...

ListDoctorApplications-批量获取任务分析结果

VcoreUtilization object CPU 使用率,同 Linux Top 的%CPU 含义。Name string 指标名称。vcoreUtilization Value float 指标值。23.1 Unit string 指标单位。Description string 指标描述。Ratio of used vcore to total available ...

Linux系统实例的宕机问题排查

Linux操作系统的ECS实例在运行过程中出现内核panic、内存溢出OOM(Out Of Memory)、蓝屏卡死等问题或收到系统事件通知实例出现操作系统崩溃时,说明该ECS实例发生宕机,您可以通过自助诊断工具或系统内核日志来定位问题并解决。...

GetDoctorApplication-获取单个任务分析结果

VcoreUtilization object CPU 使用率,同 Linux Top 的%CPU 含义。Name string 指标名称。vcoreUtilization Value float 指标值。32.1 Unit string 指标单位。“”Description string 指标描述。Ratio of used vcore to total available ...

SHELL

在本例中,先自定义了VARCHAR类型的参数DD,将参数值设置为 this is a test,然后在脚本声明了echo命令 echo"hello world,${DD}。当我们保存并运行任务后,在日志中会看到将 hello world,this is a test 信息打印出来。

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:4.19.91-21.al7.x86_64及之前的内核版本。系统宕机,且出现如下调用栈信息。[7674143.032169]...

捕获内核的内存污染问题(KFENCE)

功能介绍 KFENCE(Kernel Electric-Fence)是Linux内核内置的、可在线上环境开启的工具,用于捕获内核及内核模块的内存污染问题,在 上游Linux内核社区 的 5.12 版本中引入。KFENCE的目标是通过在内存边界附近插入特殊的标记(fence),来...

THP reclaim功能

背景信息 Linux操作系统的内存采用分页管理模式,其中的THP是指内核中2 MiB或1 GiB大小的大页面(普通的小页面大小为4 KiB),一般被称为透明大页。基于应用程序使用到的内存范围越来越大,地址转换产生的开销变得不可忽视。因此,当服务器...

更改主机操作系统

内存为512 MB的独享经济版云虚拟主机 由于云虚拟主机内存偏小,安装Windows操作系统后云虚拟主机无法正常运行,只能使用Linux操作系统。机房位置不在中国内地的独享云虚拟主机 例如,新加坡机房、美国机房、中国(香港)机房的独享增强版和...

ECS实例操作系统内部(GuestOS)常见问题与修复方案

检查大页内存设置是否过大 当实例的大页内存设置过大,可能会导致无法登录Linux实例,需要调整/etc/sysctl.conf 文件中大页内存的值。具体操作,请参见 调整Linux实例大页内存的方法。检查操作系统是否OOM 如果存在OOM问题,可能会导致无法...

无法连接Linux实例的排查方法

步骤四:检查CPU负载、带宽及内存使用情况 无法正常远程连接Linux实例时,可能是因为CPU负载、带宽不足或内存不足导致。根据是否存在CPU负载过高情况,选择相应操作。存在CPU负载过高情况。若应用程序有大量的磁盘访问、网络访问行为、高...

操作系统监控

监控指标名称 监控指标含义 单位 MetricName Dimensions Statistics 说明(仅用于Linux)(Agent)memory.total.space 内存总量。Byte memory_totalspace userId、instanceId Maximum、Minimum、Average 服务器的内存总量。proc/meminfo 的...

在离线混部概述

为了提高应用运行时性能和节点的稳定性,ack-koordinator结合Alibaba Cloud Linux提供了容器内存QoS保障的能力,根据Pod参数自动配置内存子系统(Memcg),为容器开启Memcg QoS、内存后台回收和全局最低水位线分级特性,可以保障容器的内存...

诊断项与诊断结果说明

实例操作系统内相关配置诊断(Linux):检查实例操作系统内的系统文件、关键进程、常用业务端口占用状态、防火墙状态等是否正常。实例操作系统内相关配置诊断(Windows):检查实例操作系统内的常用业务端口占用状态、防火墙状态等是否正常...

诊断指标与诊断结果条目说明

Instance.ResourceNotEnough 检查该实例所需要的CPU、内存等物理资源是否充足。Instance.ECSService.ResourceOutOfStock 在需要重新为实例分配资源时,例如从节省停机模式启动实例,如果因为库存不足使得物理资源不足,将导致实例无法启动...

设置Logtail启动参数

需要采集的日志文件数目大(同时采集的文件数超过100个或所监控的目录下的文件数超过5000个),占用大量内存。日志数据流量大(例如极简模式下超过2 MB/s,正则模式下超过1 MB/s),导致CPU占用率高。Logtail发送数据到日志服务的速率超过...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Memcache 版 云数据库 RDS 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用