Linux实例存在OOM问题的处理方法

信息点 获取途径 备注 OOM发生的时间和频率 Linux系统日志 您的业务应用日志 Linux系统日志路径如下:/var/log/message Linux实例的系统负载情况 云监控 负载查询工具 推荐使用云监控查询您的ECS实例负载信息。如果您没有使用云监控产品,...

客户端问题排查

Linux系统 检查结果log的压缩包在/root/miniconda2/aegis_checker/output 目录下。Windows系统 检查结果log的压缩包在当前目录的./miniconda2/aegis_checker/output 目录下。检查结果的log中,以[root cause]为前缀的就是aegis_checker检测...

内核热补丁FAQ

Alibaba Cloud Linux系统的CVE-2021-33909安全漏洞内核热补丁修复方案 Alibaba Cloud Linux 2系统的CVE-2021-22555安全漏洞内核热补丁修复方案 Alibaba Cloud Linux 2系统的ECS实例中Page Fault异常导致系统宕机 Alibaba Cloud Linux 2系统...

CreateIntegration-创建告警集成

云监控集成 IntegrationProductType string 是 集成产品类型:CLOUD_MONITOR:云监控 LOG_SERVICE:日志服务 CLOUD_MONITOR Description string 否 集成描述信息。测试 AutoRecover boolean 否 告警事件是否自动恢复:true(默认)false ...

Alibaba Cloud Linux常见问题

已知性能问题 开启内核选项CONFIG_PARAVIRT_SPINLOCK可能导致性能问题 NFS v4.x版本中可能存在的已知问题 Alibaba Cloud Linux系统中与透明大页THP相关的性能调优方法 Alibaba Cloud Linux 3系统关闭CPU漏洞修复的方法 使用问题 Alibaba ...

Alibaba Cloud Linux常见问题

Alibaba Cloud Linux系统的Overlayfs文件系统缺乏读权限导致操作失败,如何处理?Alibaba Cloud Linux 2 如何解决Alibaba Cloud Linux 2中polkit内存泄露问题?Alibaba Cloud Linux 2系统中systemd服务异常问题说明 如何避免因cgroup引起的...

Alibaba Cloud Linux系统的Overlayfs文件系统缺乏读...

问题描述 在Alibaba Cloud Linux系统的Overlayfs文件系统中使用只写方式打开或者在对应目录下touch文件触发copy up时报错。此时建议您继续运行以下命令判断系统存在的问题:mkdir-p/root/test/lower/dir/root/test/upper/root/test/work/...

导入历史日志文件

前提条件 已在服务器上安装0.16.15(Linux系统)或1.0.0.1(Windows系统)及以上版本的Logtail。具体操作,请参见 安装Logtail(Linux系统)或 安装Logtail(Windows系统)。已创建Logtail配置并应用到机器组。具体操作,请参见 文本日志...

Alibaba Cloud Linux 2系统中TCP拥塞控制算法BBR对...

TCP协议内部的封装方式依赖于Linux系统的高精度计时器(hrtimer),每个连接的高精度计时器会额外增加CPU消耗。在CPU使用率和网络PPS均高的情况下,BBR算法对网络性能的影响更加明显。在CPU空闲并且网络PPS低的情况下,影响不大。解决方案 ...

跨目录配额创建硬链接

背景信息 Linux系统支持三种模式的磁盘配额,分别为:user quota、group quota以及project quota。前两种是针对用户和组的,最后的project quota提供一种更细粒度的磁盘配额,细化到文件系统的目录和文件,使用project id将不同的目录和...

Linux内存碎片化的应对措施

Linux系统长时间运行会出现内存碎片化的问题,本文主要提供了应对该问题的一些措施。问题现象 实例内部署的业务偶然出现响应时间过长或者系统调用时间过长,系统的 sys 指标也会相应的增高,伙伴系统会缺少高阶内存(order 大于3的内存)。...

Alibaba Cloud Linux 2系统的ECS实例执行ss命令时返回...

Linux系统中,该字段实际输出该listening socket全连接队列的最大容量,所以其值不应该为0。Send-Q Established:The count of bytes not acknowledged by the remote host.Listening:Since Kernel 2.6.18 this column contains the ...

快速构建主机监控能力

您可以从 操作系统监控、基础监控、GPU监控、进程监控、网络监控 和 云盘 监控维度查看ECS实例的监看数据。说明 您还可以通过Dashboard可视化查看ECS实例的监控数据。具体操作,请参见 查看云产品监控大盘。步骤三:开启一键报警 ECS实例...

监控与日志

监控站点资源 监控服务器级别资源 Linux操作系统独享云虚拟主机 除了监控站点资源的使用情况,包括站点运行情况,流量使用情况、网页空间使用情况、数据库空间使用情况外,还支持监控服务器级别的资源,包括CPU、内存和带宽等监控信息,...

代码大页

代码大页(Huge Pages)是基于透明大页THP(Transparent Huge Pages)进行的优化扩展,支持将应用程序和动态链接库的可执行部分放入到大页(通常是2 MB或更大...更多信息,请参见 Alibaba Cloud Linux系统中与透明大页THP相关的性能调优方法。

消费-搭建监控系统

监控系统架构 如何搭建监控系统 收集监控数据 配置SLS的日志收集,确保日志收集到了日志服务。中间件使用API消费数据 通过SDK的PullLog接口从日志服务批量消费日志数据,并且把数据同步到下游实时计算系统。搭建storm实时计算系统 选择...

如何排查slab_unreclaimable内存占用高的原因?

本文介绍如何排查Alibaba Cloud Linux系统slab_unreclaimable内存占用高的原因。问题现象 在Linux实例内运行 cat/proc/meminfo|grep"SUnreclaim"命令查看SUnreclaim参数指标时,发现内存较大(例如 SUnreclaim:6069340 kB),当该内存超过...

2022年

新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用观测Windows。请参见 开服地域。2022年09月 功能名称 功能概述 支持地域 云服务集成中心全面改版 推出全新云服务...

在本地虚拟机使用Alibaba Cloud Linux镜像

seed.img镜像只包含cloud-init启动所需的配置文件,不包含Alibaba Cloud Linux系统文件。您可以通过以下两种方式生成seed.img镜像。方式一:直接下载seed.img镜像 Alibaba Cloud Linux 3和Alibaba Cloud Linux 2预先提供了seed.img镜像文件...

Alibaba Cloud Linux系统中与透明大页THP相关的性能...

本文主要介绍在Alibaba Cloud Linux系统中如何通过透明大页THP功能来提升系统的性能。THP 相关配置说明 在Alibaba Cloud Linux 2的 4.19.81-17.2 及更早的内核版本中,透明大页THP默认配置为 madvise,即限定开启透明大页THP的功能。这一...

如何重启云监控C++版本插件?

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。Windows 以...

ARMS统一告警管理最佳实践

本文介绍告警统一管理的最佳实践,以帮助企业更好地处理异构监控系统所带来的挑战和问题。背景信息 在云原生时代,企业IT基础设施的规模越来越大,越来越多的系统和服务被部署在云环境中。为了监控这些复杂的IT环境,企业通常会选择使用...

Alibaba Cloud Linux 2系统的ECS实例中Page Fault异常...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:kernel-4.19.91-23.al7及之前的内核版本。系统宕机,且出现如下调用栈信息。[332.057218]watchdog...

2022年

v2.8.7 Prometheus监控 新增Windows Exporter监控 收集CPU、内存、磁盘、网络进程等指标,提供全面的Windows系统监控。更多信息,请参见 如何使用Prometheus监控Windows。请参见 可观测监控 Prometheus 版目前支持的地域。v2.8.7 云拨测 ...

前端监控场景

主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。业务痛点 定位性能瓶颈困难 当用户反馈页面...

Block IO限流增强监控接口

为了更方便地监控Linux block IO限流,Alibaba Cloud Linux 2(内核版本 4.19.81-17.al7 开始)和Alibaba Cloud Linux 3增加相关接口,用于增强block IO限流的监控统计能力。本文主要介绍新增接口及使用示例。背景信息 很多场景中您会用到...

使用API查询监控数据

大型企业内部通常有自建的运维监控系统,上云过程中会面临如何将云资源监控数据与已有系统集成的问题。下面本文将为您介绍如何通过云监控接口查询各产品监控数据,从而将阿里云的监控数据与现有系统进行集成。指标类监控数据查询的接口 云...

Java应用监控和诊断方案

基于ARMS的应用监控方案 ARMS提供的 应用监控 功能,脱胎于阿里巴巴内部的分布式跟踪与监控系统(内部称为“鹰眼系统”),可以在不修改任何现有代码的情况下帮助网站开发人员和运维人员解决上述问题。调用拓扑图 您可以在ARMS中看到应用的...

什么是ARMS前端监控

现有的服务器端监控系统相对已经很成熟,而页面加载和页面运行时的状态监控一直比较欠缺。例如:无法第一时间获知用户访问您的站点时遇到的错误。各个国家、各个地区的用户访问您的站点的真实速度未知。每个应用内有大量的异步数据调用,而...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

本文为您介绍容器集群可观测现状、多云容器集群可观测挑战、以及应对这些挑战可选的实现方案,并且以具体多云容器集群场景案例为您介绍如何使用阿里云 可观测监控 Prometheus 版 和阿里云注册集群的结合实现多云容器集群的纳管监控。...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

本文为您介绍容器集群可观测现状、多云容器集群可观测挑战、以及应对这些挑战可选的实现方案,并且以具体多云容器集群场景案例为您介绍如何使用阿里云 可观测监控 Prometheus 版 和阿里云注册集群的结合实现多云容器集群的纳管监控。...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

接入指南

Nebula 如何使用Prometheus监控Nebula TiDB 如何使用Prometheus监控TiDB SNMP 如何使用Prometheus监控SNMP CoreDNS监控 CoreDNS性能监控组件接入 托管版CoreDNS监控 使用Terraform管理Prometheus实例的集成中心 Ingress性能监控 Ingress...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

数据质量风险监控

数据质量风险监控主要针对数据的准确性、一致性和完整性。本教程使用DataWorks数据质量(DQC)功能,完成数仓各层次的数据质量监控。前提条件 首先您需要完成教程 搭建互联网在线运营分析平台,并保证您的DataWorks工作空间创建区域为华东2...

Linux系统木马查杀

本文档介绍了Linux系统查杀木马的最佳实践。背景信息 系统安全存在漏洞或未采取足够的安全加固措施时,Linux系统可能会被植入木马程序。及时清理木马程序后,还需提高安全意识,从安全补丁加固、系统权限加固、操作审计、日志分析等多维度...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 应用实时监控服务 视图计算 云数据库 RDS 轻量应用服务器 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用