INSTALL_FAILED_NO_MATCHING_ABIS

问题分析 当安装的App包含native libraries(一般是so文件)的时候,如果没有对应机器CPU架构的库文件,就会出现这种问题。比如,开发者编译了一个armv7平台的App,但是想要装在intel架构的设备上,就会出现这个错误。解决方案 安装的App...

ack-koordinator(ack-slo-manager)

类型 功能文档 与Koordinator开源版本一致 CPU调度 CPU拓扑感知调度 否 CPU Burst性能优化策略 是 负载感知调度 负载感知调度 是 热点打散重调度 是 精细化调度 资源画像 否 动态资源超卖 是 弹性资源限制 是 容器CPU QoS 是 容器内存QoS ...

进程监控

云监控采集CPU消耗Top5进程的CPU使用率,可能存在以下问题:如果您的进程占用多个CPU,则会出现CPU使用率超过100%的情况,因为采集结果为多核CPU的总使用率。如果您查询的时间范围内,CPU消耗Top5的进程不固定,进程列表会显示该时间范围内...

集群巡检项及解决方案

Ingress就绪Pod百分比 异常影响:检查Ingress Deployment已就绪的Pod百分比,小于100表明Ingress Pod可能出现问题,无法正常启动或健康检查失败。解决方案:通过Pod诊断或Ingress异常排查文档查找问题Pod。关于异常问题排查,请参见 Nginx ...

测试指标

如果系统不能稳定的运行,上线后,随着业务量的增长和长时间运行,将会出现性能下降甚至崩溃的风险。标准 TPS曲线稳定,没有大幅度的波动。各项资源指标没有泄露或异常情况。批量处理指标 定义及解释 指批量处理程序单位时间内处理的数据...

云原生AI套件管理员运维指南

控制台:选择部署PAI轻量化控制台或云原生AI套件自带的控制台,选中 控制台 后,会出现 提示 对话框,关于配置详情,请参见 安装配置云原生AI控制台 和 部署PAI轻量化控制台。工作流 选中 Kubeflow Pipelines 后,您可以选择 工作流数据...

处理挖矿程序最佳实践

背景信息 挖矿程序的特征 挖矿程序占用CPU进行超频运算,导致CPU严重损耗,并且影响服务器上的其他应用。挖矿程序还具备蠕虫化特点,当安全边界被突破时,挖矿病毒向内网渗透,并在被入侵的服务器上持久化驻留,以获取最大收益。挖矿...

常见问题

本文汇总了YARN使用时的常见问题。集群问题汇总 集群有状态重启包括哪些内容?如何启用RM HA?如何检查ResourceManager服务是否正常?如何了解应用运行状况?应用问题排查流程 单任务/容器(Container)最大可用资源由哪些配置项决定?资源...

什么是AI分布式训练通信优化库AIACC-ACSpeed

AIACC_CPU_BINDING_ENABLE=1 如果程序本身存在问题,例如负载不均衡导致性能波动,开启CPU-Affinity功能后可能会出现性能损失,所以该特性作为优化选项进行使用。Bucket-Tuning:ACSpeed默认开启Bucket-Tuning,可以对梯度的融合进行自适应...

调优集群性能

存储节点0上的Shard_0和Shard_1中数据量较大,而在存储节点1上的Shard_2和Shard_3中数据量较小,那么当您查询这个大表时,较大概率会出现存储节点0需要处理的数据多,存储节点1上需要处理的数据少的情况,这样就会导致存储节点0的CPU使用率...

如何解决备份客户端OOM问题

背景信息 使用 云备份 备份数据时,在极端大数据量以及系统资源不足的备份场景,备份客户端会占用较多的系统资源,可能会出现OOM问题,即备份进程触发OOM被系统终止而导致备份失败。重要 当遇到OOM问题时,您可以根据实际情况为备份客户端...

RDS SQL Server CPU使用率高问题排查

CPU使用率高的因素有很多,其中最常见的因素说明及解决方法如下:实例的并行度设置不合理 排查步骤 线程并行处理任务时,由于每个线程处理的数据量不一致,会出现CXPACKET等待情况,CXPACKET等待发生比较多的话,就会造成CPU使用率高。...

如何避免因cgroup引起的应用性能抖动?

问题现象 在容器相关的业务场景下,系统中的应用偶然会出现请求延时增大,并且容器所属宿主机的CPU使用率中,sys指标(内核空间占用CPU的百分比)达到30%及以上。例如,通过 top 命令查看Linux系统性能数据时,CPU的sy指标达到30%。top-16:...

常见问题

perf_event_open被限制导致的No access to perf events报错问题 问题现象 Async-Profiler进行CPU Profiler依赖perf_event_open的系统调用,但因为Linux kernel的Syscall安全策略(seccomp)控制,可能禁止进程调用特定Syscall。...

PolarDB MySQL版CPU使用率高

比较常见的问题会出现内存使用争抢。在MySQL体系中,内存主要作为数据缓存使用,也就意味着数据需要不断的迭代,最常用是 buffer pool 和 innodb_adaptive_hash_index 内存区域。整个数据库系统的缓存区域,是数据交换最为频繁的位置,如果...

弹性加速计算实例FAQ

EAIS因为网络问题出现较大的延迟吗?我们选用了Resnet50、Inception4以及Bert模型进行了多次测试,相比常规的GPU实例几乎无延迟。为什么选择EAIS?与常规的异构实例相比,EAIS提供的异构实例具有解耦性、低成本、弹性和多适配性的优势。...

通过自治服务解决MySQL实例CPU使用率过高的问题

问题描述 在使用云数据库RDS MySQL的过程中,经常CPU使用率过高而导致的系统异常,例如响应变慢、无法获取连接和出现报错等。问题原因 在CPU使用率过高的场景中,有95%以上的问题都是由异常SQL所致。当业务提交的SQL语句不够优化时,就...

Linux系统CPU使用率和负载高排查方法

操作成功后,界面会出现类似 Send pid 23 signal[15/sigterm]的提示信息,按Enter键确认即可。常见CPU资源过高案例分析 案例一:CPU使用率较低但负载较高 问题现象 当前Linux系统没有业务程序运行。通过top命令观察,发现CPU使用率不高,...

Linux系统的ECS实例CPU使用率或CPU负载较高问题的排查...

操作成功后,界面会出现类似 Send pid 23 signal[15/sigterm]的提示信息,按Enter键确认即可。常见CPU资源过高案例分析 案例一:CPU使用率较低但负载较高 问题现象 当前Linux系统没有业务程序运行。通过top命令观察,发现CPU使用率不高,...

Dataphin中周期任务在运行时为何会出现等待资源问题

问题描述 夜间周期性任务出现高并发时,运行过程中有些任务会出现等待资源问题,原本只需要几十秒的任务,有时需要20多分钟,为什么会出现这种情况?是否有改善的方案?问题原因 任务会出现等待资源问题是由于mesos资源分配不足导致的。...

节点异常问题排查

问题现象 当集群中的节点调度资源不足时,导致Pod调度失败,出现以下常见错误信息:集群CPU资源不足:0/2 nodes are available:2 Insufficient cpu 集群内存资源不足:0/2 nodes are available:2 Insufficient memory 集群临时存储不足:...

节点异常问题排查

问题现象 当集群中的节点调度资源不足时,导致Pod调度失败,出现以下常见错误信息:集群CPU资源不足:0/2 nodes are available:2 Insufficient cpu 集群内存资源不足:0/2 nodes are available:2 Insufficient memory 集群临时存储不足:...

DAS Auto Scaling弹性能力

然而随着用户业务的变化,在09:00时CPU再一次打高出现资源紧张的情况,此时的流量分析发现以写流量为主,DAS Auto Scaling算法判断通过提升计算资源规格缓解CPU资源,且实例的CPU利用率下降到50%,解决了第二次CPU紧张的问题。从这个实例的...

如何使用Linux系统的atop监控工具

当ECS实例出现问题后,您可以获取相应的atop日志文件进行分析。本文介绍如何在Linux实例中 安装、配置并使用atop监控工具。安装atop Alibaba Cloud Linux操作系统 本步骤以Alibaba Cloud Linux 3.2104 LTS 64位操作系统的ECS实例为例,介绍...

CPU使用率高排查方法

PolarDB PostgreSQL版 在使用过程中,可能会出现CPU使用率异常升高甚至达到满载的情况。本文将介绍造成这种情况的常见原因和排查方法,以及对应的解决方案。问题原因 业务量上涨 当CPU使用率上升时,最有可能的情况是业务量的上涨导致数据...

云监控

如果CPU水位持续到达100%一段时间,随后降低维持在中等或较低水平,那么一般是那段时间在做大的计算,例如大规模数据的写入,或者大规模数据的查询,因此不建议出现一次CPU使用率达到100%就告警,这样可能产生较多误报。建议设置为“CPU...

网站耗资源(客户程序故障)常见问题

网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能会出现问题。网站访问量过大或者流量过大导致内存耗尽。网站耗资源(客户程序故障)的处理方法是什么?为了保证您的站点能够安全、稳定地运行,阿里云的...

V5.1.x系列实例版本说明

解决DISTINCT在部分跨库JOIN场景下会出现报错的问题。修复分库分表情况下聚合函数查询带LIMIT时返回结果不正确的问题。解决BigDecimal类型在类型转换过程会消耗大量CPU问题。修复SHOW FULL STATS连接数不准确的问题。修复SHOW FULL STATS...

RDS SQL Server CPU使用率高问题

说明 共享型 实例复用CPU,因此即使实例本身的CPU使用率不高,也可能因为复用CPU导致性能出现瓶颈,如果对数据库性能的稳定性要求较高,建议使用独享型规格的实例。分析性能指标 原因 对于突发的CPU使用率明显增高情况,常见原因有如下...

RDS MySQL/MariaDB版实例CPU使用率较高

问题描述 阿里云云数据库RDS MySQL/MariaDB版使用过程中,出现CPU使用率过高甚至达到100%的情况。问题原因 应用提交查询操作或数据修改操作时,系统需要执行大量的逻辑读操作,其中逻辑IO包含执行查询所需访问表的数据行数。所以系统需要...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

CPU瓶颈

CPU等待事件持续较多,出现CPU瓶颈,需进行具体查询分析。可观察 polar_stat_activity_rt 中哪类进程CPU比较高,数值单位是CPU使用率。SELECT backend_type,SUM(cpu_sys cpu_user)AS cpu_rate FROM polar_stat_activity_rt GROUP BY ...

漏洞公告|Intel CPU CVE-2023-23583 漏洞

Intel于近期披露了芯片相关的潜在安全风险问题CPU Redundant Prefix Issue,漏洞编号为 CVE-2023-23583。为确保客户业务的稳定性以及数据的安全性,阿里云已启动安全应急响应工作,相关进展同步如下:漏洞信息 漏洞编号:CVE-2023-23583 ...

为什么CPU负载高?

Java随着程序的运行把字节码编译为机器码,这时候叠加正常的流量处理,就表现为启动时CPU使用率高/负载高,但启动阶段结束后便下降。请确认您所使用的语言是否有该特性,如果是该原因,则是正常现象,建议您多预留一部分缓冲(Buffer...

ARMS告警精细管理最佳实践

告警对象 指明出现问题的组件或设备,例如服务器、数据库等。监控指标 指示监控的具体指标,例如CPU使用率、内存使用率、网络流量等。阈值 用于设定触发告警的阈值,例如CPU使用率超过80%、内存使用率超过90%,超过这个阈值就触发告警。...

使用负载均衡SLB后出现500、502和504状态码

请确认是所有客户端访问出现问题,还是部分客户端有问题。如果仅是部分客户端问题,排查该客户端是否被云盾阻挡,负载均衡域名或者IP是否被ISP运营商拦截。查看500、502和504状态码页面,判断是负载均衡问题、高防配置问题还是后端ECS配置...

ECS实例操作系统内部(GuestOS)常见问题与修复方案

性能问题 CPU使用率是否过高 如果CPU持续保持高使用率,则对系统稳定性和业务运行造成影响。具体操作,请参见 Windows实例中CPU使用率较高问题的排查及解决方法。检查Windows操作系统的版本 微软已经于2020年01月14日停止对Windows ...

变更配置

警告 根据变更项不同,切换过程中可能会出现业务闪断或实例重启,而且与数据库、账号、网络等相关的大部分操作都无法执行,请选择在 可维护时间段 内执行变配操作。变更项 说明 业务影响 系列 支持 PostgreSQL基础系列升级高可用系列。...

RPC

MOSN 升级方案 容器替换方案完成后,我们要面临第三个问题:由于是大规模的容器,所以 MOSN 在开发过程中,势必存在一些问题,MOSN 出现问题,如何升级?线上几十万容器升级一个组件的难度是很大的,因此,在版本初期就需考虑到 MOSN 的...

自动性能扩展

影响 对于 RDS MySQL 高可用系列云盘版和 PolarDB MySQL版 的集群版实例,在变更配置生效期间,可能会出现一次约30秒的闪断,请确保应用具有重连机制。对于 PolarDB MySQL版 的集群版实例,只能对整个集群进行规格升降级,无法对集群中的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用