一键诊断

A:RDS MySQL的计算公式如下:线程使用=活跃线程数/最大线程数 连接数使用=当前连接数/实例规格最大连接数 最大线程数=thread_pool_size*(thread_pool_oversubscribe+1)Q:为什么会出现线程使用超过100%的情况?A:按照线程使用的...

Alibaba Cloud Linux 2系统的ECS实例OverlayFS的...

0000000000000000[49.835792]DR3:0000000000000000 DR6:00000000fffe0ff0 DR7:0000000000000400 问题原因 OverlayFS的ovl_get_redirect在操作dentry的引用计数时没有添加锁,如果CPU上有其它任务同时操作dentry的引用计数会出现并发问题,...

Alibaba Cloud Linux 2系统的ECS实例OverlayFS的...

0000000000000000[49.835792]DR3:0000000000000000 DR6:00000000fffe0ff0 DR7:0000000000000400 问题原因 OverlayFS的ovl_get_redirect在操作dentry的引用计数时没有添加锁,如果CPU上有其它任务同时操作dentry的引用计数会出现并发问题,...

CoAP连接相关问题

如果发送到云端的数据不是JSON会出现什么错误?目前除了支持JSON格式外,也可以支持CBOR格式。设备与云端通信,需要使用指定格式,否则可能会出现无法解析的问题。调用IOT_CoAP_Init方法时,coap_malloc返回NULL,是什么原因引起的?请查看...

使用Java SDK访问表格存储时出现...

另外,当机器的负载较高、网络异常高、CPU使用高时,也会出现SocketTimeoutException错误,一般是请求可能还未发出就已超时。排查客户端与服务端的网络连通性。如果全部请求都出现SocketTimeoutException,则可能是网络不通,您可以...

常见问题概览

下载备份文件 性能、空间与内存 热点问题 其他常见问题 如何排查MongoDB实例负载过高的问题 MongoDB实例内存使用问题 MongoDB实例的CPU使用问题 MongoDB实例IOPS使用问题 MongoDB实例空间使用问题什么高可用系统触发...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

使用SDK调用API请求服务端时出现Wait future timeout...

另外,当机器的负载较高、网络异常高、CPU使用高时,也会出现Wait future timeout错误,一般是请求可能还未发出就已超时。确认客户端中是否在请求期间主动调用了 client.shutdown()方法导致callBack回调线程被关闭。登录 表格存储控制...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

在/var/log/messages日志中出现“INFO:task jbd2/vda1...

系统资源紧张:ECS实例中应用或进程占用系统资源使用(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考以下步骤进行排查。重启实例。系统无法正常运行时,您可以尝试重启实例,以...

Linux实例负载高问题排查和异常处理

内存使用过高,可能会出现系统卡顿、内部服务响应速度变慢等问题。I/O使用过高:一般来说,当前I/O读写≥该云盘I/O的80%时,定义为I/O使用过高。I/O使用过高,可能会出现文件读写变慢、应用性能下降或报错等问题问题排查 您可以...

进程监控

云监控采集CPU消耗Top5进程的CPU使用,可能存在以下问题:如果您的进程占用多个CPU,则会出现CPU使用超过100%的情况,因为采集结果为多核CPU的总使用。如果您查询的时间范围内,CPU消耗Top5的进程不固定,进程列表会显示该时间范围内...

CPU使用高排查方法

PolarDB PostgreSQL版 在使用过程中,可能会出现CPU使用异常升高甚至达到满载的情况。本文将介绍造成这种情况的常见原因和排查方法,以及对应的解决方案。问题原因 业务量上涨 当CPU使用上升时,最有可能的情况是业务量的上涨导致数据...

常见问题

答:对于GDB高可用版,当主节点出现故障时,GDB会快速切换到备节点。切换过程中会出现短时间的连接闪断(切换很快,主要为主节点故障诊断和确认时间),需要用户设置好程序的自动重连,避免因为切换导致服务不可用。问:图数据库GDB支持跨...

Quick BI中报表小功能部分正常显示,部分计算值为空

问题原因 用户使用的数据库中的排序与BI报表的默认排序不一致,导致出现部分数据取不到的现象,所有部分小显示为空。解决方案 1.对任意一个度量值,设置组内升序或组内降序。2.再开启分类汇总(列小)功能,选择小汇总维度字段。3....

云监控ECS的Windows主机CPU监控数值异常

这个问题主要出现在Windows的机器上,一般原因是Windows内部的性能计数器损坏了。可以通过 typeperf"\Processor(_Total)\%Processor Time"查看计数器是否正常。如果提示“错误:没有有效计数器”,则说明计数器已损坏,可通过 lodctr/r ...

MySQL实例IOPS使用高的原因和解决方法

问题描述 MySQL实例在日常使用中会出现实例IOPS使用高的情况,本文将介绍造成该状况的主要原因和解决方法。问题原因 实例内存满足不了缓存数据或排序等需要,导致产生大量的物理IO。查询执行效率低,扫描过多数据行。解决方案 您可以通过...

一键诊断

A:RDS MySQL的计算公式如下:线程使用=活跃线程数/最大线程数 连接数使用=当前连接数/实例规格最大连接数 最大线程数=thread_pool_size*(thread_pool_oversubscribe+1)Q:为什么会出现线程使用超过100%的情况?A:按照线程使用的...

一键诊断

A:RDS MySQL的计算公式如下:线程使用=活跃线程数/最大线程数 连接数使用=当前连接数/实例规格最大连接数 最大线程数=thread_pool_size*(thread_pool_oversubscribe+1)Q:为什么会出现线程使用超过100%的情况?A:按照线程使用的...

RDS SQL Server CPU使用问题排查

CPU使用高的因素有很多,其中最常见的因素说明及解决方法如下:实例的并行度设置不合理 排查步骤 线程并行处理任务时,由于每个线程处理的数据量不一致,会出现CXPACKET等待情况,CXPACKET等待发生比较多的话,就会造成CPU使用高。...

调优集群性能

0和Shard_1中数据量较大,而在存储节点1上的Shard_2和Shard_3中数据量较小,那么当您查询这个大表时,较大概率会出现存储节点0需要处理的数据多,存储节点1上需要处理的数据少的情况,这样就会导致存储节点0的CPU使用长期高于存储节点1的...

自动/手动主备切换

注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请务必确保应用具备重连机制;当只读节点开启了热备功能时,主备切换将在5~10秒内完成。关于如何开启只读节点的热备...

使用ACK Net Exporter定位网络问题

单击 Metric browser,然后输入 inspector,Grafana会自动补全ACK Net Exporter所有就绪的Metric,单击右上角 Save,在弹出框中单击 Save,然后会出现可视化的数据,效果如下:对于使用Grafana进行可视化图形显示的配置,可以参照上述的...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后自动...

主机健康诊断

文件系统读写检测 文件无法正常读写 您可以尝试在主机上创建文件,如果出现 No space left on device…的报错信息,一般是如下问题导致:磁盘分区空间使用过高。磁盘分区inode使用过高。存在僵尸文件(已删除文件因句柄被占用未释放,...

使用限制

故障切换 对于高可用系列、集群系列实例,当主节点出现故障时,RDS在30秒内切换到备节点(某些主备不一致等特殊场景可能切换时间较长)。切换过程中有30秒左右的连接闪断,需要您设置好程序的自动重连,避免因为切换导致服务不可用。切换...

PolarDB MySQL版CPU使用

此类问题一般可以通过开启集群的thread_pool特性进行流控缓解,具体请参见 Thread Pool。如果活跃线程有所缓解,同时还要注意应用侧是否已经产生了业务堆积,如果CPU负载较高同时活跃线程依然高居不下,此时则同样要考虑是不是对集群进行扩...

Windows系统的ECS实例ping外网地址提示“一般故障”...

然后重新ping外网地址,不再出现一般故障”错误时,表示该问题已解决。检查网卡配置信息 执行 ipconfig/all 或 route print 命令检查IP配置,查看路由配置是否存在问题。如果回显中显示了所有网卡信息,如下图所示,说明路由配置没有问题...

异常行为分析

上游行为计数统计,统计了曝光的计数,分桶分为10个桶,X轴为上游行为计数的均值,Y轴为出现次数。下游行为计数统计与上游行为计数统计一样。转化分析,把转化分为10个区间,展示了每个区间的数量。Top统计分析,是对上游行为、下游...

自动或手动主备切换

A:RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

操作系统监控

当磁盘未存满,但inode已经分配完时,会出现无法在磁盘新建文件的情况,因此需要监控inode使用。inode数量代表文件系统的文件数量,大量小文件会导致inode使用过高。网络相关监控指标 Windows 先调用Iphlpapi.dll中的...

Linux系统的ECS实例CPU使用或CPU负载较高问题的排查...

操作成功后,界面会出现类似 Send pid 23 signal[15/sigterm]的提示信息,按Enter键确认即可。常见CPU资源过高案例分析 案例一:CPU使用较低但负载较高 问题现象 当前Linux系统没有业务程序运行。通过top命令观察,发现CPU使用不高,...

样式配置

说明 列数过多时使用该功能可能导致性能问题。区块样式 说明 区块样式的配置,能保证一直跟随数据集取数生效,不会因为字段调整或筛选条件变更丢失样式配置。为提升电子表格报表区块样式配置的效率,支持批量配置区块样式,同时支持多...

异地双活切流

选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回 ...

云解析DNS如何实现故障切换

全局流量管理支持IP地址健康检查功能,并根据健康检查的结果,来判断运营商IP地址是否出现故障,如果出现故障,则将域名解析切换到备份的运营商IP上,并最终帮用户实现自动故障转移的功效。请参阅 GTM实现跨网访问加速与故障切换 操作...

关键缺陷通知

2024年缺陷 2024年04月 等级 报错/问题描述 缺陷原因 出现/修复版本 规避建议 P2 Hologres实例升级至V2.1.26版本后,监控指标显示实例内存分布使用中的Query内存缓慢上涨。升级至V2.1.26版本,当Query出现OOM问题后,内存指标被重复...

常见问题

本章节汇总了使用ARMS告警管理监控的常见问题。本页目录 ARMS Prometheus监控新旧版本告警规则有何不同?指定了新的通知策略,仍然收到了旧的告警通知?为什么配置了告警规则的通知策略,告警还是发给我了?为什么通知策略中出现了标签为_...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 短信服务 负载均衡 弹性公网IP 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用