容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。基于专家经验和AI智能诊断两种诊断模式,节点诊断可以深入定位问题根因。节点诊断包括诊断检查项和诊断根因。诊断检查项:包括Node检查、...
节点网络 单一边缘节点到同一运营商的同省或邻省监测节点的平均ping丢包率⩽1%,新疆和西藏地区另行约定。节点资源 边缘节点存储支持本地盘和高效云盘,不同节点存在差异。本地盘来自单台宿主机,数据可靠性取决于宿主机的可靠性,存在单点...
容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...
检查类型 预警风险 资源配额 ResourceQuotas VPC内SLB配额紧张 SLB后端服务器配额紧张 SLB可监听数配额紧张 SLB实例数配额检查 资源水位 ResourceLevel SLB带宽使用率过高 SLB最大连接数过高 SLB新建连接速率过高 SLB QPS过高 集群Pod网段...
检查类型 预警风险 资源配额 ResourceQuotas VPC内SLB配额紧张 SLB后端服务器配额紧张 SLB可监听数配额紧张 SLB实例数配额检查 资源水位 ResourceLevel SLB带宽使用率过高 SLB最大连接数过高 SLB新建连接速率过高 SLB QPS过高 集群Pod网段...
检查类型 预警风险 资源配额 ResourceQuotas VPC内SLB配额紧张 SLB后端服务器配额紧张 SLB可监听数配额紧张 SLB实例数配额检查 资源水位 ResourceLevel SLB带宽使用率过高 SLB最大连接数过高 SLB新建连接速率过高 SLB QPS过高 集群Pod网段...
云数据库MongoDB实例的空间使⽤率是⼀个⾮常重要的监控指标。如果MongoDB实例的空间被完全使用,将会导致实例不可⽤。本文介绍查看MongoDB实例空间使用情况的方法,以及各种空间使用情况的原因和优化策略。背景信息 实例空间使用率达到80%~...
PolarDB 新增支持连接保持功能,避免由于一些运维操作(如升级配置、主备切换或升级小版本等)或非运维操作故障(如节点所在服务器故障)导致的连接闪断或新建连接短暂失败的问题,进一步提高 PolarDB 的高可用性。前提条件 PolarDB 数据库...
常见的容错策略如下:使用率预警:定期监控计算节点的磁盘空间使用情况,并设置告警机制。当磁盘空间即将满时,系统可以发送警报通知运维人员,以便及时处理。定期清理归档:对于不再需要或冗余的数据,及时进行清理和归档。可以通过定期...
高可用 支持双机房容灾架构,组件多实例运行,数据库多副本同步,并提供自监控、故障自动恢复等能力。开放自主 所有组件皆为自研可控,并经过大规模生产验证;提供完善的产品功能和数据的 OpenAPI,更好的和第三方系统集成对接。
verifyScore阈值说明 千分之一误识率 万分之五误识率 万分之一误识率 十万分之五误识率 十万分之一误识率 70 71.5 75 76.5 80 说明 如果您有个性化需求,您可以根据业务情况,参考返回的比对分和阈值,自定义认证结果。
取值:UNQUALIFIED:照片质量较差 LOW:低 NORMAL:一般 HIGH:高 IdCardInfo Struct 身份证信息的OCR结果。说明 认证过程中如果没有身份证正面和反面信息,实人认证服务则不会返回身份证的OCR结果。认证过程中如果有身份证正面和反面信息...
取值:UNQUALIFIED:照片质量较差 LOW:低 NORMAL:一般 HIGH:高 IdCardInfo Struct 身份证信息的OCR结果。说明 认证过程中如果没有身份证正面和反面信息,实人认证服务则不会返回身份证的OCR结果。认证过程中如果有身份证正面和反面信息...
取值:UNQUALIFIED:照片质量较差 LOW:低 NORMAL:一般 HIGH:高 IdCardInfo Struct 身份证信息的OCR结果。说明 认证过程中如果没有身份证正面和身份证反面,则不会返回身份证信息的OCR结果。认证过程中如果有身份证正面和身份证反面,也...
割接上线前的准备 应用的割接上线是整个应用上云迁移实施的最关键环节,这一环节出问题,可能会造成重大故障。针对割接上线的重要性,我们建议在实施应用割接前,制定详细的割接前检查清单,这个清单的严谨程度很大程度上决定了割接成功率...
高资源利用率,容灾集群可提供读写服务。全球本地化访问,提升业务性能。为什么选择PolarDB MySQL企业版 您可以像使用MySQL一样使用 PolarDB MySQL版。此外,PolarDB MySQL版 还有传统数据库不具备的优势:高性价比 硬件压缩盘(Smart-SSD...
高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。
Redis CPU使用率升高可能是由于以下三种原因:高并发、高吞吐的业务消耗较多CPU资源,如果CPU资源未达到瓶颈,属于正常业务场景;业务运行超预期,Redis实例的CPU资源无法满足业务需求,可通过增加分片数、副本数或者升级为企业版来解决...
不用人工再去摸索自己安装配置软件,开箱即用 无影使用瘦终端,可靠性高,连接显示器即可使用,故障率大幅降低 未来门店终端秒级升级,配置永不过时,减少资产重复投资 无影灵活按量付费,门店开关资源回收便利,大幅减少库管,流转,资产...
本文介绍无影零售行业解决方案的最佳实践。场景介绍 随着电商兴起...不用业务人员再去摸索自己安装配置软件,开箱即用 无影使用瘦终端,可靠性高,连接显示器即可使用,故障率大幅降低 未来门店终端支持秒级升级,配置永不过时,减少重复投资
问题原因 上述问题是由于磁盘使用率过高导致的。数据节点的磁盘使用率存在以下三个水位线,超过水位线可能会影响阿里云Elasticsearch或Kibana服务:超过85%,会导致新的分片无法分配。超过90%,阿里云Elasticsearch会尝试将对应节点中的分...
源版本升级失败率排行 失败原因分布 条形图 按照失败原因分布占比从高到低排列展示。失败原因包括:升级超时、版本错误、进度错误 和 升级冲突。设备OTA升级失败的原因和解决建议,请参见 设备OTA升级失败相关问题。操作步骤 登录 物联网...
当实例CPU利用率持续较高时,很容易导致数据库访问响应慢。本文介绍如何定位CPU利用率高的原因以及如何解决这些问题。查看CPU利用率 对于RDS PostgreSQL实例来说,CPU利用率持续高于80%,通常表明系统处于高负载的情况,并且很可能存在较...
问题描述 阿里云云数据库RDS MySQL/MariaDB版使用过程中,出现CPU使用率过高甚至达到100%的情况。问题原因 应用提交查询操作或数据修改操作时,系统需要执行大量的逻辑读操作,其中逻辑IO包含执行查询所需访问表的数据行数。所以系统需要...
CPU使用率倾斜严重(例如1倍以上),会较大地影响集群运行的稳定性,并且会导致资源浪费,因为分布式的查询子任务受到了CPU最大使用率的限制,而无法进一步的提升性能,只能升配解决,但是其他节点的CPU使用率并不高。导致CPU使用率倾斜...
CPU相关概念 概念 说明 CPU使用率 CPU使用率指的是CPU执行工作的时间比例,包含了所有符合条件的活动的时钟周期,比如停滞等待IO而导致较高的使用率,CPU使用率被分为内核时间和用户时间。用户时间 执行用户态程序的时间被称为用户时间。...
A:造成主节点(主库)负载高的原因有直连主地址、主库接受读请求、存在大量的事务请求、主从复制延迟高导致请求被路由到主库、只读节点异常导致读请求被路由到主库等。而主节点负载较低的原因可能是主库开启了不接受读选项。Q:怎么降低主...
问题描述 在阿里云云数据库OceanBase性能监控页面,节点和租户CPU使用率都比较高,且触发“OB节点CPU使用率”和“租户CPU负载告警”告警。问题原因 导致CPU使用率高的常见原因包括:业务产生了大查询或热点数据。集群的资源规划比实际偏小...
问题描述 问题ECS实例为CentOS7操作系统,其中某个CPU的SI状态占用率过高,如下图所示。问题原因 该ECS实例,中断只在某个core处理,如何设置irq和affinity都无效,只会在一个CPU上处理。解决方案 执行如下命令,开启irqbalance服务,让...
问题描述 在您使用ECS实例过程中,可能会遇到实例系统负载较高的情况,负载过高,可能会引发一系列异常问题,简单说明如下:CPU使用率或负载过高:一般来说,当CPU使用率≥80%时,定义为CPU使用率过高。CPU使用率持续过高,可能会导致实例...
故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障。对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...
问题描述 连接数满会导致客户端无法连接到RDS MySQL数据库。问题原因 空闲连接过多。活动连接过多。解决方案 说明 如果对实例或数据有修改、变更等风险...IOPS使用率高导致活动连接数堆积,请参见 MySQL实例IOPS使用率高的原因和解决方法。
若您需要更高的分辨率(如4K)云桌面,建议购买带显卡的GPU镜像,同时登录客户端的本地设备也支持相应的分辨率,不支持非GPU镜像和GPU镜像互换。缩放设置 如果桌面应用或文本的显示比较模糊或者不满足您的预期,您可以通过 缩放设置 更改云...
成功添加加速域名后,建议您进行缓存过期时间、带宽封顶、页面优化等功能的配置,可有效提升CDN的缓存命中率、安全性和访问性能。提高缓存命中率与访问速度 访问速度慢通常与缓存命中率低有强关联性,推荐您配置缓存过期时间、过滤参数功能...
CPU使用率倾斜检测 检测不同Executor节点间CPU使用率是否均衡,若所有Executor节点的最高CPU使用率比其平均CPU使用率高出1倍,且持续时间超过指定时间段的百分之八十,则认为Executor节点间的CPU使用率存在倾斜,建议您持续关注并排查是否...
高可用 多可用区部署,故障自动检测及恢复,SLA保障率高达99.95%。需自行探索和开发高可用保障体系,对团队技术要求高。性能 深度优化,TPS性能提升40%、QPS性能提升55%。需自行调优。监控告警 可对集群状态、服务数、配置数、TPS、请求...
本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...
包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...
Nacos Full Gc时间过长 一分钟内集群Full Gc时间超过5s 基础版、开发版、专业版、Serverless Nacos服务使用率过高 服务数使用率超过90%Nacos服务提供者使用率过高 服务提供者数使用率超过90%Nacos连接数使用率过高 连接数使用率超过90%...
本文介绍SAG-1000设备发生设备和交换机之间链路故障的原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...