设备级高可用

在购买智能接入网关设备时,您可以选择购买两台设备,两台设备绑定到同一实例中,互为备份,在一台设备发生故障时进行设备切换,保障业务不中断。通过本文您可以在智能接入网关控制台查看设备级备份信息。前提条件 您购买的智能接入网关...

什么是设备诊断

设备诊断是阿里云物联网平台针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。服务架构 服务优势 丰富的数据诊断指标 提供网络连接成功率、设备离线原因、云对接次数等丰富的...

查看运行分析

该指标协助您进行作业诊断,排查作业Task级别的故障原因。个 TM自JVM启动以来已加载的类总数(TM ClassLoader)TM自JVM启动以来已加载的类总数。JM所在的JVM创建后加载类的总数或卸载类的总数过大,会导致占用过大内存空间,从而影响作业...

自治服务(CloudDBA)

您可以通过该功能排查Redis数据库的故障和性能降低的原因。开启自动扩容 当内存平均使用率达到阈值后会自动升级Redis实例的规格,帮助您快速弹性适配业务高峰,避免内存溢出的风险,有效保障线上业务稳定性。基于预测自动弹性伸缩 以实例...

组复制简介

特性 组复制 半同步复制 异步复制 数据可靠性★数据一致性 保证主备数据一致性 不保证 不保证 全局事务一致性 支持 不支持 不支持 数据 强 可靠性 组复制的数据强可靠性来源于Paxos协议的多数派原则,即当多数派收到事务的Binlog后,事务...

以太网接口频繁Up/Down

接口、接口模块或设备故障。解决方案 检查本端和对端设备线缆、模块是否插好。检查设备两端链路、接口模块是否故障。设备之间是通过双绞线连接,需要做如下检查。检查项 检查标准 后续操作 用测试仪测试双绞线是否故障。测试仪显示双绞线...

设备无法上电

可能原因 未打开设备电源开关。设备电源线缆没有插牢。设备的外接电源有故障设备的电源适配器有故障。解决方案 确认设备电源开关是否打开。确认设备电源线缆是否插牢。确认外接电源是否有故障。更换其它可以正常供电的外接电源,如果设备...

监控指标说明

该指标协助您进行作业诊断,排查作业Task级别的故障原因。次数 TM GC Time 每次TM GC时间。长时间GC会导致占用过大内存空间,从而影响作业性能。该指标协助您进行作业诊断,排查作业级别的故障原因。毫秒(ms)TM ClassLoader/...

教育实训

线下准备环境浪费时间,复杂软件安装繁琐,远程指导人力消耗大 学习效果差,教与练脱节,互动性差,缺少老师临场指导 线下培训教室,设备利用率低,随着课程变化还需要经常更换设备,投资回报率低 运维效率低,设备出现故障严重影响教学...

设备指示灯

智能接入网关设备指示灯的颜色和闪烁状态对应不同的设备使用情况。设备类型 指示灯 状态说明 SAG-100WM LTE 表示设备通讯是否正常:长亮或熄灭:设备通讯异常。闪烁:设备正常通讯。信号指示 表示4G LTE信号强度:3格表示最大信号强度。WAN...

以太网接口无法接通

接口、接口模块或者设备故障。解决方案 检查本端和对端设备是否接通电源,设备线缆和模块是否插好。检查设备两端链路、接口模块是否故障。如果设备之间使用双绞线连接,请排查以下检查项。检查项 检查标准 后续操作 用测试仪测试双绞线是否...

错误码

创建 TCC 参与者的分支事务记录出现异常 检查分布式事务 SDK 与事务云服务的网络连接是否正常、检查事务云服务返回创建分支事务记录事务原因。DTX-023 report tcc branch error,txId:[%s],actionId:[%s],serviceId:[%s].创建 TCC 参与者...

捕获内核的内存污染问题(KFENCE)

内存污染可能是由于编程错误、软件漏洞、恶意软件或硬件故障原因引起的。slab slab是Linux内核中一种高效的内存分配机制。它通过预先分配一定数量的内存对象,组织成一个内存缓存池,用于快速分配和释放内存。slab可以避免频繁的内存分配...

常见问题FAQ

8.平台添加设备确认 故障示意图如下:见下遥控器按键说明,按确定键。其余问题请提交工单或者拨打400电话。售后服务热线 400-0099998转1号键,进入报单,报单时请提供:门店名称、门店编号、门店具体地址、门店联系人姓名、手机号、故障...

性能调优

在诊断与优化界面排查当前阶段的慢查询中有没有峰值内存和扫描量比较高的查询,并分析查询内存高的原因。EXCEEDED_MEMORY_LIMIT(32003)当前查询的内存使用消耗超过内存限制。建议结合SQL排查该Query消耗内存大的算子。OUT_OF_PHYSICAL_...

Redis内存碎片

数据库自治服务DAS的巡检评分功能,支持对Redis的内存碎片率进行健康评分,本文介绍什么是Redis内存碎片,Redis内存碎片如何形成,以及如何通过Redis内存碎片率判断Redis是否存在内存碎片。什么是Redis内存碎片?操作系统的剩余空间总量...

云盒计算资源配置最佳实践

由于这些冗余资源对于用户来说是可见资源,随时可以被用来创建ECS实例或其他云产品实例,因此该方式对于日常业务使用有一定的灵活性,但无法保证在硬件设备故障期间,一定存在可用的备机资源。购买 SLA增值服务包,为计算资源通过SLA保证。...

电源故障定位

将有故障的电源适配器放到其它正常的设备中观察,或从其它设备中拿正常的电源适配器来交叉验证,识别故障。若交叉验证之后,故障跟随电源适配器,则将该电源适配器返修。若交叉验证之后,故障跟随设备,则请提交工单。icmsDocProps={'...

应用场景

Node.js 提供的精确到虚拟机级别的深度监控,能够如实的反应应用运行状态,通过配置报警规则,用户可以在发现系统出现故障内存泄露或者 CPU 热点等)趋势时,通过诊断接口迅速定位故障点。Node.js 性能平台特别适合业务发展迅速、应用...

DeviceWanLinkDown

DeviceWanLinkDown事件提示您设备WAN链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

如何解决Redis内存使用率突然升高

如果 Redis 实例的内存使用率突然飙升,可参考本文排查原因并解决问题。问题现象 Redis 实例之前的内存使用率较低。但从某个时间点开始,内存使用率突然迅速升高,甚至达到100%。问题原因 可能内存使用率突然升高的主要原因如下:短时间内...

AccessGatewayFailover

AccessGatewayFailover事件提示您智能接入网关设备主IPsec链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。...

事件上报

故障设备上报运行过程中出现的故障。输出参数 语料推送标识:需与 服务调用 中输入参数的 任务标识 保持一致,用于向物联网平台反馈本次事件上报是针对具体哪一次语料推送服务调用。语料更新结果:反馈语料推送的结果:0:语料推送成功。...

解读实例诊断报告

可能的原因内存被数据占满。大Key较多。排查方法,请参见 排查内存使用率高的问题。连接数使用率(数据节点)80%数据节点的连接数被打满后将会导致连接超时或失败。说明 如果实例为集群架构,且客户端通过 直连地址 连接至 Tair 实例,此...

故障管理

相关设备故障:包括UPS失效引起的电力中断。自然灾害,包括洪水、火灾、地震。这里以阿里集团为例。为降低故障的影响,阿里集团故障管理体系从整体体系化治理的角度出发,将影响真实业务的场景定义、发现和应急能力以及后续治理都纳入故障...

开启热备前后性能对比

对比总览 热备节点(开启热备切换功能)与只读节点的性能差异总览如下:对比维度 热备节点 只读节点 服务能力 提供只读服务,预热会额外占用少量内存。提供只读服务。switchover(主动运维,如小版本升级、规格升降配)连接不中断,事务不...

解决SQL Server实例空间满自动锁的问题

问题描述 SQL Server实例可能会由于SQL语句、外部攻击等原因导致实例空间满,为避免数据丢失,RDS会对实例进行自动锁定,磁盘锁定之后,将无法进行写入操作。当实例由于实例空间满自动锁定时,可在控制台查看的运行状态。问题原因 造成SQL ...

解决SQL Server实例空间满自动锁的问题

问题描述 SQL Server实例可能会由于SQL语句、外部攻击等原因导致实例空间满,为避免数据丢失,RDS会对实例进行自动锁定,磁盘锁定之后,将无法进行写入操作。当实例由于实例空间满自动锁定时,可在控制台查看的运行状态。问题原因 造成SQL ...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

如何排查slab_unreclaimable内存占用高的原因

slab_unreclaimable是指在Linux内存管理中由slab分配器分配的且被标记为不可回收(unreclaimable)的内存。当不可回收内存占用总内存的比例过高时,将会影响可用内存与系统性能。本文介绍如何排查Alibaba Cloud Linux系统slab_...

错误码

本文列举调用IoT区块链 Hub设备端API出错时,返回的错误信息。错误码 描述 故障排除指导 0 成功 无-1 通用错误 请根据示例Demo进行比对排查...5 申请内存不足 请检查设备自身可提供的内存大小。6 函数调用错误 请检查适配的下层函数是否正确。

RDS MySQL内存使用问题

本文介绍查看内存使用情况的方式,以及各种内存问题的原因和解决方案。背景信息 实例内存使用率和缓冲池命中率是RDS MySQL的关键指标。如果内存使用率过高,会有内存耗尽风险;如果缓冲池命中率低,大量的数据页无法命中缓冲池的数据页,...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

租户内存使用率告警

规则信息 告警项 指标类型 监控指标名 默认阈值 持续时间(连续触发告警周期数)检测周期 告警级别 租户内存使用率告警 单指标 租户/租户内存使用率 85 3 1 分钟 Warn 对系统的影响 租户内存不够时,可能会导致 SQL 执行变慢或者写入失败。...

ReportInstancesStatus-反馈一台或者多台ECS实例异常...

取值范围:hardware-cpu-error:CPU 故障 hardware-motherboard-error:主板故障 hardware-mem-error:内存故障 hardware-power-error:电源故障 hardware-disk-error:磁盘故障 hardware-networkcard-error:网卡故障 hardware-raidcard-...

搭建高可用架构

设置监控报警 为避免实例因为CPU、磁盘、内存、连接等原因导致实例不可用,建议您监控实例相关性能,并设置超过阈值时 自动报警,防患于未然。恢复数据 如果您已经按照前文的步骤搭建了高可用架构实例,您的业务一般是可以稳定运行的,即使...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 物联网无线连接服务 全局事务服务 (文档停止维护) 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用