ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...
通用设备 指常见的IoT设备及系统,包括传感器设备、闸机、空调、业务系统等,此类设备需要通过标准通信协议进行通信,您可以使用阿里云提供的官方驱动进行接入,也可以按照自定义驱动开发框架进行驱动开发。驱动相关介绍,请参见 驱动简介...
背景信息 云盒的硬件设计中,各类硬件设备的保障如下:网络设备:采用双机冗余双上连设计,确保云盒内网络的高连续性,且不存在单点故障。存储设备:可以 确保在两台存储服务器同时宕机的情况下,数据的安全可靠。计算设备:支持宕机迁移和...
通用设备 指常见的IoT设备及系统,包括传感器设备、闸机、空调、业务系统等,此类设备需要通过标准通信协议进行通信,您可以使用阿里云提供的官方驱动进行接入,也可以按照自定义驱动开发框架进行驱动开发。驱动 物联网边缘计算中的通用...
告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...
更多产品定价常见问题 挂载访问FAQ Linux挂载NFS文件系统常见问题 Windows挂载SMB文件系统常见问题 Linux挂载SMB文件系统常见问题 Windows挂载NFS文件系统常见问题 为什么卸载旧NAS并重新挂载新NAS后,容器Pod仍将数据写入旧NAS?...
当智能接入网关设备发生网络故障后,您可以先观察现象、收集信息,然后对现象和信息进行分析诊断,尝试修复问题。本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下...
DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...
场景一:面向大中型企业的多地容灾高可用网络架构 当本地数据中心的关键业务对可用性要求极高时,建议在多个接入点建立专线连接,该拓扑确保了因光纤切断、设备故障或接入点位置故障导致的连接故障的恢复能力。自主申请专线和共享合作伙伴...
物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测和故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...
为了能够快速恢复系统故障,Hologres提供了单实例快速恢复的机制。本文为您介绍单实例快速恢复的触发条件和行为。实例快速恢复逻辑说明 Hologres在 V2.0版本之前,Hologres计算节点均为容器调度(即下图中的Worker Node),资源管理器...
接口、接口模块或设备故障。解决方案 检查本端和对端设备线缆、模块是否插好。检查设备两端链路、接口模块是否故障。设备之间是通过双绞线连接,需要做如下检查。检查项 检查标准 后续操作 用测试仪测试双绞线是否故障。测试仪显示双绞线...
接口、接口模块或者设备故障。解决方案 检查本端和对端设备是否接通电源,设备线缆和模块是否插好。检查设备两端链路、接口模块是否故障。如果设备之间使用双绞线连接,请排查以下检查项。检查项 检查标准 后续操作 用测试仪测试双绞线是否...
本文以Linux系统设备为例,为您介绍基于访问端代理实现对设备本地服务访问的方案。本文示例中的安全隧道通过控制台页面手动创建,您可以参考本文示例中访问端代理方式,自行开发并集成阿里云物联网平台的云端API,设计应用程序自动请求创建...
设备诊断是阿里云物联网平台针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。服务架构 服务优势 丰富的数据诊断指标 提供网络连接成功率、设备离线原因、云对接次数等丰富的...
容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。
背景信息 在物联网边缘计算业务中,由边缘一体机分析的告警事件、设备故障等消息,需要及时发送通知给特定的人员处理,避免出现安全风险或者业务停滞等情况。对此场景,物联网边缘计算研发了 智慧立方 钉钉小程序,您只需要配置小程序,...
当ECS整机发生系统故障或者错误操作时,您可以通过备份点的克隆和恢复功能,实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。重要 当源ECS存在时,支持直接...
当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...
面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障的发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...
容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...
智能接入网关提供两种型号的网关设备,设备功能如下表所示(“√”表示支持,“×”表示不支持)。特性 功能点 说明 SAG-100WM SAG-1000 SCG5000 1.0及以上软件版本 2.0及以上软件版本 1.0及以上软件版本 2.0及以上软件版本 基本连通性 ...
当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...
当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...
DAS服务自动SQL限流和自动SQL调优,帮助DBA从救火员转向数据库架构师,有更多时间和精力帮助研发优化系统架构,审核数据库的变更和各种操作,进一步降低系统故障的概率。DAS服务自动对数据库实例进行治理,帮助捷顺科技把数据库的运维成本...
更换设备时,分当月和跨月两种情况:当月内完成更换:实际使用时长=(寄出待更换设备日期-1)+(30天-接收新设备日期)跨月完成更换:寄出设备当月:实际使用时长=寄出待更换设备日期-1 接收新设备当月:实际使用时长=30天-接收新设备日期 ...
NormalDeviceNum Integer 1500 正常设备数量 FaultDeviceNum Integer 12 故障设备数 HighFreqFaultDeviceNum Integer 8 频繁故障设备数量 TicketIndex Object 工单指标数据 TotalTicketNum Integer 1000 总故障数量 AutoRecoverTicketNum ...
Linux挂载NFS协议文件系统失败自动检查脚本 Windows挂载SMB协议文件系统失败自动检查脚本 交叉挂载失败排查思路 Linux挂载SMB协议文件系统失败排查思路 Windows系统挂载NFS协议的通用型NAS文件系统失败排查思路 常见挂载报错FAQ 如何解决子...
概述 本文主要介绍使用阿里云ECS实例搭建Nginx网站时,遇到的一些常见问题的处理方法。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于...
容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...
畅捷通通过日志服务的异常预测函数,从海量指标中快速定位异常,将有问题的地方显示出来,快速发现系统故障。畅捷通通过日志服务将各块汇集过来的数据进行标记后,与应用的配置信息进行关联和整合,通过时序发现故障的根因,从而可以实现...
当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...
设备配件 在智能接入网关管理控制台购买设备后,您除了收到一台SAG-1000型号的设备外,还将收到以下配件:一个电源适配器 两根LTE天线 两个挂耳 一包螺丝 说明 请检查您收到的设备以及设备配件,如果发现设备及设备配件有短缺或损坏的情况...
业务挑战 一致性,一致性是金融业务的生命线,为了应对硬件或者系统故障(IDC/OS/机器故障),传统的数据库在这方面为业务提供多种选择。最大可用模式在主库故障情况下可能造成数据丢失。最大保护模式会提高全年的不可用时间,并造成性能...
本文介绍将业务程序与远程登录程序进行进程隔离,以保证设备在故障时可以进行远程运维。背景信息 设备基于物联网平台的消息通信能力开展业务,由于不同设备业务的复杂性,以及业务需要定期变更升级,导致设备的业务程序容易出现故障,导致...
动态HA功能无需配置虚IP地址,系统会主动帮您探测设备状态,在主网关设备故障时,自动帮您切换流量。智能接入网关仅支持同一实例中的两台设备组建HA备份组,系统会指定默认的主设备和备设备,您可以登录智能接入网关管理控制台查看设备的...
在购买智能接入网关设备时,您可以选择购买两台设备,两台设备绑定到同一实例中,互为备份,在一台设备发生故障时进行设备切换,保障业务不中断。通过本文您可以在智能接入网关控制台查看设备级备份信息。前提条件 您购买的智能接入网关...
通过日志记录的消息内容、业务类型、操作类型和状态码等信息,可以了解设备状态、通信情况,并定位操作失败的原因,帮助您监控和管理设备,进行故障排查。本文介绍如何查看云端运行日志,以及相关错误码和排错方法。日志业务类型说明 上行...
强弱依赖治理的应用 强弱依赖治理主要可以被应用到以下场景:系统改造验收:对于分布式系统,至少在运行态中,不会因为依赖的系统后台出现故障,引起当前应用出现系统级可用性的故障,例如进程挂掉、频繁FullGC、负载飙高等,何时何地都应...
本文介绍智能接入网关设备显示离线的原因和处理方法。问题现象 登录 智能接入网关控制台,查看设备状态为 离线。可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的...