如何管理故障

故障发生条件 当事件重要程度上升、整体影响面恶化、持续长时间未解决,综合评估已达到故障时(P1-P4),处理人可手动将事件升级为故障。当报警来源的指标持续恶化,触发故障产生规则,系统自动产生故障故障过程 故障过程用于记录管理...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

添加路由策略

背景信息 您可以在云企业网的各个地域网关配置路由策略,每个地域网关支持在入地域网关和出地域网关两个方向分别配置路由策略,每条路由策略是条件语句和执行语句的集合。路由策略按照优先级从小到大排列。执行路由策略时,系统从优先级...

安全规则DSL语法

DSL语法详细介绍 条件语句 条件就是判断语句,用来判定 true 或 false。条件语句由连接符(and、or)、操作符、因子(系统变量)组成。如下示例都是合法的条件语句。true/最简单的条件语句,结果就是true。1>0 1>0 and 2>1 1说明 以上结果...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

路由策略概述

路由策略支持在地域网关的入地域网关(RegionIn)方向和出地域网关(RegionOut)方向分别配置路由策略,每条路由策略均是条件语句和执行语句的集合。路由策略按照优先级进行排列,优先级数字越小,优先级越高。执行路由策略时,路由从优先...

路由策略概述

执行路由策略时,路由从优先级最高的路由策略开始匹配条件语句,对于符合全部匹配条件的路由,路由策略将按照策略行为允许路由通过或拒绝路由通过,允许通过的路由支持修改路由的优先级、AS Path属性、Community属性;对于不符合全部匹配...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...

通过一致性复制组实现容灾恢复

当生产站点发生故障时,将开启读写权限的容灾站点中云盘挂载到临时创建的ECS实例上继续运行业务,直到生产站点故障修复完成。警告 故障切换功能会暂停异步复制功能,您需要确保您的生产站点发生故障时再使用故障切换功能,避免数据丢失。...

设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

高级搜索

搜索条件语句语法的更多信息,请参见 类SQL语法说明。列表显示搜索结果,搜索框右侧显示下载图标。您可单击下载图标,获取已搜索设备的列表文件,格式为CSV。通过物模型搜索设备。在左侧导航栏,选择 设备管理>设备,单击 高级搜索 页签。...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

脚本语法

流程控制语句 物联网平台支持使用 for 循环和 if.else 条件语句。其中 for 循环,支持使用关键词 break(跳出循环)和 continue(跳出本次循环)。重要 若使用 for 语句循环执行流转函数,循环次数不能超过100。流转函数详细信息,请参见 ...

流水单据型业务场景多活实践

在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复。说明 这里区别于传统的解决思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦。容灾切换...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

SQL表达式

上文两个示例中,条件语句 WHERE temperature>38 表示温度大于38℃时,才会触发该规则。二进制数据格式 目前二进制格式WHERE语句中,仅支持内置函数及条件表达式,无法使用payload中的字段。SQL结果 SQL语句执行完成后,会得到对应的SQL...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 面板,选择 恢复...

EMR Kafka磁盘故障运维

当磁盘发生故障时,应及时完成相关故障的处理,及时恢复集群的容错能力。磁盘运维概述 本文从磁盘监控和磁盘故障恢复角度来介绍磁盘运维策略。磁盘监控 以下内容从Kafka服务层面以及ECS系统层面来简单了解一下磁盘的监控策略。Kafka服务...

AScript语法规则

语句 条件判断语句 if condition {.} if condition1 { if condition2 {.} } if condition {.} else {.} 语句解释 condition 可由如下语法元素组成:字面值 变量 函数调用 body部分 允许空body。允许多语句:一行一条语句。支持多层嵌套 ...

EdgeScript语法

示例 sval=concat(sval,'trail')len(arrvar)语句 条件判断语句 if condition {.} if condition1 { if condition2 {.} } if condition {.} else {.} 语句解释 condition 可由如下语法元素组成:字面值 变量 函数调用 body部分 允许空body。...

EdgeScript语法

示例 sval=concat(sval,'trail')len(arrvar)语句 条件判断语句 if condition {.} if condition1 { if condition2 {.} } if condition {.} else {.} 语句解释 condition 可由如下语法元素组成:字面值 变量 函数调用 body部分 允许空body。...

EdgeScript语法

示例 sval=concat(sval,'trail')len(arrvar)语句 条件判断语句 if condition {.} if condition1 { if condition2 {.} } if condition {.} else {.} 语句解释 condition 可由如下语法元素组成:字面值 变量 函数调用 body部分 允许空body。...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

应用场景

以此,降低产品使用过程中故障发生概率,提高故障恢复效率,进而实现产品高可用性的有效提升。机房级容灾 同城双活 同一个城市,建设两个机房环境,两地距离 50 km 以内,万兆光纤专线互连,业务应用层面可以两个机房同时提供业务服务,当...

诊断规则

而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现故障的快速定位与处理。本节将向您介绍诊断规则的相关操作。诊断规则是诊断节点的构成,诊断规则...

什么是消息演练

单个或多个模块都可能会有不同类型的故障发生,导致模块不能正常运行,例如Producer无法发送消息,这种场景叫做消息的演练场景。需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

云数据库RDS MySQL版主实例与只读实例之间存在复制...

解决方案 不同的问题原因对应的解决方案不同,请您先通过SQL洞察功能对故障发生时的所有SQL语句进行审计,检查是否存在上述几种情况。说明:更多有关SQL洞察的信息,例如如何开通SQL洞察以及如何使用SQL洞察,请参见 SQL洞察。如果存在上述...

逻辑复制槽故障转移(Logical Replication Slot ...

前提条件 支持的 PolarDB PostgreSQL版 的版本如下:PostgreSQL 11(内核小版本1.1.27及以上)说明 您可通过如下语句查看 PolarDB PostgreSQL版 的内核小版本的版本号:show polar_version;背景信息 在主实例创建的Replication Slot,不会...

PolarDB MySQL版8.0.1版本发布日志

修复RO节点的物理机出现故障时,RW节点在特殊情况下未将其复制关系中断,而引发RW节点刷脏受阻的问题。修复HA后,因表数量过多而引发table cache淘汰导致Autoinc回退的问题。修复多主集群缓存中心重启情况下,读写节点可能无法启动的问题。...

错误码

有很多跨库查询(例如聚合统计类查询,未带分库条件的查询)同时执行,占用大量连接。解决方法建议如下:尽量使用框架访问数据库,如Spring JDBC、MyBatis等;按性能分析报告与DBA建议优化业务SQL语句;使用 PolarDB-X 读写分离将跨库查询...

手动调整Join顺序

但查询语句和表的过滤条件随时可能发生变化,而且如果数据特征复杂,自动调整Join顺序功能不一定在所有场景下都能很好地预估查询特征,并选择出最优的Join顺序。而不优的Join顺序可能造成中间结果集膨胀中间结果集数据量较大、内存消耗大等...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用