室内分布系统发生故障怎么办-室内分布系统发生故障怎么办文档介绍内容-阿里云

自动/手动主备切换

当系统发生故障时，PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换，指定一个只读节点为新的主节点。注意事项不论是自动切换还是手动切换，切换过程中，都可能会出现30秒左右的闪断，因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

当系统发生故障时，PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换，指定一个只读节点为新的主节点。注意事项不论是自动切换还是手动切换，切换过程中，都可能会出现30秒左右的闪断，因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

当系统发生故障时，PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换，指定一个只读节点为新的主节点。注意事项不论是自动切换还是手动切换，当只读节点未开启热备时，主备切换过程中可能会出现20~30秒左右的闪断，因此切换前请...

ECS整机恢复

当ECS整机发生系统故障或者错误操作时，您可以通过备份点的克隆和恢复功能，实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件已创建ECS整机备份。具体操作，请参见备份ECS整机。重要当源ECS存在时，支持直接...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时，您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点，进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件已创建ECS整机备份。具体操作，请参见备份ECS整机。背景信息云盘恢复...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时，您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点，进行恢复原盘或者创建新盘操作实现数据恢复。本文介绍云盘恢复的相关操作。前提条件已创建云盘备份。更多信息，请参见创建云...

功能概览

当主系统发生故障时，业务系统切换到容灾系统，有效避免了地域性灾害导致的系统故障，保障业务的可用性，满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息，请参见 ...

功能概览

当主系统发生故障时，业务系统切换到容灾系统，有效避免了地域性灾害导致的系统故障，保障业务的可用性，满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息，请参见云...

标准架构

主节点提供日常服务访问，从节点提供HA高可用，当主节点发生故障，系统会自动在30秒内切换至从节点，保证业务平稳运行。标准架构高可用类型的特点如下：可靠性服务可靠采用双机主从（master-replica）架构，主从节点位于不同物理机。主...

标准版-双副本

主节点提供日常服务访问，备节点提供HA高可用，当主节点发生故障，系统会自动在30秒内切换至备节点，保证业务平稳运行。特点可靠性服务可靠采用双机主从（master-replica）架构，主从节点位于不同物理机。主节点对外提供访问，用户可...

GTM如何实现同城容灾

创建1个全局访问策略，解析请求流量选择全局，主地址池集合选择「业务中心01」地址池和「业务中心02」地址池，负载均衡策略选择返回全部地址，此设置可实现两个数据中心同时提供服务和发生故障时系统自动摘除故障地址的效果。...

实例的节点故障处理机制

当节点发生故障后，系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明单节点实例适用于测试、培训、非核心业务等场景，生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集图 1.副本集架构 ...

替换主机

当主机发生故障后，如果您创建专属集群MyBase 时主机故障处理策略选择的是手动替换主机，则您可以通过手动替换主机来解除故障。前提条件专属集群MyBase 引擎的为MySQL，且主机存储类型为本地SSD盘。背景信息当主机发生故障时，系统会...

替换主机

当主机发生故障后，如果您创建专属集群MyBase 时主机故障处理策略选择的是手动替换主机，则您可以通过手动替换主机来解除故障。前提条件专属集群MyBase 引擎的为MySQL，且主机存储类型为本地SSD盘。背景信息当主机发生故障时，系统会...

设计方案

基于稳定性支柱设计原则，整体稳定性设计方案可参考如下：架构设计原则软件系统从所有的功能都在一个应用程序内运行的单体应用架构，到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构，再到服务细分通过轻量级的通信机制...

代码逻辑场景

受影响的请求数否 0 限制最多发生故障的请求总数，每生效一次故障计数加1，累计发生故障请求数超出设定值后，请求则不再发生故障。填写数值小于等于0时，则表示不限制。受影响的请求占比（%）否 0 限制发生故障的请求数占所有应该发生故障...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息事件名称事件级别状态码状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因用户侧交换机设备故障。用户侧交换...

概述

分布式系统将计算任务和数据分布在多个节点上以实现更高的性能、可靠性和可扩展性，当一个节点发生故障或错误时，其他节点可以继续工作，相比于单机系统，架构本身就有较高的节点容错性。但随着服务拆分，更多组件的引入，分布式系统的复杂...

设计原则

面向风险的应急快恢原则在一些场景下，即使设计了各种技术手段去提高系统的冗余、保持业务的高可用，但还是避免不了生产系统故障的发生，所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台，实现故障风险实时发现、应急...

同城容灾架构概述

非机房级故障（某个机房的单产品故障，例如其中一个机房的ECS服务器损坏），可以通过对单产品的灾备设计来保障发生故障时系统及时切换。应用设计相关参考标准应用设计相关参考标准如下：无状态化。分布式集群设计、避免单点逻辑出现。幂等...

基本概念

RPO Recovery Point Objective（数据恢复点目标），指应用发生故障时预期的数据丢失量。例如，RPO=15 分钟，表示在应用发生故障时，最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective（恢复时间目标），指故障发生时，在云...

单实例快速恢复

该方案为当前每个实例内部默认启用，当系统发生故障时，无需手工运维介入，系统可以自动恢复。在恢复期间，如果查询算子需要访问恢复中的节点，则查询会立即失败。节点恢复速度在一分钟左右，当表数量明显增加时，恢复时间会更长。Hologres...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象光模块连接后，接口指示灯没有变为绿色。可能原因光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见光模块型号。说明目前仅SAG-1000设备支持光模块插入。解决方案通用多...

什么是故障演练

适用场景故障演练可适用于以下典型场景：衡量微服务的容错能力通过模拟调用延迟、服务不可用、机器资源满载等，查看发生故障的节点或实例是否被自动隔离、下线，流量调度是否正确，预案是否有效，同时观察系统整体的QPS或RT是否受影响。...

设置宕机自动迁移

若您未开启宕机自动迁移，DDH发生故障停机后，您需要提交工单申请置换一台健康的DDH。警告本地SSD型DDH（例如本地SSD型i2）不支持自行手动迁移和故障时自动迁移。如果本地SSD型DDH出现故障，您可以提交工单申请人工迁移，但迁移后本地...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时，能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下，数据的完整性、可恢复性和可用性不受到严重影响，以保障业务的持续运行和数据的...

源为PolarDB-X的任务配置方案

配置 PolarDB分布式版下多个RDS MySQL至目标库的DTS任务，如其中一个DTS任务发生故障，则不影响其他DTS任务的运行，且只需恢复发生故障的DTS任务即可。稳定性一般。仅配置一个以 PolarDB分布式版为源的DTS任务，如该DTS任务发生故障，则...

源为PolarDB-X的任务配置方案

配置 PolarDB分布式版下多个RDS MySQL至目标库的DTS任务，如其中一个DTS任务发生故障，则不影响其他DTS任务的运行，且只需恢复发生故障的DTS任务即可。稳定性一般。仅配置一个以 PolarDB分布式版为源的DTS任务，如该DTS任务发生故障，则...

如何通过 mPaaS 框架解决 App 线上问题

如果真的在线上发生故障，开发者就可以通过服务器推送开关，及时将故障代码关闭。这种推拉结合的方式，即时到达率 100%。发布 H5 离线包更新如果某些故障是发生在离线包内，在定位到问题后，可以直接通过实时发布控制台发布新的版本即可。...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后，如果主盘发生故障，您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件反向复制前，请确保源云盘（主盘）已经从对应的ECS实例上卸载，即主盘处于未挂载状态。具体...

主从实例读写分离部署（共享存储）

该方案为当前每个实例内部默认启用，当系统发生故障时，无需手工运维介入，系统可以自动恢复。在恢复期间，如果查询算子需要访问恢复中的节点，则查询会立即失败。Hologres从V1.1版本开始，采用全新恢复机制，节点恢复速度在一分钟左右，比...

通过一致性复制组实现容灾恢复

当生产站点发生故障时，将开启读写权限的容灾站点中云盘挂载到临时创建的ECS实例上继续运行业务，直到生产站点故障修复完成。警告故障切换功能会暂停异步复制功能，您需要确保您的生产站点发生故障时再使用故障切换功能，避免数据丢失。...

计算资源

即使其中一个节点发生故障或异常中断，其他节点仍然可以继续执行剩余的子任务，提高任务的容错性和可靠性。任务重复执行由于各种原因导致计算任务被多次执行的情况，如重复操作、消息重复、调度重复等原因。常见的容错策略如下：去重：...

灾备方案

图 1.Tair 容灾架构演进灾备方案灾备级别说明单可用区高可用方案★主备节点部署在同一可用区中的不同机器上，当任一节点发生故障时，由高可用HA（High Availability）系统自动执行故障切换，避免单点故障引起的服务中断。同城容灾方案...

灾备方案介绍

图 1.Redis容灾架构演进灾备方案灾备级别说明单可用区高可用方案★主备节点部署在同一可用区中的不同机器上，当任一节点发生故障时，由高可用HA（High Availability）系统自动执行故障切换，避免单点故障引起的服务中断。同城容灾方案...

强弱依赖治理概述

强弱依赖治理的应用强弱依赖治理主要可以被应用到以下场景：系统改造验收：对于分布式系统，至少在运行态中，不会因为依赖的系统后台出现故障，引起当前应用出现系统级可用性的故障，例如进程挂掉、频繁FullGC、负载飙高等，何时何地都应...

故障演练

例如，模拟在高速通道冗余链路中的一条链路发生故障时，网络流量会自动切换至其他冗余链路的场景。借助该工具，您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要故障演练会通过将被演练的资源关闭，使资源处于人工构造的故障...

主从（备）切换原因

实例故障阿里云检测到实例发生故障，无法正常使用，系统会发起主从（备）切换，及时恢复业务正常运转，缩小故障影响范围。主从（备）切换完成后，实例状态会显示运行中，您不需要进行任何操作，实例可以正常运行。您可以在服务可用性 ...

高压缩引擎（X-Engine）介绍

高压缩引擎（X-Engine）多节点架构可用于保障集群的高可用，当系统发生故障时，可读写的主节点和只读节点之间会自动进行故障切换（Failover），保证了服务可用性不低于99.99%。高压缩引擎（X-Engine）多节点架构图如下：产品优势超大存储...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下，可使用MSHA切流功能将流量全部切换到另外的单元格，进行快速业务恢复（这里区别于传统的思路，不是去排查、处理和修复故障，而是立即使用切流进行恢复，将业务恢复和故障恢复解耦）。容灾切换...

室内分布系统发生故障怎么办

新品推荐