灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致和业务可用。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

使用文件系统一致快照

当系统崩溃或其他故障发生时,仍可保持数据的一致和完整。本文介绍如何使用文件系统一致快照。前提条件 已创建Kubernetes集群,且集群为v1.18及以上版本。具体操作,请参见 创建Kubernetes托管版集群。访问指定地域的 ECS控制台,...

应用场景

发生机房或数据中心级别故障时,可以快速恢复业务。可以实现两地三中心、两地四中心、三地六中心等架构。典型行业:银行、证券、保险、互金等。业务架构(以两地三中心架构为例)数据库由两个 PolarDB 集群组成:北京的双可用区集群,...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续形成改进,避免历史同类故障重复发生

设计原则

在分布式系统中,需要考虑的稳定问题比较复杂,贯穿软件系统设计态、研发态、运维态、运行态,覆盖从IaaS、PaaS到上层SaaS系统,所有这些都可能会...旨在提高故障应急效率,减小故障影响,降低类似故障的再次发生,提升系统整体高可用

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致和业务可用。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

如何通过 mPaaS 框架解决 App 线上问题

如果真的在线上发生故障,开发者就可以通过服务器推送开关,及时将故障代码关闭。这种推拉结合的方式,即时到达率 100%。发布 H5 离线包更新如果某些故障是发生在离线包内,在定位到问题后,可以直接通过实时发布控制台发布新的版本即可。...

互联网行业

一旦设备发生故障需要维修,将严重影响业务和工作效率。弹性不足:传统的电脑办公系统无法满足战略和项目的快速调整,资源不足或过剩都会影响业务和成本。方案介绍 安全办公研发:无影云电脑、安全策略、无影云盘或NAS(加上AD连接器和云...

快照概述

创建快照 创建快照一致组 自动快照概述 回滚云盘 发生系统故障或错误操作时,您可以使用快照回滚云盘,实现应用版本回退。说明 可启用应用一致快照功能,当使用快照回滚时,可确保应用处于相同的启动状态。更多信息,请参见 通过控制台...

整机恢复

当ECS整机发生系统故障或者错误操作时,您可以通过备份点的克隆和恢复功能,实现应用版本回退。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 创建ECS整机备份。重要 当源ECS存在时,支持直接恢复源ECS。当源...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域灾害导致的系统故障,保障业务的可用,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域灾害导致的系统故障,保障业务的可用,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续保障,有效避免了地域灾害导致的系统故障。

ECS灾备解决方案

为了保障企业业务稳定、IT系统功能正常以及数据安全,灾备解决方案变得越来越重要,并且正在迅速发展。...这样,当主节点发生故障时,ECS节点仍然可以从备节点读取数据,确保数据的可用和业务的连续。更多信息,请参见 RDS数据库。

集群系列

且单个只读实例没有灾备,因此为了保障业务的可用和连续,建议至少创建两个只读实例,以确保某一个只读实例发生故障时,另一个只读实例可以继续提供服务。购买集群系列实例时,建议您选择多可用区部署,以实现跨可用区的容灾能力。架构...

DeviceWanLinkSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkSwitched WARN up Device Wan Link Switched 可能原因 WAN链路原有链路发生故障,切换到备用链路。处理方法 提醒用户WAN链路发生了切换,用户查看原有WAN链路并决定是否主动切...

应用场景

当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务,CLB 已在各地域部署了多可用区以实现同地域容灾。当...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行恢复原盘或者创建新盘操作实现数据恢复。本文介绍云盘恢复的相关操作。前提条件 已创建云盘备份。更多信息,请参见 创建云...

故障处理流程

当智能接入网关设备发生网络故障后,您可以先观察现象、收集信息,然后对现象和信息进行分析诊断,尝试修复问题。本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下...

应用场景

以此,降低产品使用过程中故障发生概率,提高故障恢复效率,进而实现产品高可用的有效提升。机房级容灾 同城双活 同一个城市,建设两个机房环境,两地距离 50 km 以内,万兆光纤专线互连,业务应用层面可以两个机房同时提供业务服务,当...

混合云解决方案

如果MASTER 宕机,发生故障转移,此时SLAVE如果要提供服务,日志读取器会等待镜像日志先同步,再做发布,但如果MASTER发生硬件故障,此时SLAVE需要打开一个跟踪标记1448,在镜像故障的情况下可以继续分发数据。说明 1448标记用于在事务...

基于ack-lingjun-aiast组件实现集群自动化运维

组件介绍 安装灵骏AI助手开启PAI的作业监控和恢复功能后,当发生故障或异常时,灵骏AI助手的告警系统可以自动和PAI进行交互,并上报故障信息,并根据故障触发阶段和并行策略选择规避故障的方法,自动隔离故障节点,并通过checkpoint快速...

部署方案

当主副本发生故障时,备副本将会升为主副本继续提供读写服务。对性能和多机房可用有着更高要求的客户建议选择多机房部署方案。双机房部署 云数据库 OceanBase 双机房部署:将两个节点部署在两个可用区,其中一个节点作为主副本提供读写...

应用场景

平时,您还可以方便地进行容灾演练,确保真实故障发生时恢复流程顺畅,保证容灾计划的准确。混合云容灾服务让您无需承担自建灾备中心的巨大投入,也无需担心传统容灾方案复杂的软硬件部署运维,极大减少了异地容灾的成本,提高容灾的有效...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

新功能发布记录

高可靠模式 最强容灾能力 强大容灾能力 开发和测试 故障演练 新增 高速通道提供主动故障演练能力,帮助您验收混合云组网的高可靠故障演练 接入点 新增 新增中国香港(香港-葵涌-F)和中国香港(香港-柴湾-G)接入点。接入点地址 2023年...

密钥轮转概述

如果第一次执行(突发)密钥轮转是在响应具体事件的情形下,并且发生在运行中的系统上,则发生故障的概率会被无限放大。对数据形成逻辑上的隔离 轮转加密密钥使得轮转前后产生的密文数据形成事实上的隔离效果。特定密钥的安全事件可以被...

标准版-双副本

主节点提供日常服务访问,备节点提供HA高可用,当主节点发生故障,系统会自动在30秒内切换至备节点,保证业务平稳运行。特点 可靠 服务可靠 采用双机主从(master-replica)架构,主从节点位于不同物理机。主节点对外提供访问,用户可...

强弱依赖治理概述

异常发生时,不影响核心业务流程,不影响系统可用的依赖称作弱依赖,反之为强依赖。以商品详情页为例。商品详情页后台系统架构如下。如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程...

解决方案与客户案例

业务连续保障 异地多活架构下各个数据中心常态承接业务流量,故障发生时只需调拨入口流量即可实现容灾切换,实现分钟级的容灾切换。同时随着参与多活建设的数据中心数量增加,参与调拨流量的比例会相应减少,未参与调拨的业务流量可以...

基于MSE云原生网关实现同城多活

在同城多活的场景下,能够确保对跨可用区的多个业务集群的请求实现高效负载均衡分配,在单个可用区内的业务集群发生故障时,可在1秒内完成故障节点的自动摘除从而实现故障转移,有效的保障服务连续和高可用。容灾概述 目前云上容灾主要...

附录:SOFAStack 产品目录

传统实现方式是在系统代码里指定任务的执行顺序,当业务发生变化时需要修改代码才可以正常工作,可维护很差。使用 SOFAStack 任务调度中的任务编排功能,可以轻松完成任务之间的依赖调整,大大提高了可维护,并可以直观地看到任务的...

冷备操作手册

在后续运行中,如一体机发生硬件故障,本文档描述如何一键替换主机,快速恢复现场业务。一 支持声明 冷备支持机型 物业管理一体机-停车版、物业管理一体机-人行版、物业管理一体机-视频版、物业管理一体机-EBA版、物业管理一体机-通行版、...

读写分离架构

建议与使用须知 当一个只读节点发生故障时,请求会转发到其他节点;如果所有只读节点均不可用,请求会全部转发到主节点。只读节点异常可能导致主节点负载提高、响应时间变长,因此在读负载高的业务场景建议使用多个只读节点。只读节点发生...

推空保护

当服务下所有实例全部移除时,集群将针对该服务自动开启1分钟的推空保护,防止因网络抖动、服务提供者短时间内发生故障等问题导致的异常推空,以保证此场景下用户业务可用。说明 为保证业务的最高可用,建议打开 ...

读写分离版

建议与使用须知 当一个只读节点发生故障时,请求会转发到其他节点;如果所有只读节点均不可用,请求会全部转发到主节点。只读节点异常可能导致主节点负载提高、响应时间变长,因此在读负载高的业务场景建议使用多个只读节点。只读节点发生...

多可用区数据强一致

功能优势 开启多可用区数据强一致功能之后,当主可用区集群发生故障时,会 自动切换 到备可用区,并进行跨可用区的多副本强同步复制,RTO,确保数据的强一致,提供金融级的高可靠。前提条件 当前仅 PolarDB MySQL版 的 集群版 8.0.1...

词汇表

这意味着如果一个可用区发生故障,其他可用区仍能保持正常运行,从而保证了高可用。同一地域内的不同可用区之间内网互通,使用低时延链路相连。不同地域之间的可用区完全隔离。下图以地域1(包含3个可用区)和地域2(包含3个可用区)为例...

设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 云服务器 ECS 轻量应用服务器 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用