使用API终止和恢复VBR来确认冗余物理专线

当一条物理专线发生故障后,健康检查辅助系统自动切换业务流量到另外一条正常的物理专线上,从而保障您的业务高可用。自动切换的时间周期受您的VPC路由条目数量的影响。通常情况下,您的业务可以在12秒内完成自动切换。下表列出本地IDC通过...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

GTM如何实现同城容灾

创建1个全局访问策略,解析请求流量 选择 全局,主地址池集合 选择「业务中心01」地址池和「业务中心02」地址池,负载均衡策略 选择 返回全部地址,此设置可实现两个数据中心同时提供服务和发生故障时系统自动摘除故障地址的效果。...

流水单据型业务场景多活实践

在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复。说明 这里区别于传统的解决思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦。容灾切换...

创建专有宿主机

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机...

集群系列

且单个只读实例没有灾备,因此为了保障业务的可用性和连续性,建议至少创建两个只读实例,以确保某一个只读实例发生故障时,另一个只读实例可以继续提供服务。购买集群系列实例时,建议您选择多可用区部署,以实现跨可用区的容灾能力。架构...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

轻量应用负载均衡概述

当其中一部分轻量应用服务器发生故障后,负载均衡会自动屏蔽故障的轻量应用服务器,将请求分发给正常运行的轻量应用服务器,保证应用程序仍能正常工作。弹性管理应用程序的服务能力。您可以根据业务发展的需要,自行添加或移除轻量应用负载...

跨地域灾备

同时MaxCompute统一元数据能力支持元数据跨地域高可用,则当主集群地域发生故障且无法恢复时,通过修改项目归属地域的元数据,将项目快速切换到备份集群地域,实现业务的无缝恢复,示意图如下所示。重要 目前跨地域灾备功能处于邀测阶段,...

本地盘最佳实践

如果本地盘发生故障、物理服务器发生宕机,或者人为误操作,本地盘会丢失数据。请勿在本地盘上存储需要长期保存的业务数据。但云盘采用分布式三副本机制,能防止意外硬件故障导致的数据不可用。如果应用没有多节点数据冗余架构,强烈建议您...

一致性复制组概述

容灾站点 除了生产站点以外另外建立容灾站点,当生产站点发生故障时,容灾站点可以接管业务,实现业务不间断。恢复点目标(RPO)由于云盘异常可能丢失的数据量,以时间为单位,是异步复制功能的数据指标之一(一致性复制组功能的RPO默认为...

强弱依赖治理最佳实践

通过以上业务依赖的预判可以得出以下结论:前端对商品推荐服务预判为弱依赖,表示当推荐服务发生故障时前端正常访问不应该受阻。在购物链路中,商品服务product对商品数据库product-mysql预判为强依赖。表示如果扣减库存失败,则应该阻断下...

故障演练

确保操作人员熟悉容灾恢复流程,确保在生成站点真正发生故障时,操作人员可以顺畅地进行容灾切换。前提条件 保护组处于 增量复制中 或者已有恢复点之后,您就可以进行故障演练。如何创建跨可用区和跨地域容灾的保护组,请参见 跨可用区容灾...

DATASOURCE:ECS:DedicatedHosts

无 ActionOnMaintenance String 当专有宿主机发生故障或者在线修复时,为其所宿实例设置迁移方案。取值:Migrate:迁移实例到其他物理机并重新启动实例。Stop:在当前专有宿主机上停止实例,确认无法修复专有宿主机后,迁移实例到其他物理...

健康检查

警告 关闭健康检查后,ALB 不再检查后端服务器,一旦某台后端服务器发生故障,则无法实现访问流量自动切换至其他正常的后端服务器。如延长健康检查的间隔时间,后端服务器出现故障时,ALB 发现故障后端服务器的时间也会变长。方式二:通过...

故障演练

确保操作人员熟悉容灾恢复流程,确保在生成站点真正发生故障时,操作人员可以顺畅地进行容灾切换。前提条件 保护组处于 增量复制中 或者已有恢复点之后,您就可以进行故障演练。如何创建跨可用区和跨地域容灾的保护组,请参见 跨可用区容灾...

网络架构容灾

当地址池中地址发生故障时,HealthCheck模块会准确的检测到异常情况并与DNS交互(如下图中序号3所示),摘除故障地址(如下图中序号4所示),这样用户端会自动解析到可用的地址池(如下图中序号5所示)。并当故障地址恢复时,自动恢复至...

自动或手动主备切换

当主实例发生故障或不可用时(例如操作系统错误、硬件故障等),系统会自动触发主备切换,主实例和备实例将进行互换,切换后实例地址保持不变,应用程序会自动连接到新的主实例(原备实例),从而保障业务的连续性和高可用性。此外,您还...

数据库代理常见问题

数据库代理采用双主节点的高可用架构,流量连接按照1:1比例分发到两个节点当中,如果其中一个节点发生故障,将由另一个节点承担全部流量,并会自动触发故障节点重搭恢复任务,以确保数据库服务的高可用性。数据库代理的性能会随着代理连接...

高性能版实例

即使计算节点发生故障,也可以保证实例无数据丢失。高可用 AnalyticDB PostgreSQL版 高性能版由于减少了一个副本,在高可用方面出现了一些下降,在物理机故障等极端情况下,集群恢复的时间会变长(8小时以内)。高性能版通过ESSD多副本技术...

源为PolarDB-X的功能规范和约束说明

警告 异常切流是指源实例或者源实例所在的数据中心发生故障时进行的切流操作。这类操作都是有损操作。在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据...

源为PolarDB-X的功能规范和约束说明

警告 异常切流是指源实例或者源实例所在的数据中心发生故障时进行的切流操作。这类操作都是有损操作,例如导致数据不一致或任务失败。在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,...

归档存储服务等级协议

赔偿方案 阿里云对用户存在故障的每个Archive按不可用时间的100倍赔偿,即赔付金额=发生故障的Archive故障前24小时平均每分钟费用×不可用时间×100倍;其中:(1)赔偿只针对使用归档存储服务已产生费用的用户,以归档存储代金券的形式赔偿,...

读写分离架构

建议与使用须知 当一个只读节点发生故障时,请求会转发到其他节点;如果所有只读节点均不可用,请求会全部转发到主节点。只读节点异常可能导致主节点负载提高、响应时间变长,因此在读负载高的业务场景建议使用多个只读节点。只读节点发生...

读写分离版

建议与使用须知 当一个只读节点发生故障时,请求会转发到其他节点;如果所有只读节点均不可用,请求会全部转发到主节点。只读节点异常可能导致主节点负载提高、响应时间变长,因此在读负载高的业务场景建议使用多个只读节点。只读节点发生...

功能特性

创建实例 自动切换 在实例主节点发生故障时将自动切换,实现实例的故障自愈,切换通常需要30秒左右完成。主备切换 全量备份与全量恢复 对当前实例通过内存快照方式对全量数据进行备份并保存在云存储中,可通过全量恢复将数据恢复至备份时。...

新功能发布记录

2023-06-30 云盒计算资源配置最佳实践 维修事件 云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。2023-06-30 响应云盒维修事件 新增地域 新增以下两个地域:华东2...

容灾管理服务介绍

针对有高可用需求的用户,CADT容灾管理服务提供规划、优化、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行容灾演练,验证系统是否能够抵御资源故障或者AZ故障,保障系统健壮性。主要功能 容灾规划 在用户部署资源前,通过...

解读实例诊断报告

由于该值大于1.3,系统判断该实例的CPU使用率发生倾斜。某个数据节点存在较多的大Key。某个数据节点存在热点Key。设置的Hash Tag不合理。说明 当某些Key的Hash Tag设置相同时,这些Key会被存储在同一数据节点中。如果大量的Key设置相同的...

解读实例诊断报告

由于该值大于1.3,系统判断该实例的CPU使用率发生倾斜。某个数据节点存在较多的大Key。某个数据节点存在热点Key。设置的Hash Tag不合理。说明 当某些Key的Hash Tag设置相同时,这些Key会被存储在同一数据节点中。如果大量的Key设置相同的...

部署高可用及共享存储Web服务

1个公网负载均衡CLB:基于对流量按需分发的能力,可以将流量分发到不同的后端服务器,可消除系统中的单点故障,当某个服务器发生故障时,CLB会自动将请求分配到其他正常的服务器上,从而保证服务的连续性和稳定性。2个文件存储NAS:实现多...

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

数据库代理常见问题

数据库代理采用双主节点的高可用架构,流量连接按照1:1比例分发到两个节点当中,如果其中一个节点发生故障,将由另一个节点承担全部流量,并会自动触发故障节点重搭恢复任务,以确保数据库服务的高可用性。代理个数和代理规格是什么关系?...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

DescribeDedicatedHosts-查询专有宿主机详细信息

1 ActionOnMaintenance string 当专有宿主机发生故障时,为其所宿实例设置迁移方案。取值范围:Migrate:专有宿主机整机迁移至另一物理服务器,并对故障前非关机状态的实例进行启动。Stop:在当前专有宿主机上停止实例,确认无法修复专有宿...

DescribeDedicatedHosts-查询专有宿主机详细信息

1 ActionOnMaintenance string 当专有宿主机发生故障时,为其所宿实例设置迁移方案。取值范围:Migrate:专有宿主机整机迁移至另一物理服务器,并对故障前非关机状态的实例进行启动。Stop:在当前专有宿主机上停止实例,确认无法修复专有宿...

应用场景

以此,降低产品使用过程中故障发生概率,提高故障恢复效率,进而实现产品高可用性的有效提升。机房级容灾 同城双活 同一个城市,建设两个机房环境,两地距离 50 km 以内,万兆光纤专线互连,业务应用层面可以两个机房同时提供业务服务,当...

故障隔离

因为 B 的故障率更高,系统会优先将 B 隔离。此时,若将最大隔离数量调整为 2,则 A、B 均会被剔除。搜索故障隔离规则 支持从两个维度模糊搜索:应用名称 规则名称 编辑故障隔离规则 您可以随时编辑已创建的故障隔离规则,规则提交后实时...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 短信服务 商标服务 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用