同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

FAQs

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM能在 3分钟左右 准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、...

常见问题-FAQ

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM最快可在1分钟左右准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。容灾演练操作步骤如下:在左侧导航栏,选择 连续复制型容灾>云上容灾。在页面右上角,选择容灾站点对。单击容灾中心的 受保护服务器 页签。单击...

功能概览

跨地域容灾 容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免...

通信能力技术服务协议

您不得利用阿里从事以下活动:未经允许,进入受保护的计算机信息网络或者使用计算机信息网络资源的。未经允许,对计算机信息网络功能进行删除、修改或者增加的。未经允许,对进入计算机信息网络中存储、处理或者传输的数据和应用程序进行...

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

使用API终止和恢复VBR来确认冗余物理专线

当一条物理专线发生故障后,健康检查辅助系统自动切换业务流量到另外一条正常的物理专线上,从而保障您的业务高可用。自动切换的时间周期受您的VPC路由条目数量的影响。通常情况下,您的业务可以在12秒内完成自动切换。下表列出本地IDC通过...

归档存储服务等级协议

赔偿方案 阿里云对用户存在故障的每个Archive按不可用时间的100倍赔偿,即赔付金额=发生故障的Archive故障前24小时平均每分钟费用×不可用时间×100倍;其中:(1)赔偿只针对使用归档存储服务已产生费用的用户,以归档存储代金券的形式赔偿,...

监控、诊断和故障排除

另外,通过日志的时间戳,不仅可以迅速查找和定位日志范围,还能够了解在请求发生时间点范围内,客户端应用、网络或者服务系统发生的其他事件,有利于问题的分析和调查。RequestID OSS服务会为接收的每个请求分配唯一的服务器请求ID,即...

OSS文件上传和下载失败的排查方法

若存在网络故障,请使用ping命令测试与OSS的网络连通性,确保网络正常后再进行下一步排查。检查上传文件的大小是否超过限制。通过OSS控制台上传、简单上传、表单上传、追加上传的方式上传单个文件,文件的大小不能超过5 GB。如要上传超过5 ...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

网络诊断

信息采集:网络诊断采集运行时信息网络协议栈信息以及网络基础设施的相关信息。采集不同的数据和信息,以便于排查故障和网络分析。链路模拟:网络诊断通过在ECS上执行命令或在集群中下发collector Pod的形式,收集网络诊断所经过的节点或...

基于多集群实现跨地域容灾和流量负载均衡

跨地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现跨地域容灾。以Bookinfo应用为例,本文介绍如何使用跨地域故障转移和流量分布能力实现跨地域容灾和流量负载均衡。网络规划 在进行操作前,您需要对vSwitch...

基于多集群实现跨地域容灾和流量负载均衡

跨地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现跨地域容灾。以Bookinfo应用为例,本文介绍如何使用跨地域故障转移和流量分布能力实现跨地域容灾和流量负载均衡。网络规划 在进行操作前,您需要对vSwitch...

RDS SQL Server异地容灾

RDS SQL Server提供了异地容灾方案,可以将源实例的业务数据自动同步至容灾实例中,当源实例所在地域的RDS实例发生故障时,可手动切换系统到容灾地域的RDS实例上,从而保障业务的连续性和可用性。前提条件 已在地域A和地域B分别创建了RDS ...

轻量应用负载均衡概述

当其中一部分轻量应用服务器发生故障后,负载均衡会自动屏蔽故障的轻量应用服务器,将请求分发给正常运行的轻量应用服务器,保证应用程序仍能正常工作。弹性管理应用程序的服务能力。您可以根据业务发展的需要,自行添加或移除轻量应用负载...

本地盘最佳实践

如果本地盘发生故障、物理服务器发生宕机,或者人为误操作,本地盘会丢失数据。请勿在本地盘上存储需要长期保存的业务数据。但云盘采用分布式三副本机制,能防止意外硬件故障导致的数据不可用。如果应用没有多节点数据冗余架构,强烈建议您...

DATASOURCE:ECS:DedicatedHosts

无 ActionOnMaintenance String 当专有宿主机发生故障或者在线修复时,为其所宿实例设置迁移方案。取值:Migrate:迁移实例到其他物理机并重新启动实例。Stop:在当前专有宿主机上停止实例,确认无法修复专有宿主机后,迁移实例到其他物理...

词汇表

这意味着如果一个可用区发生故障,其他可用区仍能保持正常运行,从而保证了高可用性。同一地域内的不同可用区之间内网互通,使用低时延链路相连。不同地域之间的可用区完全隔离。下图以地域1(包含3个可用区)和地域2(包含3个可用区)为例...

网络架构容灾

网络是数字世界的基础设施,没有网络的联通,所有信息都无法交互,因此网络架构的设计在应用系统中至关重要,特别是针对网络架构的高可用及容灾能力的设计,是业务在异常发生时,实现快速恢复、降低业务损失的关键。云上网络规划设计 为...

查看详细信息

运营商/网络 崩溃发生时设备接入的运营商和网络信息。国家/地区 崩溃发生时设备所处的地理位置,根据IP推算。省份/地市 崩溃发生时设备所处的省份、地市。用户IP 崩溃发生时设备的公网IP。分辨率 崩溃发生设备的屏幕分辨率。页面 崩溃发生...

通过Mongo Shell连接MongoDB副本集实例

如果您需要使用专有网络,但ECS实例的网络类型为 经典网络,您可以将ECS实例网络类型转换为专有网络,具体请参见 ECS实例从经典网络迁移到专有网络。将客户端IP地址添加至云数据库MongoDB实例的白名单中,添加方法请参见 设置白名单。如果...

EasyCkpt:AI大模型高性能状态保存恢复

因此,在发生故障时,迫切需要一种以低成本的方法来保存最新的Checkpoint。这样在重新启动训练时就无需重复计算,从而减少时间和成本的浪费。功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的...

数据库代理常见问题

数据库代理采用双主节点的高可用架构,流量连接按照1:1比例分发到两个节点当中,如果其中一个节点发生故障,将由另一个节点承担全部流量,并会自动触发故障节点重搭恢复任务,以确保数据库服务的高可用性。数据库代理的性能会随着代理连接...

围绕混沌工程的平台实践

因此混沌工程是一门学科,它提供了基本的理论指导,而故障演练是混沌工程的具体实践,通过向目标系统注入真实可能发生故障来考量系统的稳定性。混沌工程和AHAS Chaos AHAS Chaos是以混沌工程为理论指导的故障演练平台,目标是成为混沌...

自动或手动主备切换

当主实例发生故障或不可用时(例如操作系统错误、硬件故障等),系统会自动触发主备切换,主实例和备实例将进行互换,切换后实例地址保持不变,应用程序会自动连接到新的主实例(原备实例),从而保障业务的连续性和高可用性。此外,您还...

查看HTTP/网络错误

运营商/网络 网络请求发生时设备接入的运营商和网络信息。国家/地区 网络请求崩溃发生时设备所处的地理位置,根据IP推算。省份/地市 网络请求发生时设备所处的省份、地市。用户IP 网络请求发生时设备的公网IP。分辨率 网络请求发生设备的...

健康检查

警告 关闭健康检查后,ALB 不再检查后端服务器,一旦某台后端服务器发生故障,则无法实现访问流量自动切换至其他正常的后端服务器。如延长健康检查的间隔时间,后端服务器出现故障时,ALB 发现故障后端服务器的时间也会变长。方式二:通过...

金融行业最佳实践

金融两地三中心 业务挑战:金融源站往往采用两地三中心的架构,当某个源站发生故障时,需要快速地将业务切换到其他可用源站,保障业务的连续性和稳定性。方案优势:阿里云DCDN提供多源负载均衡能力,实现多源异地灾备,可以按照主备、权重...

网络规划

您可以根据以下两点规划交换机:使用一个VPC时,也请尽量使用至少两个交换机,并且将两个交换机分布在不同可用区,这样当其中一个可用区的交换机发生故障时,可以切换到另一个可用区的交换机,从而实现跨可用区容灾。同一地域不同可用区...

步骤1:创建实例

设置项 说明 实例类型 高可用:具有多副本,支持高可用,当主节点发生故障后能够自动切换节点。适用于数据有可靠性要求场景。单副本:仅单副本,适用于测试、开发以及对数据可靠性无要求的场景。版本兼容性 根据需求选择兼容的Redis版本。...

创建系统事件报警规则

背景信息 智能接入网关支持以下系统事件:事件类型 事件名称 详情 维护 接入点切换 AccessGatewayFailover 设备发生主备切换 DeviceSwitched 设备WAN链路切换 DeviceWanLinkSwitched 异常 设备被攻击 DeviceHacked 设备链路故障 ...

基本概念

当某一节点的服务器发生故障导致不可用时,将立即停止宣告已不可用的IP段,数据包将仍然按照距离最短的原则路由至最近的服务节点。简单来说,一般情况下来自中国香港的用户访问流量默认都将被路由至阿里云中国香港高防流量清洗中心进行处理...

分配辅助私网IP地址

故障转移场景:当实例发生故障时,您可以将辅助弹性网卡从故障实例解绑并绑定至备用实例,通过其辅助私网IP访问的请求流量也随之切换到备用实例,实现故障转移。负载均衡场景:通过为实例分配多个辅助私网IP地址,可以实现负载均衡机制,将...

发现和排查实例问题

合理使用监控相关的功能可以帮助您及时发现和排查实例问题,在故障发生前处理掉潜在风险,避免影响业务。诊断实例的健康状态 实例健康诊断功能可以全方位诊断实例的操作系统配置、网络状态、磁盘状态等。诊断报告中针对异常诊断项目的影响...

集群高可用架构推荐配置

多可用区的地域:所有托管组件均严格采用多副本、多AZ均衡打散部署策略,确保在单个可用区或节点发生故障时,集群仍然能够正常提供服务。单可用区地域:所有托管组件均严格采用多副本、多节点打散部署策略,确保在单个节点发生故障时,集群...

遗嘱消息

设备异常断开的场景:因为网络故障或波动,设备在保持连接周期内未能通讯,所以MQTT连接被服务端关闭。设备意外掉电,服务端识别到网络断开。设备尝试进行不被允许的操作而被服务端关闭MQTT连接,例如订阅自身权限以外的主题等。使用场景 ...

部署高可用及共享存储Web服务

1个公网负载均衡CLB:基于对流量按需分发的能力,可以将流量分发到不同的后端服务器,可消除系统中的单点故障,当某个服务器发生故障时,CLB会自动将请求分配到其他正常的服务器上,从而保证服务的连续性和稳定性。2个文件存储NAS:实现多...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
NAT网关 弹性公网IP 共享流量包 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用