主备方案介绍

灾备方案 说明 单可用区高可用方案 主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统监控主备节点的健康状态并自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案 主备节点...

概述

分布式系统将计算任务和数据分布在多个节点上以实现更高的性能、可靠性和可扩展性,当一个节点发生故障或错误时,其他节点可以继续工作,相比于单机系统,架构本身就有较高的节点容错性。但随着服务拆分,更多组件的引入,分布式系统的复杂...

mPaaS 打多环境包时如何切换 config 配置文件

mPaaS 提供了多套开发环境间切换的能力,可以帮助开发者在多套开发环境间(如:开发 DEV/测试 TEST/体验 UAT/线上 PROD)方便自如地进行切换。下载 config 配置文件 前往 mPaaS 控制台 根据自身需求新建环境的工作空间。在各个工作空间中上...

设置宕机自动迁移

若您未开启宕机自动迁移,DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。警告 本地SSD型DDH(例如本地SSD型i2)不支持自行手动迁移和故障时自动迁移。如果本地SSD型DDH出现故障,您可以 提交工单 申请人工迁移,但迁移后本地...

什么是混合云容灾服务

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

修改端口回源设置

当您的主回源线路发生故障时,您可以在回源设置中,勾选 启用源站(备)切换到备用回源线路。关闭主备回源 当您不再使用主备回源功能时,可以在 回源设置 中,关闭 主备回源 开关。关闭主备回源后,您可以通过编辑转发规则来修改源站IP。...

灾备规划

RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,RPO就要求越小。RPO越小,往往要求数据备份、复制频率更高,对生产环境、网络的压力也会越大,成本通常也越高。RTO:指故障发生后,期望...

云产品事件触发器概述

数据库 云原生数据库PolarDB事件 云原生数据库PolarDB事件类型包括实例主备切换故障切换)、实例故障结束和实例故障开始等。云原生分布式数据库事件 云原生分布式数据库事件类型包括阿里云平台对资源执行的操作事件、API调用和控制台的...

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

云产品事件触发器概述

数据库 云原生关系型数据库PolarDB事件 云原生数据库PolarDB事件类型包括实例主备切换故障切换)、实例故障结束和实例故障开始等。云原生分布式数据库PolarDB-X事件 云原生分布式数据库事件类型包括阿里云平台对资源执行的操作事件、API...

阿里云官方事件源

数据库 云原生关系型数据库PolarDB事件 云原生数据库PolarDB事件类型包括实例主备切换故障切换)、实例故障结束和实例故障开始等。云原生分布式数据库PolarDB-X事件 云原生分布式数据库事件类型包括阿里云平台对资源执行的操作事件、API...

概述

子场景模型,可通过鼠标点击/SDK 提供的 API 的操作实现场景间切换从而实现场景漫游 标签:SDK 允许在编辑模式下进行图像的标注,标注后会一标签的形势存在,目前支持标注模式有图片,文本,音频、视频、链接、嵌入视频。全景图片:与平台...

应用场景

当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务,CLB 已在各地域部署了多可用区以实现同地域容灾。当...

基于ack-lingjun-aiast组件实现集群自动化运维

组件介绍 安装灵骏AI助手开启PAI的作业监控和恢复功能后,当发生故障或异常时,灵骏AI助手的告警系统可以自动和PAI进行交互,并上报故障信息,并根据故障触发阶段和并行策略选择规避故障的方法,自动隔离故障节点,并通过checkpoint快速...

名词解释

这种模式下,两个城市的三个数据中心互联互通,如果⼀个数据中心发生故障或灾难,其他数据中心可以正常运行并对关键业务或全部业务实现接管。命名空间 多活命名空间MSHA Namespace,是一个逻辑租户的概念,用于进行租户粒度的管控配置和云...

设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...

SA混合云存储阵列

故障恢复:支持故障切换故障恢复功能。当控制器故障时,支持在线故障切换,业务连续性不受影响。阿里云混合云存储阵列将云存储的高性价比和可扩展性与本地数据中心架构相结合,帮助客户轻松实现数据在本地数据中心和公共云之间的无缝流动...

创建DDH

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机...

功能特性

此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索分析 查询并导出SQL语句对应的日志信息。搜索 SQL洞察 SQL洞察聚类分析,用作深度异常的排查。SQL洞察 安全审计 内置了...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

创建专有宿主机

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机...

回切至本地VMware

故障切换 对话框,配置以下参数,然后单击 启动。参数名称 参数说明 IP地址 选择 保留当前IP 恢复点 选择恢复点,选择 当前时间 的默认选项。等待几分钟后,可以看到恢复的ECS已被成功拉起。您可以通过单击下图链接来查看机器的状态。在...

本地盘最佳实践

如果本地盘发生故障、物理服务器发生宕机,或者人为误操作,本地盘会丢失数据。请勿在本地盘上存储需要长期保存的业务数据。但云盘采用分布式三副本机制,能防止意外硬件故障导致的数据不可用。如果应用没有多节点数据冗余架构,强烈建议您...

mPaaS Android 工程如何在多套开发环境间切换

mPaaS Android 60 基线提供了多套开发环境间切换的能力,能够帮助开发者在多套开发环境间(如:开发 DEV/测试 TEST/体验 UAT/线上 PROD)方便自如地进行切换。涉及 mPaaS 的改动 对于 mPaaS 开发者,在切换开发环境的过程中,涉及到以下...

EasyCkpt:AI大模型高性能状态保存恢复

因此,在发生故障时,迫切需要一种以低成本的方法来保存最新的Checkpoint。这样在重新启动训练时就无需重复计算,从而减少时间和成本的浪费。功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的...

DATASOURCE:ECS:DedicatedHosts

无 ActionOnMaintenance String 当专有宿主机发生故障或者在线修复时,为其所宿实例设置迁移方案。取值:Migrate:迁移实例到其他物理机并重新启动实例。Stop:在当前专有宿主机上停止实例,确认无法修复专有宿主机后,迁移实例到其他物理...

MSE注册配置中心高可用最佳实践

当其中某个实例故障时,节点秒级完成切换故障节点自动离群。专业版注册配置中心基于Nacos 2.0新架构基础之上,在高可用方面降低了对底层基础设施的依赖,进一步提升了容灾能力。相关内容,请参见 版本选型。多可用区 MSE每个地域都包含...

云数据库Redis版是否支持主从节点的故障切换

云数据库Redis版支持自动执行主从节点的故障切换。主从(Master-Replica)节点之间的同步和故障切换,由系统来自行管理,无需用户来维护。

跨可用区容灾(Beta)

当生产实例发生故障且容灾实例处于待机状态时,您可根据实际情况自行判断是否将容灾实例切换成主实例。重要 生产实例故障时,如存在部分数据未同步至容灾实例。容灾实例异常切换成主实例后,将缺失这部分数据。因此,您在进行异常切换时,...

通过CADT实现NLB可用区级容灾演练

NLB实例的 可用区J 发生故障时,NLB能够在短时间内停用该可用区,并继续使用其他启用的可用区提供服务。步骤四:容灾切回演练 容灾切回功能:NLB可用区故障恢复后,验证NLB的容灾恢复能力。容灾切回概念:与容灾切换相反,将资源切回到执行...

归档存储服务等级协议

赔偿方案 阿里云对用户存在故障的每个Archive按不可用时间的100倍赔偿,即赔付金额=发生故障的Archive故障前24小时平均每分钟费用×不可用时间×100倍;其中:(1)赔偿只针对使用归档存储服务已产生费用的用户,以归档存储代金券的形式赔偿,...

通过CADT实现ALB可用区级容灾演练

ALB实例的乌兰察布 可用区A 发生故障时,ALB能够在短时间内停用该可用区,并继续使用其他启用的可用区提供服务。步骤四:容灾切回演练 容灾切回功能:ALB可用区故障恢复后,验证ALB的容灾恢复能力。容灾切回概念:与容灾切换相反,将资源切...

回切至本地物理机

故障切换 面板,填写 CPU、内存 信息、选择 恢复网络、IP地址、是否 使用SSD、选择 恢复点、弹性公网IP、切换后执行脚本。注意 当前时间 恢复点只能使用一次。在弹出的 完成故障切换 对话框,单击 确定。本地恢复 注意 目前仅支持本地...

步骤三:设置网络与安全

重要 当选择的 生产站点网络 和 容灾站点网络 网段不一致,这会导致在进行"故障切换"或"故障恢复"操作的时候IP地址不一致。创建完成后,您可以在 交换机映射 页签找到已创建的交换机映射。如配置有误,您可以单击该交换机映射右侧对应的...

操作流程

本文介绍使用云盘异步复制容灾的基本操作流程。操作流程 在云备份服务控制台,实现对关键应用的容灾保护,主要步骤包括如下:步骤一:资源规划。...该模式适用于生产站点确实发生短时无法恢复的故障,需立即切换至容灾站点的场景。

操作流程

本文介绍使用云盘异步复制容灾的基本操作流程。操作流程 在混合云容灾服务控制台,实现对关键应用的容灾保护,主要步骤包括如下:步骤一:资源规划。...该模式适用于生产站点确实发生短时无法恢复的故障,需立即切换至容灾站点的场景。

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

主从(备)切换原因

实例故障 阿里云检测到实例发生故障,无法正常使用,系统会发起主从(备)切换,及时恢复业务正常运转,缩小故障影响范围。主从(备)切换完成后,实例状态会显示运行中,您不需要进行任何操作,实例可以正常运行。您可以在 服务可用性 ...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用高可用服务 云数据库 OceanBase 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用