数据安全

当其中一个加速地域出现故障时,可以将访问请求切换至其他距离用户时延较低、位置较近的加速地域进入全球加速网络中,实现加速地域间的故障容灾。如何配置CNAME解析,请参见 配置CNAME。全球加速联动DNS实现加速地域高可用容灾,请参见 ...

云盘版RDS MySQL实例存储空间缩容

本文介绍如何对云盘版RDS MySQL实例存储空间手动缩。缩的同时,支持降低RDS ESSD云盘的PL等级和实例规格。应用场景 当您对云盘版RDS MySQL实例的存储空间需求降低时,可以对实例存储空间缩,以降低成本。前提条件 实例满足以下条件:...

云盘版RDS MySQL实例存储空间缩容

当您对云盘版RDS MySQL实例的存储空间需求降低时,可参考本文,对实例存储空间手动缩,以便减少资源浪费,降低成本。缩的同时,支持降低RDS ESSD云盘的PL等级和实例规格。前提条件 实例满足以下条件:大版本:MySQL 5.7、8.0 小版本:...

分区和文件系统(Linux)

在ECS控制台上扩云盘容量后,对应分区和文件系统并未扩,您还需要进入ECS实例内部继续扩云盘的分区和文件系统,将扩部分的容量划分至已有分区及文件系统内,使云盘扩生效。本文为您介绍如何通过两个步骤完成Linux实例云盘的分区...

集群

但是,您可以添加触发逻辑,调用EMR OpenAPI实现对现有集群的扩。前提条件 已创建集群,详情请参见 创建集群。已获取集群ID,详情请参见 查看集群列表与详情。已创建AccessKey,详情请参见 获取AccessKey。已获取相应的SDK,Java SDK请...

EasyCkpt:AI大模型高性能状态保存恢复

功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的功能特点:特点1:任务的故障是部分的。通常,故障的根因是一到两台机器的故障,这只会影响部分Worker。对于大规模分布式训练任务而言,不会所有...

开启热备前后性能对比

热备RO与普通RO故障容灾的表现对比 本视频展示了在故障容灾场景下,普通RO与热备RO的性能差异对比。从视频中实验结果可知,在故障容灾failover场景(如主节点宕机)下,热备RO可以实现连接和事务不中断,且不出现中断报错。免费体验 阿里云...

修改套餐规格

为您介绍修改套餐规格的操作和注意事项,您可通过修改套餐规格实现实例扩缩。背景信息 修改套餐规格当前仅支持标准版(云盘)系列的实例。租户实例目前仅支持扩到 2 核 8GB,最低可缩至 1 核 4GB。套餐规格扩目前支持迁移变配和...

通过CADT实现NLB可用区级容灾演练

云速搭CADT(Cloud Architect Design Tools)灾管理服务提供规划、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行灾演练,验证系统是否能够抵御资源故障或者可用区故障,保障系统健壮性。本文为您介绍如何通过CADT实现...

读多写少型业务场景多活实践

与许多企业一样,该电商业务首次开始考虑灾建设,是源于一次商品应用的故障,导致导购页面长时间无法访问,电商业务瘫痪。虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始考虑...

什么是多活容灾

多活灾MSHA(Multi-Site High Availability)是在阿里巴巴电商业务环境演进出来的多活灾商业化产品,是应用高可用服务AHAS的核心模块,为客户提供灾架构建设能力。横向支持灾架构的上线、运维、演练、切流,升级到下线。纵向支持...

如何给静态邮件组扩

本文主要介绍如何扩静态邮件组以及批量管理邮件组。操作步骤 进入域管后台点击组织与用户>>点击邮件组管理>>找到需要扩的邮件组>>点击右侧的容量扩,此处的扩是指增加邮件组成员数量。如何批量管理邮件组?1、勾选邮件组列表左上角...

故障演练

故障演练的意义 故障演练将被灾保护的服务器在云上拉起并验证应用正确性,是灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被灾保护的应用可以在灾站点正常拉起。确保操作人员熟悉灾恢复流程,确保在生成站点真正...

故障演练

故障演练的意义 故障演练将被灾保护的服务器在云上拉起并验证应用正确性,是灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被灾保护的应用可以在灾站点正常拉起。确保操作人员熟悉灾恢复流程,确保在生成站点真正...

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启后,您就可以对受保护的服务器启动、停止灾复制、故障切换、灾演练等一系列的应用灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS灾服务支持业务的跨可用区(Availability Zone)的灾能力,对整体的应用做灾备份来应对单地区的故障,满足业务的...

设置存储自动扩

本页面为您介绍集群实例开启存储自动扩的操作步骤。背景信息 若您的业务涉及的数据量比较大,或者您的业务量波动较大且频繁,建议您开启存储自动扩能力。当存储即将出现溢出时,集群的存储空间可自动进行扩,保障线上业务的稳定性。...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS灾服务支持业务的跨可用区(Availability Zone)的灾能力,对整体的应用做灾备份来应对单地区的故障,满足业务的...

跨地域容灾

灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到灾站点。生产站点和灾站点部署在不同的地域,提供灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

跨地域容灾

灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到灾站点。生产站点和灾站点部署在不同的地域,提供灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

分区和文件系统(Windows)

在ECS控制台上扩云盘(系统盘或数据盘)容量后,对应分区的文件系统并未扩,您需要进入ECS实例内部继续扩云盘的分区和文件系统。本文为您介绍如何将Windows实例的云盘扩部分的容量用于扩原有分区或者新增分区。前提条件 已在ECS...

设计原则

数据灾生命周期管理 灾的建设维护是一个能力建设的过程,而不是简单的IT资源配置过程,数据灾的生命周期可以划分为灾设计、灾建设、日常维护三个阶段,对于单一业务系统的灾来讲,还可以包括下线终止阶段。灾设计:根据业务...

步骤七:故障切换

立即切换 该故障恢复会尝试停止保护组中被保护的实例,不会等待所有被保护的实例停止,也不会进行最后一轮数据同步,立即启动切换,会导致数据有部分丢失,主要用在故障容灾的场景。数据同步后切换 正向保护-故障切换 请参考以下步骤进行...

应用诊断

应用诊断是对应用的单独故障诊断,可以由链路诊断触发或人工触发。高可用管理平台通过应用诊断初步定位问题,锁定可疑应用,再通过 Arthas 和线程分析进一步确认问题。目前,应用诊断支持用户应用和蚂蚁应用。应用诊断是故障诊断的原子能力...

步骤七:故障切换

立即切换 该故障恢复会尝试停止保护组中被保护的实例,不会等待所有被保护的实例停止,也不会进行最后一轮数据同步,立即启动切换,会导致数据有部分丢失,主要用在故障容灾的场景。数据同步后切换 正向保护-故障切换 请参考以下步骤进行...

ScaleQuota-扩缩容资源配额

您可以通过ScaleQuota扩缩资源配额。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求语法 PUT/api/v1/...

设计方案

而红军则需要按照预先定义的故障响应和应急流程进行处置。在演练结束后,建议针对故障中的发现、响应、恢复三个阶段的时长和操作内容进行复盘,并梳理改进点进行优化,提升业务系统的稳定性。突袭演练 突袭演练是一种手段以及目标对红军不...

快速入门-ECS容灾

您可以通过云备份控制台对ECS实例进行跨地域、跨可用区的灾保护。本文介绍这两个场景涉及的主要步骤。使用云备份控制台进行ECS灾保护的流程如下所示:说明 跨地域灾和跨可用区灾的操作基本一致,此处以跨地域灾为例。开通云备份 ...

什么是复影实例?

复影实例是灾切换或故障演练过程中一个中间状态的实例,仅负责灾端对数据的实时写入,该实例只在数据复制阶段产生。当您确认故障切换完成后,复影实例自动会被删除。该实例由HDR官方镜像创建,操作系统、实例规格等可能与源端实例不同...

跨可用区容灾(Beta)

跨可用区(AZ)灾,即在同Region不同可用区部署同构的Hologres灾实例,如果生产实例所处的地理位置发生自然灾害,或者实例内部出现了故障导致生产实例无法正常对外提供读写服务,那么灾实例可以切换为生产实例,从而保障业务连续性。...

附录:SOFAStack 产品目录

同时满足异地灾、低成本快速扩的需求,能够解决传统集中式架构转型的困难,并通过打造大规模高可用分布式系统架构,来支撑金融业务创新。SOFAStack 由四大领域模块组成:分布式中间件、运维管理(应用 PaaS)、高阶运维保障、研发效能...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

DAS Auto Scaling弹性能力

例如出现了大量的慢SQL,慢SQL堵塞任务队列,且占用了大量的计算资源等,此时资深的数据库管理员首先想到的是紧急SQL流,而不是扩。在感知到实例资源不足时,DAS同样需要从错综复杂的问题中抽丝剥茧定位根因,基于根因做出明智的决策,...

自治中心

说明 例如在可流时间段(默认可流时间段为00:00~23:59)内,自定义触发条件为当CPU使用率大于70%,同时活跃会话数大于16,且该现象持续时间超过2分钟时触发自动流,同时自动开始跟踪,如果发现故障未消除,则自动回滚该流操作。...

ECS容灾常见问题

ECS灾中云盘异步复制和连续复制型灾的常见问题。ECS灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含...

ECS容灾常见问题

ECS灾中云盘异步复制和连续复制型灾的常见问题。ECS灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含...

一致性复制组概述

一致性复制组能够实现业务系统跨多块云盘的灾场景下,对多块云盘的异步复制做统一管理和操作,同时可以确保同一复制组内的多块云盘数据能够恢复到同一个时间点,以便实现灾场景下实例级别或者多实例级别的灾保护。本文为您介绍一致性...

云盘异步复制容灾常见问题

ECS灾中云盘异步复制灾的常见问题。ECS灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含entry和autoPL)...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,...细化责任拆解:设置主次责团队的故障分拆解逻辑,比如主次责团队默认按7:3比例拆分故障分。故障分统计默认排除:灾演练&全链路压测符合预期故障、特定打标过不参与故障统计的业务等。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
号码认证服务 数据库自治服务 云备份 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用