前言

稳定:无论在何种环境都无法避免单个组件故障发生。稳定的目标就是要尽量降低单个组件故障对业务带来的整体影响。该支柱侧重于如何让业务系统利用现代云平台的基础设施达到高可用,做到面向失败设计,具备一定容灾的能力。同时把控...

名词解释

这种模式下,两个城市的三个数据中心互联互通,如果⼀个数据中心发生故障或灾难,其他数据中心可以正常运行并对关键业务或全部业务实现接管。命名空间 多活命名空间MSHA Namespace,是一个逻辑租户的概念,用于进行租户粒度的管控配置和云...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

使用Hint语法

执行该命令后,后续所有命令只发往rr-bpxxxxx实例,如果这个实例发生故障,则返回报错 set force node 'rr-bpxxxxx' is not found,please check.说明 通常不建议使用/*force_proxy_internal*/语法,会导致后续所有请求都发往该实例,读写...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致和业务可用。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

什么是混合云容灾服务

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

故障管理

故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续形成改进,避免历史同类故障重复发生。最佳实践 运维事件中心是阿里云提供的云上故障管理服务。制定故障应急响应流程机制。可...

应用场景

物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...

HINT语法使用说明

例如/*force_proxy_internal*/set force_node='pi-bpxxxxxxxx',执行该命令后,后续所有查询命令只发往 pi-bpxxxxxxxx 节点,如果该节点发生故障,则返回报错 set force node 'rr-bpxxxxx' is not found,please check.当开启列存和行存...

使用须知

本地盘实例可靠取决于宿主机可靠,当发生单点故障时,ENS会进行同节点迁移帮助实例尽快恢复连通,不保证数据可靠。单个边缘节点无法连通时,ENS会根据用户需求进行跨节点迁移帮助用户尽快恢复区域内连通,实例ID不变、实例IP改变,不...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域灾害导致的系统故障,保障业务的可用,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域灾害导致的系统故障,保障业务的可用,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

本地盘最佳实践

如果本地盘发生故障、物理服务器发生宕机,或者人为误操作,本地盘会丢失数据。请勿在本地盘上存储需要长期保存的业务数据。但云盘采用分布式三副本机制,能防止意外硬件故障导致的数据不可用。如果应用没有多节点数据冗余架构,强烈建议您...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致和业务可用。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致和业务可用。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

FM算法

详细预测信息列名 详细预测信息列的名称。保持列 保存至输出结果表的列。高级选项 仅在 Designer 控制台,需要配置该参数。如果选中 高级选项 复选框,则 每个Worker预测使用的线程数目、模型大小类型 生效。每个Worker预测使用的线程数目 ...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致和业务可用。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

灾备规划

RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,RPO就要求越小。RPO越小,往往要求数据备份、复制频率更高,对生产环境、网络的压力也会越大,成本通常也越高。RTO:指故障发生后,期望...

功能概览

跨地域容灾 容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务连续保障,有效避免...

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...

阿里云弹性预测 AHPA 助力厨芯科技降本增效

企业需求与痛点 厨芯科技...关于 AHPA AHPA 是阿里云容器服务 ACK 与达摩院合作推出的容器智能弹性预测产品,可以根据业务历史指标,自动识别弹性周期并对容量进行预测,帮您提前进行弹性规划,解决弹性滞后的问题。详细介绍请见:AHPA概述

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

单节点架构

单节点架构只有一个副本,极端情况下如发生故障会造成30分钟左右服务不可用状态,建议您在生产环境中使用副本集架构或分片集群架构。问:单节点实例是否支持增量数据迁移与同步、按时间点创建实例恢复数据功能?答:不支持。云数据库...

sequential_uuid

说明 具有顺序模式的UUID生成器增加了UUID的可预测性,且增大了发生跨机冲突的概率。更多顺序UUID优势请参见 Sequential UUID Generators。sequential_uuid的主要目标是生成更具顺序性的UUID生成器,且不会过多地降低随机性(随机性降低...

sequential_uuid

说明 具有顺序模式的UUID生成器增加了UUID的可预测性,且增大了发生跨机冲突的概率。更多顺序UUID优势请参见 Sequential UUID Generators。sequential_uuid的主要目标是生成更具顺序性的UUID生成器,且不会过多地降低随机性(随机性降低...

什么是全局流量管理?

⑤ 容灾预案:容灾预案可以帮助用户实现容灾演练,或发生故障时快速切换访问流量,包括创建容灾预案、执行/回滚等相关信息。系统架构 全局流量管理是由管控层和解析层两部分组成:管控层:管控层通过控制台和OpenAPI对外提供服务,主要实现...

网络游戏:心动网络股份有限公司

同时在主实例发生故障的时候,系统能在短时间(30s~60s)内完成快速切换,确保在线业务能够在保证数据完整的同时快速恢复以提供正常的服务。丰富的业务支持 PolarDB 能够100%兼容MySQL 5.6、MySQL 5.7和MySQL 8.0,完全兼容MySQL各种生态...

sequential_uuid

说明 具有顺序模式的UUID生成器增加了UUID的可预测性,且增大了发生跨机冲突的概率。更多顺序UUID优势请参见 Sequential UUID Generators。sequential_uuid的主要目标是生成更具顺序性的UUID生成器,且不会过多地降低随机性(随机性降低...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续保障,有效避免了地域...

一致复制组概述

容灾站点 除了生产站点以外另外建立容灾站点,当生产站点发生故障时,容灾站点可以接管业务,实现业务不间断。恢复点目标(RPO)由于云盘异常可能丢失的数据量,以时间为单位,是异步复制功能的数据指标之一(一致复制组功能的RPO默认为...

研发效能,我们怎么衡量?

纵向上,交付需求的圆点越向下越好,反映出周期时间越短、响应能力越快,可预测性越好;2.横向上,交付需求的圆点分布越密越好,反映出需求在频繁地交付,即发布频率越高;3.横向上,交付需求的圆点分布越均匀越好,反映出需求在持续稳定地...

流量回放和压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

智能压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致和业务可用。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

跨可用区容灾(Beta)

跨可用区(AZ)容灾,即在同Region不同可用区部署同构的Hologres容灾实例,如果生产实例所处的地理位置发生自然灾害,或者实例内部出现了故障导致生产实例无法正常对外提供读写服务,那么容灾实例可以切换为生产实例,从而保障业务连续。...

网络游戏:厦门真有趣信息科技有限公司

在主实例发生故障的时候,系统能在短时间(30s~60s)内完成快速切换,确保在线业务能够快速恢复以提供正常的服务。高度兼容 PolarDB 能够100%兼容MySQL 5.6、5.7和8.0,完全兼容MySQL各种生态和中间件开源工具,非常方便游戏历史战绩查询、...

应用场景

系统稳定差,任何一个下游发生故障,将直接影响整个业务系统的可用。为提升核心应用用户体验和稳定,您可以通过DTS提供的数据订阅,将深耦合业务优化为通过实时消息通知实现的异步耦合,让核心业务逻辑更简单可靠,具体调整为:该...

变更管理简介

有计划、受管控的变更操作降低故障发生率、业务连续异常。规范变更准备及变更方案,提高变更成功率与可靠。变更有记录,所有变更可回溯。核心功能 针对变更操作的审批管控以及所有变更记录 基础配置:支持自定义配置变更系统、变更类型...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 云服务器 ECS 轻量应用服务器 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用