什么是应用高可用服务AHAS

使用场景 架构 容灾能力 适用场景 同城多活 RPO:地域级故障不可控;机房级故障为秒~分钟级。RTO:地域级故障不可控;机房级故障为分钟~十分钟级。说明 具体以主备数据同步延迟的情况而定。预算有限,不考虑异地容灾。期望建设周期短(≤2...

设计原则

如网络延迟、硬件故障、软件错误、突峰流量等,建议在系统设计阶段就要从这些异常事件引起的系统执行“失败”出发,提供冗余、隔离、降级、弹性等能力,旨在确保系统的高可用性和高可靠性,以应对不可避免的故障和意外发生。面向精细的运维...

什么是消息演练

随着应用规模的扩大,系统得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一环。这些消息服务之前并没有在系统中实际经历过真实流量考验,其中某些隐患或缺陷很难被发现...

JVM注入动态脚本

public class UserServiceInterceptor {/必须包含该方法,且该方法的定义不可改变(返回值、类名、参数均不可改变)。参数context包含的内容参⻅《脚本入参说明》。public Object run(Map,Object>context){/获取getUserById方法的实际入参/...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

设计方案

系统可预见的稳定性风险包含软硬件故障不可预期的流量,小到线程级风险,大到地域级灾难,从此出发可通过容灾、容错、容量三方面建立系统架构稳定性。容灾 容灾就是在灾难发生时,在保证生产系统的数据尽量少丢失的情况下,保持生存系统...

MSE注册配置中心高可用最佳实践

剩余Provider节点负载高,大概率也会发生故障。最终所有Provider节点故障,100%无法提供服务。有容灾保护 当来自Consumer端的请求量突然增加时,如果Provider容量水位较高,导致个别Provider发生故障:注册中心会将故障节点摘除,全量...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

立即备份

背景信息 物理备份:物理备份是指转储 OceanBase 的物理文件包含基线数据、日志归档数据等,一旦数据库发生故障,可以利用这些文件进行数据库恢复。逻辑备份:逻辑备份是指数据库对象级备份,支持表、库两种维度的备份。库级备份时,针对...

管理报警规则列表

通过时间筛选查看某一时间区间内的 报警历史 信息,包括:产品类型、故障资源、发生时间、持续时间、规则名称、通知方式、状态、通知对象、报警回调。并对该规则进行 禁用 或 删除 操作。说明 查询近 90 天以内的报警历史信息,查询...

代码逻辑场景

受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比,也代表每次请求发生故障的概率。填写小于或等于0,则表示100%发生故障。说明 仅填写百分比数字部分即可,即80%,填写80。请求过滤规则 否 无 通过脚本...

集群系列

更灵活 节点的灵活部署 相比基础系列和高可用系列的固定节点形态,RDS MySQL集群系列实例实现了节点数可变的拓扑管理。可在创建实例后,根据业务需求灵活增删节点,变更节点配置,实现更优的性价比。详情请参见 增加实例节点、删除实例节点...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

高性能版实例

即使计算节点发生故障,也可以保证实例无数据丢失。高可用 AnalyticDB PostgreSQL版 高性能版由于减少了一个副本,在高可用方面出现了一些下降,在物理机故障等极端情况下,集群恢复的时间会长(8小时以内)。高性能版通过ESSD多副本技术...

网络架构容灾

当地址池中地址发生故障时,HealthCheck模块会准确的检测到异常情况并与DNS交互(如下图中序号3所示),摘除故障地址(如下图中序号4所示),这样用户端会自动解析到可用的地址池(如下图中序号5所示)。并当故障地址恢复时,自动恢复至...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 面板,选择 恢复...

归档存储服务等级协议

不可用时间:归档存储所提供的服务在连续的5分钟或更长时间不可使用方计为不可用时间,不可使用的服务时间低于5分钟的,不计入不可用时间。归档存储不可用时间不包括日常系统维护时间、由用户原因、第三方原因或不可抗力导致的不可用时间。...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。容灾演练操作步骤如下:登录 混合云容灾管理控制台。单击 切换到连续复制型容灾。在 概览 页面,单击目标容灾站点对。在容灾中心页面,单击 受...

诊断规则

而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现故障的快速定位与处理。本节将向您介绍诊断规则的相关操作。诊断规则是诊断节点的构成,诊断规则...

查看及管理资产专题

本文为您介绍如何查看及管理资产专题详情。权限说明 超级管理员、运营管理员、专题管理员可查看及管理所有资产专题详情,包括编辑、删除资产专题、创建专题...移出专题:将选中的资产对象批量从当前专题移除,移除操作不可撤销,请谨慎操作。

查看及管理资产专题

本文为您介绍如何查看及管理资产专题详情。权限说明 超级管理员、运营管理员、专题管理员可查看及管理所有资产专题详情,包括编辑、删除资产专题、创建专题...移出专题:将选中的资产对象批量从当前专题移除,移除操作不可撤销,请谨慎操作。

存储空间概述

✓×保留策略 OSS支持WORM特性,允许用户以“不可删除、不可篡改”方式保存和使用数据,符合美国证券交易委员会(SEC)和金融业监管局(FINRA)的合规要求。✓ ✓ 服务器端加密 当您在设置了服务器端加密的存储空间(Bucket)中上传文件...

数据容灾

当断网、断电或者发生灾难事件导致某个机房可用时,仍然能够确保继续提供强一致性的服务能力,整个故障切换过程用户无感知,业务中断、数据丢失,可以满足关键业务系统对于“恢复时间目标(RTO)”以及“恢复点目标(RPO)”等于0的...

观测性的设计原则

在云原生、微服务等技术越发流行的今天,系统的观测性得越来越复杂。云上的观测性主要从监控指标、链路追踪、日志记录、监控看板和事件告警五大方面来进行设计,从而实现云上全方面的观测性体系能力建设。监控指标 系统需要收集和...

常见问题

OSS支持WORM(Write Once Read Many)特性,允许您以不可删除、不可篡改的方式保存和使用数据。用户可针对Bucket设置基于时间的合规保留策略。当策略锁定后,用户可以在Bucket中上传和读取Object,但是在Object的保留时间到期之前,任何...

强弱依赖治理概述

如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的时候,将导致商品详情页部分内容加载全,出现如下图的情况,但核心业务流程仍继续推进,用户体验并未受到太多影响。通过以上对比可以看出,当下游依赖...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

使用报警服务

查看目标报警规则的报警历史 您可以查看指定报警规则中的所有故障资源的报警详情和报警图表,及时定位并处理资源故障。使用阈值报警回调 云监控除了 电话、短信、邮件和WebHook的报警通知方式外,还可以使用报警回调方式,实现将云监控发送...

OSS文件上传和下载失败的排查方法

概述 本文主要介绍阿里云对象存储OSS文件上传和下载失败的排查方法。详细信息 当您访问OSS出错时,OSS会返回3xx、4xx或者5xx的HTTP状态码,您可以通过状态码进行排查处理。在使用OSS SDK上传或下载文件时,如发生报错,请参见 OSS SDK使用...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

什么是故障演练

适用场景 故障演练适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

实例的节点故障处理机制

说明 Mongos节点采用单节点架构,当某个Mongos节点发生故障,该节点相关服务可用。在生产环境的应用程序请勿连接单个Mongos节点,推荐使用Connection String URI连接所有Mongos节点。当使用Connection String URI进行连接时,如果某个...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

应用场景

当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务,CLB 已在各地域部署了多可用区以实现同地域容灾。当...

高可用和容灾设计

如果实例只有一个备节点,在故障节点恢复之前,集群可读地址不可访问。如果实例有多个备节点,集群可读地址在故障切换过程中只会有一次闪断,剩余的备节点将分担读请求。因此,推荐实例配置多个备节点,保障集群可读地址在故障切换场景下可...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
对象存储 云数据库 Redis 版 商标服务 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用