不可变对象发生故障怎么办-不可变对象发生故障怎么办文档介绍内容-阿里云

什么是应用高可用服务AHAS

使用场景架构容灾能力适用场景同城多活 RPO：地域级故障不可控；机房级故障为秒~分钟级。RTO：地域级故障不可控；机房级故障为分钟~十分钟级。说明具体以主备数据同步延迟的情况而定。预算有限，不考虑异地容灾。期望建设周期短（≤2...

设计原则

如网络延迟、硬件故障、软件错误、突峰流量等，建议在系统设计阶段就要从这些异常事件引起的系统执行“失败”出发，提供冗余、隔离、降级、弹性等能力，旨在确保系统的高可用性和高可靠性，以应对不可避免的故障和意外发生。面向精细的运维...

什么是消息演练

随着应用规模的扩大，系统变得越来越复杂，不可避免地会走向分布式化。各种中间组件会相继被引入系统，其中分布式消息服务更是系统中必不可少的一环。这些消息服务之前并没有在系统中实际经历过真实流量考验，其中某些隐患或缺陷很难被发现...

JVM注入动态脚本

public class UserServiceInterceptor {/必须包含该方法，且该方法的定义不可改变(返回值、类名、参数均不可改变)。参数context包含的内容参⻅《脚本入参说明》。public Object run(Map,Object>context){/获取getUserById方法的实际入参/...

功能概述

数据库发生故障后，无法在发生故障时定位到原因，可以通过智能压测功能，在克隆库上复现故障场景，定位故障原因。功能架构智能压测的功能架构如下图所示：源数据库：将要进行大促、将要业务变更或者已经发生故障，需要进行流量捕获的数据...

设计方案

系统可预见的稳定性风险包含软硬件故障和不可预期的流量，小到线程级风险，大到地域级灾难，从此出发可通过容灾、容错、容量三方面建立系统架构稳定性。容灾容灾就是在灾难发生时，在保证生产系统的数据尽量少丢失的情况下，保持生存系统...

MSE注册配置中心高可用最佳实践

剩余Provider节点负载变高，大概率也会发生故障。最终所有Provider节点故障，100%无法提供服务。有容灾保护当来自Consumer端的请求量突然增加时，如果Provider容量水位较高，导致个别Provider发生故障：注册中心会将故障节点摘除，全量...

灾备方案

Tair 容灾架构演进当 Tair 实例因不可预料的原因（例如设备故障、机房断电等）发生故障，容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择，可满足不同的业务场景。图 1.Tair 容灾架构演进灾备方案灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进当云数据库Redis实例因不可预料的原因（例如设备故障、机房断电等）发生故障，容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择，可满足不同的业务场景。图 1.Redis容灾架构...

立即备份

背景信息物理备份：物理备份是指转储 OceanBase 的物理文件包含基线数据、日志归档数据等，一旦数据库发生故障，可以利用这些文件进行数据库恢复。逻辑备份：逻辑备份是指数据库对象级备份，支持表、库两种维度的备份。库级备份时，针对...

管理报警规则列表

您可通过时间筛选查看某一时间区间内的报警历史信息，包括：产品类型、故障资源、发生时间、持续时间、规则名称、通知方式、状态、通知对象、报警回调。并对该规则进行禁用或删除操作。说明可查询近 90 天以内的报警历史信息，查询...

代码逻辑场景

受影响的请求占比（%）否 0 限制发生故障的请求数占所有应该发生故障请求数的百分比，也可代表每次请求发生故障的概率。填写小于或等于0，则表示100%发生故障。说明仅填写百分比数字部分即可，即80%，填写80。请求过滤规则否无通过脚本...

集群系列

更灵活节点的灵活部署相比基础系列和高可用系列的固定节点形态，RDS MySQL集群系列实例实现了节点数可变的拓扑管理。可在创建实例后，根据业务需求灵活增删节点，变更节点配置，实现更优的性价比。详情请参见增加实例节点、删除实例节点...

跨地域容灾

容灾系统部署在阿里云的两个地域中，当生产站点发生故障（例如海啸、地震）时，业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域，提供容灾即服务，RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障，有效避免了地域性...

主备方案介绍

主备容灾：当云数据库HBase实例因不可预料的原因（例如设备故障、机房断电断网等）发生故障，容灾机制可用于保障数据的一致性和业务可用性。功能优势主备双活：请求低毛刺。故障自动容错。资源利用率高。主备容灾：支持云数据库HBase、EMR...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时，能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下，数据的完整性、可恢复性和可用性不受到严重影响，以保障业务的持续运行和数据的...

跨地域容灾

容灾系统部署在阿里云的两个地域中，当生产站点发生故障（例如海啸、地震）时，业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域，提供容灾即服务，RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障，有效避免了地域性...

高性能版实例

即使计算节点发生故障，也可以保证实例无数据丢失。高可用 AnalyticDB PostgreSQL版高性能版由于减少了一个副本，在高可用方面出现了一些下降，在物理机故障等极端情况下，集群恢复的时间会变长（8小时以内）。高性能版通过ESSD多副本技术...

网络架构容灾

当地址池中地址发生故障时，HealthCheck模块会准确的检测到异常情况并与DNS交互（如下图中序号3所示），摘除故障地址（如下图中序号4所示），这样用户端会自动解析到可用的地址池（如下图中序号5所示）。并当故障地址恢复时，自动恢复至...

跨可用区容灾

确保操作人员熟悉容灾恢复流程，确保在主站真正发生故障时，操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练：在受保护服务器页签，单击要启动容灾演练服务器右侧对应的操作列表下的容灾演练。在容灾演练面板，选择恢复...

归档存储服务等级协议

不可用时间：归档存储所提供的服务在连续的5分钟或更长时间不可使用方计为不可用时间，不可使用的服务时间低于5分钟的，不计入不可用时间。归档存储不可用时间不包括日常系统维护时间、由用户原因、第三方原因或不可抗力导致的不可用时间。...

跨可用区容灾

确保操作人员熟悉容灾恢复流程，确保在主站真正发生故障时，操作人员可以顺畅地进行容灾切换。容灾演练操作步骤如下：登录混合云容灾管理控制台。单击切换到连续复制型容灾。在概览页面，单击目标容灾站点对。在容灾中心页面，单击受...

诊断规则

而后，在实际故障发生时，即可执行自动化、标准化的故障排查，并直接输出诊断报告，反馈诊断结果。故障诊断功能有效提升了故障排查效率，实现故障的快速定位与处理。本节将向您介绍诊断规则的相关操作。诊断规则是诊断节点的构成，诊断规则...

查看及管理资产专题

本文为您介绍如何查看及管理资产专题详情。权限说明超级管理员、运营管理员、专题管理员可查看及管理所有资产专题详情，包括编辑、删除资产专题、创建专题...移出专题：将选中的资产对象批量从当前专题移除，移除操作不可撤销，请谨慎操作。

查看及管理资产专题

本文为您介绍如何查看及管理资产专题详情。权限说明超级管理员、运营管理员、专题管理员可查看及管理所有资产专题详情，包括编辑、删除资产专题、创建专题...移出专题：将选中的资产对象批量从当前专题移除，移除操作不可撤销，请谨慎操作。

存储空间概述

✓×保留策略 OSS支持WORM特性，允许用户以“不可删除、不可篡改”方式保存和使用数据，符合美国证券交易委员会（SEC）和金融业监管局（FINRA）的合规要求。✓ ✓ 服务器端加密当您在设置了服务器端加密的存储空间（Bucket）中上传文件...

数据容灾

当断网、断电或者发生灾难事件导致某个机房不可用时，仍然能够确保继续提供强一致性的服务能力，整个故障切换过程用户无感知，业务不中断、数据不丢失，可以满足关键业务系统对于“恢复时间目标（RTO）”以及“恢复点目标（RPO）”等于0的...

可观测性的设计原则

在云原生、微服务等技术越发流行的今天，系统的可观测性变得越来越复杂。云上的可观测性主要从监控指标、链路追踪、日志记录、监控看板和事件告警五大方面来进行设计，从而实现云上全方面的可观测性体系能力建设。监控指标系统需要收集和...

常见问题

OSS支持WORM（Write Once Read Many）特性，允许您以不可删除、不可篡改的方式保存和使用数据。用户可针对Bucket设置基于时间的合规保留策略。当策略锁定后，用户可以在Bucket中上传和读取Object，但是在Object的保留时间到期之前，任何...

强弱依赖治理概述

如果商品详情页对下游依赖是弱依赖，例如当下游依赖评价、店铺等系统出现故障的时候，将导致商品详情页部分内容加载不全，出现如下图的情况，但核心业务流程仍可继续推进，用户体验并未受到太多影响。通过以上对比可以看出，当下游依赖...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题，可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题，更直观地了解调用链分析的用法与价值。背景...

使用报警服务

查看目标报警规则的报警历史您可以查看指定报警规则中的所有故障资源的报警详情和报警图表，及时定位并处理资源故障。使用阈值报警回调云监控除了电话、短信、邮件和WebHook的报警通知方式外，还可以使用报警回调方式，实现将云监控发送...

OSS文件上传和下载失败的排查方法

概述本文主要介绍阿里云对象存储OSS文件上传和下载失败的排查方法。详细信息当您访问OSS出错时，OSS会返回3xx、4xx或者5xx的HTTP状态码，您可以通过状态码进行排查处理。在使用OSS SDK上传或下载文件时，如发生报错，请参见 OSS SDK使用...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统，虽然Redis本身具备了非常高的可用性，但是在实际应用中也会随着系统业务的复杂性以及不合理的使用，而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险，提升缓存问题的...

基本概念

RPO Recovery Point Objective（数据恢复点目标），指应用发生故障时预期的数据丢失量。例如，RPO=15 分钟，表示在应用发生故障时，最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective（恢复时间目标），指故障发生时，在云...

什么是故障演练

适用场景故障演练可适用于以下典型场景：衡量微服务的容错能力通过模拟调用延迟、服务不可用、机器资源满载等，查看发生故障的节点或实例是否被自动隔离、下线，流量调度是否正确，预案是否有效，同时观察系统整体的QPS或RT是否受影响。...

实例的节点故障处理机制

说明 Mongos节点采用单节点架构，当某个Mongos节点发生故障，该节点相关服务不可用。在生产环境的应用程序请勿连接单个Mongos节点，推荐使用Connection String URI连接所有Mongos节点。当使用Connection String URI进行连接时，如果某个...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象光模块连接后，接口指示灯没有变为绿色。可能原因光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见光模块型号。说明目前仅SAG-1000设备支持光模块插入。解决方案通用多...

应用场景

当其中一部分ECS实例发生故障后，CLB 会自动屏蔽故障的ECS实例，将请求分发给正常运行的ECS实例，保证应用系统仍能正常工作。同城容灾（多可用区容灾）为了提供更加稳定可靠的 CLB 服务，CLB 已在各地域部署了多可用区以实现同地域容灾。当...

高可用和容灾设计

如果实例只有一个备节点，在故障节点恢复之前，集群可读地址不可访问。如果实例有多个备节点，集群可读地址在故障切换过程中只会有一次闪断，剩余的备节点将分担读请求。因此，推荐实例配置多个备节点，保障集群可读地址在故障切换场景下可...

不可变对象发生故障怎么办

新品推荐