同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

如何选择二级索引和多元索引

如果基于主键主键范围查询的功能已经可以满足业务需求,则不需要建立索引。更多信息,请参见 读取数据。如果对某个范围内进行筛选,范围内数据量不大或者查询频率不高,则可以使用Filter功能,不需要建立索引。更多信息,请参见 过滤器。...

流水单据型业务场景多活实践

在 读多写少型业务场景多活实践 中,已经将导购链路进行了异地多读改造,而该业务后续在一次大促期间,遭遇了一次订单应用大面积故障,导致大促期间下单业务长时间无法使用,于是下单业务的容灾建设也提上了议程。下单业务是典型的流水单据...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

源为PolarDB-X的功能规范和约束说明

概览 业务设计规范 数据库架构规范 运维变更规范 数据质量风险声明 业务开发的数据质量工作 业务设计规范 表都需要有主键,否则可能会造成数据不一致(造成目标库有重复数据)。因为 PolarDB分布式版 的GSI全局二级索引(Global Secondary ...

源为PolarDB-X的功能规范和约束说明

概览 业务设计规范 数据库架构规范 运维变更规范 数据质量风险声明 业务开发的数据质量工作 业务设计规范 表都需要有主键,否则可能会造成数据不一致(造成目标库有重复数据)。因为 PolarDB分布式版 的GSI全局二级索引(Global Secondary ...

应用场景

物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测和故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...

故障演练

重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障状态,请确保您已将演练资源进行冗余配置,否则会导致业务中断.故障演练过程中控制台的资源状态显示存在一定的时延,但不影响底层资源状态切换的时效性。使用限制 每个...

事件分析概述

链路追踪:提供事件轨迹能力,还原事件整体链路状态,帮助您快速排除故障,定位链路问题。低成本 事件总线EventBridge 支持事件以云服务事件总线和自定义事件总线形式接入,云服务事件总线支持接入所有阿里云产品事件,无缝支持云服务事件...

错误码

业务表必须有主键 给所有业务表添加主键。数据源相关(FMT 模式下)错误码 错误消息 错误说明 解决方案 DTX-500 transaction[%s]:[%s]on db[%s]flush branchInfo to db failed.保存 undo log 至 dtx\_branch\_info 表失败 检查业务数据库...

功能特性

您可以自主迁移有潜在故障风险的DDH到其他物理机,避免相关业务因DDH故障受到影响。迁移有潜在故障风险的DDH 基础能力计费 专有宿主机基础计费能力。功能集 功能 功能描述 参考文档 DDH DDH规格计费 DDH以实例规格的形式提供计算资源,包括...

应用容灾

同城应用多活的架构如下图所示:同城应用多活对应用系统的代码侵入较小,基于灵活的流量调度和单元格间的流量路由,能做到故障场景下的业务快速恢复,实现业务恢复与故障恢复的解耦。异地场景的应用多活 同城近距离的容灾建设难以抵御地域...

通过Flink将Kafka数据同步至AnalyticDB PostgreSQL版

strict:主键冲突时,故障转移(Failover)并报错。update:主键冲突时,更新为新增的数据。upsert(默认):主键冲突时,采用UPSERT方式写入数据。AnalyticDB PostgreSQL版 通过 INSERT ON CONFLICT 和 COPY ON CONFLICT 实现UPSERT写入...

解决方案与客户案例

方案应用场景 本解决方案适用于以下业务场景:容灾能力要求高 异地多活可以达到国标6级的容灾能力,适合对容灾方面有较高要求的业务业务流量比较敏感的业务业务的某些核心系统。流量要求精细化管理 异地多活支持多种流量管理策略,适合...

核心优势

丰富检索 HBase增强版内置高性能的 二级索引,满足数据非主键查询的需求,业务使用透明,查询自优化支持,可按需冗余非索引列。同时,增强版也提供 全文索引服务介绍,智能集成搜索引擎Solr,提供面向海量数据的存储、多维查询、全文索引等...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

关键技术竞争力

基于混沌工程的红蓝攻防能力 TRaaS 基于混沌工程、建立演练机制,提供故障注入、演练编排体系能力,支持在不同环境、不同阶段,主动对业务系统进行故障注入,从而在主动观测单应用健壮性的同时,验证整个体系的故障发现能力、应急响应能力...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

附录:SOFAStack 产品目录

全局唯一数字序列 数据访问代理支持分布式全局唯一且有序递增的数字序列,满足业务在使用分布式数据库下对主键或唯一键以及特定场景的需求。数据库账号权限体系 数据访问代理支持类单机 MySQL 账号和权限体系,确保不同角色使用的账号操作...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

云盒计算资源配置最佳实践

这些能力可以有效提升云盒IaaS层的故障和风险应对能力,但也需要一定的冗余资源,以便在硬件设备出现故障时及时迁移业务。您可以参考以下两种方式来提高云盒IaaS层的冗余资源,以确保业务连续性。根据业务需求选择SKU时,增加一定量的冗余...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

单元测试报告

主键检查 物理主键或逻辑主键是否成立。数据完整性检查 代码中引用的数据能否支撑实际需求。字段间逻辑检查 字段间的业务逻辑关系是否在数据上成立,例如余额=总的发放-总的回收。代码质量/BUG检查 历史拉链表检查断链/交叉链 使用标准SQL...

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生、故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...

容灾恢复

解决了服务故障持续影响业务的问题,避免了雪崩效应,提高系统可用率。功能原理 单机故障剔除会统计一个时间窗口内的调用次数和异常次数,并计算每个服务对应 IP 的异常率和该服务的平均异常率。当 IP 的异常率大于服务平均异常率,且达到...

MongoDB 4.4

说明 如果您的业务对云数据库MongoDB实例的写入量非常大,建议仅在故障排查或安全审计时开通该功能,以免带来性能损失。开通审计日志后,默认勾选的审计操作类型只有 admin 和 slow。如果您需要更改审计操作类型,请参见 更改审计操作类型...

高可用架构部署方案

高可用架构提供业务分发、弹性扩展、多可用区部署等功能。相较于使用单台ECS实例部署数据库与应用,高可用架构只需简单部署,并且拥有更高的稳定性和可扩展性。高可用架构特点 高可用架构具有如下特点:使用多可用区高可用版的负载均衡CLB...

MongoDB 7.0

说明 如果您的业务对云数据库MongoDB实例的写入量非常大,建议仅在故障排查或安全审计时开通该功能,以免带来性能损失。开通审计日志后,默认勾选的审计操作类型只有 admin 和 slow。如果您需要更改审计操作类型,请参见 更改审计操作类型...

云数据库RDS MySQL版主实例与只读实例之间存在复制...

解决方案 不同的问题原因对应的解决方案不同,请您先通过SQL洞察功能对故障发生时的所有SQL语句进行审计,检查是否存在上述几种情况。说明:更多有关SQL洞察的信息,例如如何开通SQL洞察以及如何使用SQL洞察,请参见 SQL洞察。如果存在上述...

实时数仓Hologres

如果业务需要,无法使用主键作为Join条件,对于此类非主键点查的维表(即一对多的查询),创建Hologres表时建议选择列存模式,并合理设置 分布键Distribution Key 以及 Event Time Column(Segment Key)以优化查询性能,详情请参见 表存储...

MongoDB 6.0

说明 如果您的业务对云数据库MongoDB实例的写入量非常大,建议仅在故障排查或安全审计时开通该功能,以免带来性能损失。开通审计日志后,默认勾选的审计操作类型只有 admin 和 slow。如果您需要更改审计操作类型,请参见 更改审计操作类型...

MongoDB 5.0

说明 如果您的业务对云数据库MongoDB实例的写入量非常大,建议仅在故障排查或安全审计时开通该功能,以免带来性能损失。开通审计日志后,默认勾选的审计操作类型只有 admin 和 slow。如果您需要更改审计操作类型,请参见 更改审计操作类型...

MongoDB 4.0

若目标端有与源端相同的主键,请在不影响业务的前提条件下清空目标端的相关数据(删掉目标端中与源端相同_id的文档)。阿里云数据库MongoDB实例间的迁移:从MongoDB单节点实例迁移至副本集或分片集群实例 跨阿里云账号迁移云数据库MongoDB ...

概述

基于阿里巴巴的历史经验,有一半以上的重大故障皆为变更触发,因此,变更过程的风险防御显得尤为重要,会直接关乎业务的稳定性。变更系统是指承载任何对线上生产环境变更操作的系统或工具。例如拥有控制台的白屏化系统/工具、压测/演练平台...

周期任务补数据

周期任务补数据功能用于对周期任务在指定的历史业务日期内进行数据回刷。周期任务开发完成并提交发布后,任务会按照调度配置定时运行,如果您希望在指定时间段运行周期任务或回刷历史一段时间区间的数据,可以使用补数据功能。节点使用的...

周期任务补数据

周期任务补数据功能用于对周期任务在指定的历史业务日期内进行数据回刷。周期任务开发完成并提交发布后,任务会按照调度配置定时运行,如果您希望在指定时间段运行周期任务或回刷历史一段时间区间的数据,可以使用补数据功能。节点使用的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 负载均衡 云数据库 Redis 版 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用