自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

单实例快速恢复

该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问恢复中的节点,则查询会立即失败。节点恢复速度在一分钟左右,当表数量明显增加时,恢复时间会更长。Hologres...

ECS整机恢复

当ECS整机发生系统故障或者错误操作时,您可以通过备份点的克隆和恢复功能,实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。重要 当源ECS存在时,支持直接...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行恢复原盘或者创建新盘操作实现数据恢复。本文介绍云盘恢复的相关操作。前提条件 已创建云盘备份。更多信息,请参见 创建云...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

主从实例读写分离部署(共享存储)

该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问恢复中的节点,则查询会立即失败。Hologres从V1.1版本开始,采用全新恢复机制,节点恢复速度在一分钟左右,比...

MNS相对于自主研发、商用或开源的消息队列系统有什么...

本文介绍与自行构建系统来管理消息队列或使用商用、开源...缺省提供消息冗余存储,以便在硬件发生故障时不会丢失消息,相应的系统投入、开发、配置和部署将更为简单。无需为消息服务后期投入部署和维护的资源,只需简单配置即可用于生产环境。

同城容灾架构概述

非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免单点逻辑出现。幂等...

标准架构

主节点提供日常服务访问,从节点提供HA高可用,当主节点发生故障系统会自动在30秒内切换至从节点,保证业务平稳运行。标准架构高可用类型的特点如下:可靠性 服务可靠 采用双机主从(master-replica)架构,主从节点位于不同物理机。主...

标准版-双副本

主节点提供日常服务访问,备节点提供HA高可用,当主节点发生故障系统会自动在30秒内切换至备节点,保证业务平稳运行。特点 可靠性 服务可靠 采用双机主从(master-replica)架构,主从节点位于不同物理机。主节点对外提供访问,用户可...

什么是消息演练

定位故障根源:经过消息演练之后,积累了消息系统处理经验,对于未来的系统诊断定位有参考和提升作用。消息的演练场景 消息服务通常是由不同的模块组成。例如,RocketMQ分为生产者Producer、消费者Consumer、服务集群Broker和注册中心...

MSE Nacos风险管理

Nacos引擎系统自带定时...关闭接收通知之后,您将不再收到通知提醒,但仍然建议您按照风险 建议 进行操作,以免集群发生故障。说明 为避免通知过多,影响您的使用体验,MSE Nacos风险管理仅开放部分高风险通知功能,具体请以控制台页面为准。

发现和排查实例问题

合理使用监控相关的功能可以帮助您及时发现和排查实例问题,在故障发生处理掉潜在风险,避免影响业务。诊断实例的健康状态 实例健康诊断功能可以全方位诊断实例的操作系统配置、网络状态、磁盘状态等。诊断报告中针对异常诊断项目的影响...

订阅事件通知

云监控的报警服务为您提供以下两种报警通知能力,当阿里云产品发生系统异常时,您可以及时知晓发生的事件,并自动处理异常事件(例如云产品故障)。提供通过 短信、邮件、钉钉机器人的方式,对事件发生进行报警。提供将事件分发到您的消息...

订阅事件通知

云监控的报警服务为您提供以下两种报警通知能力,当阿里云产品发生系统异常时,您可以及时知晓发生的事件,并自动处理异常事件(例如云产品故障)。提供通过 短信、邮件、钉钉机器人的方式,对事件发生进行报警。提供将事件分发到您的消息...

消费重试

例如,您预设消息处理耗时最多20 ms,但实际业务中20 ms内消息处理不完,您可以修改消息不可见时间,延长消息处理时间,避免消息触发重试机制。修改消息不可见时间需要满足以下条件:消息处理未超时 消息处理未提交消费状态 如下图所示,...

订阅事件通知

云监控的报警服务为您提供以下两种报警通知能力,当阿里云产品发生系统异常时,您可以及时知晓发生的事件,并自动处理异常事件(例如云产品故障)。提供通过 短信、邮件、钉钉机器人的方式,对事件发生进行报警。提供将事件分发到您的消息...

订阅事件通知

云监控的报警服务为您提供以下两种报警通知能力,当阿里云产品发生系统异常时,您可以及时知晓发生的事件,并自动处理异常事件(例如云产品故障)。提供通过 短信、邮件、钉钉机器人的方式,对事件发生进行报警。提供将事件分发到您的消息...

订阅事件通知

云监控的报警服务为您提供以下两种报警通知能力,当阿里云产品发生系统异常时,您可以及时知晓发生的事件,并自动处理异常事件(例如云产品故障)。提供通过 短信、邮件、钉钉机器人的方式,对事件发生进行报警。提供将事件分发到您的消息...

管理集群

主机故障处理策略 设置主机故障时系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 设置主机故障时系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

产品优势

核心消息处理系统采用无状态架构,无单点依赖,消息发送失败可自动重试。架构上难以支持万级的消息规模,消息上下行并发会给系统带来巨大的冲击。无法做到削峰填谷,影响高峰时正常业务运行。安全性 等保2.0版(三级等保),提供多重防护,...

EMR Kafka磁盘故障运维

此方案的优点在于不需要等待故障磁盘下线、维修、上线周期,故障处理周期短。适用场景 适合单个Broker只有一块数据盘的场景。如果Broker上数据较少、恢复速度较快、集群负载较低,您也可以选择此方式来进行故障节点的运维。说明 如果坏盘为...

产品功能

消息队列分布式事务 在多次调用消息系统的场景中,通过 GTS,应用可轻松具备消息事务的处理能力。混合的分布式事务 GTS 可将各个资源加入事务范畴,实现同时跨服务、数据库、跨消息系统的事务处理能力。多种事务模式 提供了标准事务模式、...

应用场景

系统稳定性差,任何一个下游发生故障,将直接影响整个业务系统的可用性。为提升核心应用用户体验和稳定性,您可以通过DTS提供的数据订阅,将深耦合业务优化为通过实时消息通知实现的异步耦合,让核心业务逻辑更简单可靠,具体调整为:该...

MQ订阅消息

取值:新建:"New"处理中:"Processing"已取消:"Cancel"已完结:"Close"重新开启:"Reopen"消息内容 基站 离线 基站与云价签系统连接中断后触发消息,例如:门店网络故障或基站故障 {"EventCatgory":"DEVICE","Event":"DEVICE_OFFLINE",...

事件通知概述

通过设置事件通知,您还可以为事件配置消息处理中间件,实现事件驱动的自动化运维,取代SDK轮询的方式。事件名称 设置事件通知后,在您收到的通知信息中,name 为事件通知名称参数,其取值格式为<资源类型>:<事件类型>:<系统事件状态>。...

监控动态RDS凭据轮转

报警方式 发生事件报警时的通知方式及消息处理方式。报警通知:联系人组:默认设置为 云账号报警联系人。通知方式:Critical(电话+短信+邮件+WebHook)Warning(短信+邮件+WebHook)Info(邮件+WebHook)消息处理方式:您可以配置 消息...

计算资源

即使其中一个节点发生故障或异常中断,其他节点仍然可以继续执行剩余的子任务,提高任务的容错性和可靠性。任务重复执行 由于各种原因导致计算任务被多次执行的情况,如重复操作、消息重复、调度重复等原因。常见的容错策略如下:去重:...

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

监控动态ECS凭据轮转

报警方式 发生事件报警时的通知方式及消息处理方式。报警通知:联系人组:默认设置为 云账号报警联系人。通知方式:Critical(电话+短信+邮件+WebHook)Warning(短信+邮件+WebHook)Info(邮件+WebHook)消息处理方式:您可以配置 消息...

ECS系统事件概述

说明 非预期运维事件一般指的是因底层宿主机发生了无法预测的故障,或者ECS实例的操作系统发生了内核错误等问题,导致ECS实例突然出现宕机或重启。因宿主机故障导致ECS实例宕机或重启事件(SystemFailure.Reboot)属于偶发现象,无法避免。...

消费者负载均衡

消费示例二:使用SimpleConsumer消费普通消息,主动获取消息处理并提交。会按照订阅的主题自动获取,无需关注消息负载均衡。List<MessageView>messageViewList=null;try { messageViewList=simpleConsumer.receive(10,Duration.ofSeconds...

使用报警服务

查看目标报警规则的报警历史 您可以查看指定报警规则中的所有故障资源的报警详情和报警图表,及时定位并处理资源故障。使用阈值报警回调 云监控除了 电话、短信、邮件和WebHook的报警通知方式外,还可以使用报警回调方式,实现将云监控发送...

实例的节点故障处理机制

本文档介绍云数据库MongoDB版实例的节点故障处理机制。单节点实例 由于单节点实例架构的特殊性,单节点实例仅拥有一个节点。当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于...

代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

基于Kubernetes容器集群的容灾架构与方案

在进行系统架构设计时,您必须考虑到信息系统和基础设施可能遇到的各种潜在威胁,例如:硬件故障、软件系统崩溃、人为操作失误、安全攻击、自然灾害等。为了确保系统能够在各种异常故障场景下快速恢复并保持业务连续性,您必须为系统设计...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云消息队列 Kafka 版 云消息队列 RocketMQ 版 对象存储 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用