诊断规则

而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现故障的快速定位与处理。本节将向您介绍诊断规则的相关操作。诊断规则是诊断节点的构成,诊断规则...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

云监控告警

连接数告警 QPS告警 状态码告警 DDoS黑洞事件告警 事件监控告警 您可以设置事件监控报警通知,及时获知DDoS高防(中国内地)和DDoS高防(非中国内地)上发生的黑洞、清洗、四层CC攻击、七层CC攻击事件,并在发生故障时及时发现问题,缩短...

同城容灾架构概述

非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障时系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免单点逻辑出现。幂等...

故障恢复

故障恢复 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。...故障状态异常 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。

故障取消

故障取消 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。...故障状态异常 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。

故障撤销恢复

故障撤销恢复。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。...故障状态异常 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。

故障完结

故障完结。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。...故障状态异常 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。

故障复盘

故障复盘 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。...故障状态异常 404 ProblemNotExisted The problem does not exist.故障不存在 访问 错误中心 查看更多错误码。访问 错误中心 查看更多错误码。

查询故障列表

problemStatus String Body 否 HANDLING 故障状态 HANDLING 处理中 RECOVERED 已恢复 REPLAYING 复盘中 REPLAYED 已复盘 CANCEL 已取消 problemLevel String Body 否 P2 故障等级 1=P1 2=P2 3=P3 4=P4 affectServiceId Long Body 否 1 影响...

GetProblem-故障详情

problemName String 故障 故障名称 problemStatus Integer HANDLING 故障状态 HANDLING 处理中 RECOVERED 已恢复 REPLAYING 复盘中 REPLAYED 已复盘 CANCEL 已取消 problemLevel Integer P1 故障等级 1=P1 2=P2 3=P3 4=P4 discoverTime ...

故障升级

HANDLING 故障状态 HANDLING 处理中 RECOVERED 已恢复 REPLAYING 复盘中 REPLAYED 已复盘 CANCEL 已取消 problemLevel String Body 否 P2 故障等级 1=P1 2=P2 3=P3 4=P4 progressSummary String Body 否 进展摘要 进展摘要 ...

获取故障图片链接

获取故障图片链接 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/...

获取故障通知预览

名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c2840fd3812 requestId data Object data problem Object object problemName String 故障名称 故障名称 problemStatus String HANDLING HANDLING 故障状态 HANDLING ...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

AccessGatewayFailover

AccessGatewayFailover事件提示您智能接入网关设备主IPsec链路发生故障。告警信息 事件名称 事件级别 状态状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。...

Tair选型指南

选择容灾方案 3.Tair容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

DeviceWanLinkDown

DeviceWanLinkDown事件提示您设备WAN链路发生故障。告警信息 事件名称 事件级别 状态状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'...

MSE注册配置中心高可用最佳实践

无容灾保护 当来自Consumer端的请求量突然增加时,如果Provider容量水位较高,会导致个别Provider发生故障:注册中心会将故障节点摘除,全量流量会给剩余节点。剩余Provider节点负载变高,大概率也会发生故障。最终所有Provider节点故障,...

跨可用区容灾(Beta)

当生产实例发生故障且容灾实例处于待机状态时,您可根据实际情况自行判断是否将容灾实例切换成主实例。重要 生产实例故障时,如存在部分数据未同步至容灾实例。容灾实例异常切换成主实例后,将缺失这部分数据。因此,您在进行异常切换时,...

通过CADT实现NLB可用区级容灾演练

NLB实例的 可用区J 发生故障时,NLB能够在短时间内停用该可用区,并继续使用其他启用的可用区提供服务。步骤四:容灾切回演练 容灾切回功能:NLB可用区故障恢复后,验证NLB的容灾恢复能力。容灾切回概念:与容灾切换相反,将资源切回到执行...

通过CADT实现ALB可用区级容灾演练

ALB实例的乌兰察布 可用区A 发生故障时,ALB能够在短时间内停用该可用区,并继续使用其他启用的可用区提供服务。步骤四:容灾切回演练 容灾切回功能:ALB可用区故障恢复后,验证ALB的容灾恢复能力。容灾切回概念:与容灾切换相反,将资源切...

Tair Proxy特性说明

A:推荐选择 集群架构,数据分片均采用主备高可用架构,当主节点发生故障后,系统会自动进行主备切换保证服务高可用。在某些极端场景下某个数据分片出现异常后,对数据的影响及优化方案如下。场景 影响与优化方案 2.多Key命令场景 影响...

使用API终止和恢复VBR来确认冗余物理专线

当一条物理专线发生故障后,健康检查辅助系统自动切换业务流量到另外一条正常的物理专线上,从而保障您的业务高可用。自动切换的时间周期受您的VPC路由条目数量的影响。通常情况下,您的业务可以在12秒内完成自动切换。下表列出本地IDC通过...

Redis Proxy特性说明

推荐选择 集群版-双副本,数据分片均采用主备高可用架构,当主节点发生故障后,系统会自动进行主备切换保证服务高可用。在某些极端场景下某个数据分片出现异常后,对数据的影响及优化方案如下。场景 影响与优化方案 2.多Key命令场景 ...

服务发布策略

当新版本v2存在问题或者发生故障时,可以快速切回旧版本v1。蓝绿部署的优点:部署结构简单,运维方便。服务升级过程操作简单,周期短。蓝绿部署的缺点:资源冗余,需要部署两套生产环境。新版本故障影响范围大。A/B测试 A/B测试基于用户...

主从实例读写分离部署(共享存储)

该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问恢复中的节点,则查询会立即失败。Hologres从V1.1版本开始,采用全新恢复机制,节点恢复速度在一分钟左右,比...

云数据库Redis版产品选型必读

选择容灾方案 3.Redis容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

云盘异步复制概述

启动云盘异步复制功能 通过异步复制功能实现容灾恢复 您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制提供的故障切换以及反向复制功能对主盘进行容灾恢复。通过异步复制功能实现容灾恢复 删除云盘异步复制关系 创建...

网络架构容灾

当地址池中地址发生故障时,HealthCheck模块会准确的检测到异常情况并与DNS交互(如下中序号3所示),摘除故障地址(如下中序号4所示),这样用户端会自动解析到可用的地址池(如下中序号5所示)。并当故障地址恢复时,自动恢复至...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

强弱依赖治理最佳实践

通过以上业务依赖的预判可以得出以下结论:前端对商品推荐服务预判为弱依赖,表示当推荐服务发生故障时前端正常访问不应该受阻。在购物链路中,商品服务product对商品数据库product-mysql预判为强依赖。表示如果扣减库存失败,则应该阻断下...

流水单据型业务场景多活实践

在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复。说明 这里区别于传统的解决思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦。容灾切换...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

容灾管理服务介绍

针对有高可用需求的用户,CADT容灾管理服务提供规划、优化、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行容灾演练,验证系统是否能够抵御资源故障或者AZ故障,保障系统健壮性。主要功能 容灾规划 在用户部署资源前,通过...

EasyCkpt:AI大模型高性能状态保存恢复

因此,在发生故障时,迫切需要一种以低成本的方法来保存最新的Checkpoint。这样在重新启动训练时就无需重复计算,从而减少时间和成本的浪费。功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的...

一致性复制组概述

容灾站点 除了生产站点以外另外建立容灾站点,当生产站点发生故障时,容灾站点可以接管业务,实现业务不间断。恢复点目标(RPO)由于云盘异常可能丢失的数据量,以时间为单位,是异步复制功能的数据指标之一(一致性复制组功能的RPO默认为...

读写分离架构

建议与使用须知 当一个只读节点发生故障时,请求会转发到其他节点;如果所有只读节点均不可用,请求会全部转发到主节点。只读节点异常可能导致主节点负载提高、响应时间变长,因此在读负载高的业务场景建议使用多个只读节点。只读节点发生...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 图像搜索 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用