流水单据型业务场景多活实践

在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复。说明 这里区别于传统的解决思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦。容灾切换...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

一致性复制组概述

容灾站点 除了生产站点以外另外建立容灾站点,当生产站点发生故障时,容灾站点可以接管业务,实现业务不间断。恢复点目标(RPO)由于云盘异常可能丢失的数据量,以时间为单位,是异步复制功能的数据指标之一(一致性复制组功能的RPO默认为...

混合云解决方案

如果MASTER 宕机,发生故障转移,此时SLAVE如果要提供服务,日志读取器会等待镜像日志先同步,再做发布,但如果MASTER发生硬件故障,此时SLAVE需要打开一个跟踪标记1448,在镜像故障的情况下可以继续分发数据。说明 1448标记用于在事务...

DescribeDedicatedHosts-查询专有宿主机详细信息

1 ActionOnMaintenance string 当专有宿主机发生故障时,为其所宿实例设置迁移方案。取值范围:Migrate:专有宿主机整机迁移至另一物理服务器,并对故障前非关机状态的实例进行启动。Stop:在当前专有宿主机上停止实例,确认无法修复专有宿...

DescribeDedicatedHosts-查询专有宿主机详细信息

1 ActionOnMaintenance string 当专有宿主机发生故障时,为其所宿实例设置迁移方案。取值范围:Migrate:专有宿主机整机迁移至另一物理服务器,并对故障前非关机状态的实例进行启动。Stop:在当前专有宿主机上停止实例,确认无法修复专有宿...

容灾管理服务介绍

针对有高可用需求的用户,CADT容灾管理服务提供规划、优化、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行容灾演练,验证系统是否能够抵御资源故障或者AZ故障,保障系统健壮性。主要功能 容灾规划 在用户部署资源前,通过...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

围绕混沌工程的平台实践

因此混沌工程是一门学科,它提供了基本的理论指导,而故障演练是混沌工程的具体实践,通过向目标系统注入真实可能发生故障来考量系统的稳定性。混沌工程和AHAS Chaos AHAS Chaos是以混沌工程为理论指导的故障演练平台,目标是成为混沌...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进,避免历史同类故障重复发生

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

EasyCkpt:AI大模型高性能状态保存恢复

因此,在发生故障时,迫切需要一种以低成本的方法来保存最新的Checkpoint。这样在重新启动训练时就无需重复计算,从而减少时间和成本的浪费。功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的...

源为PolarDB-X的功能规范和约束说明

警告 异常切流是指源实例或者源实例所在的数据中心发生故障时进行的切流操作。这类操作都是有损操作。在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据...

源为PolarDB-X的功能规范和约束说明

警告 异常切流是指源实例或者源实例所在的数据中心发生故障时进行的切流操作。这类操作都是有损操作,例如导致数据不一致或任务失败。在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,...

DescribePrice-查询实例的价格

10508 TradeMinRCUAmount float 根据用户所选择的最小 RCU 计算出的每小时费用预估。2*TradeMaxRCUAmount float 根据用户所选择的最大 RCU 计算出的每小时费用预估。1*Coupons object[]优惠信息列表。IsSelected string 是否已选择优惠券。...

DescribePrice-查询实例的价格

10508 TradeMinRCUAmount float 根据用户所选择的最小 RCU 计算出的每小时费用预估。2*TradeMaxRCUAmount float 根据用户所选择的最大 RCU 计算出的每小时费用预估。1*Coupons object[]优惠信息列表。IsSelected string 是否已选择优惠券。...

DescribePrice-查询实例的价格

10508 TradeMinRCUAmount float 根据用户所选择的最小 RCU 计算出的每小时费用预估。2*TradeMaxRCUAmount float 根据用户所选择的最大 RCU 计算出的每小时费用预估。1*Coupons object[]优惠信息列表。IsSelected string 是否已选择优惠券。...

DescribePrice-查询实例的价格

10508 TradeMinRCUAmount float 根据用户所选择的最小 RCU 计算出的每小时费用预估。2*TradeMaxRCUAmount float 根据用户所选择的最大 RCU 计算出的每小时费用预估。1*Coupons object[]优惠信息列表。IsSelected string 是否已选择优惠券。...

DescribePrice-查询实例的价格

10508 TradeMinRCUAmount float 根据用户所选择的最小 RCU 计算出的每小时费用预估。2*TradeMaxRCUAmount float 根据用户所选择的最大 RCU 计算出的每小时费用预估。1*Coupons object[]优惠信息列表。IsSelected string 是否已选择优惠券。...

DescribeTenant-查询指定集群下的指定租户信息

变更历史 变更时间 变更内容概要 操作 2024-04-15 OpenAPI 返回结构发生变更 看变更集 变更项 变更内容 出参 OpenAPI 返回结构发生变更。2024-02-02 OpenAPI 返回结构发生变更 看变更集 变更项 变更内容 出参 OpenAPI 返回结构发生变更。...

DescribeHealthStatus-查看实例和节点的健康状态

查看实例和节点的健康状态。接口说明 本接口用于查看存储弹性模式和 Serverless 版本的 AnalyticDB ...变更历史 变更时间 变更内容概要 操作 2023-06-30 OpenAPI 返回结构发生变更 看变更集 变更项 变更内容 出参 OpenAPI 返回结构发生变更。

ImAudit-提交图文审核作业

命中人名 re float 浮点数类型,置信度分数,取值范围:0(表示置信度最低)~100(表示置信度最高)。置信度越高表示人物识别结果的可信度越高。91.54 idid string 字符串类型,人脸 ID。AliFace_0001234 ocrData array ocrData string ...

智能生产接口参数补充说明

本文介绍提交智能生产作业请求参数 JobParams、Output 及查询智能生产作业返回参数 Job 补充说明。字幕提取:CaptionExtraction 名称 类型 描述 Output String 如果JobParams设置了中英文分离,输出文件路径中支持 {resultType} 占位符,...

编辑自定义功能

例如:将已定义的属性 电压 作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set...

DescribeInstanceTypes-查询云服务器ECS提供的实例...

10 MinimumMemorySize float 否 查询实例规格时,期望最小内存。单位:GiB。说明 查询到实例规格的内存大小小于设定值时,系统不会返回其实例规格的信息。20 MaximumMemorySize float 否 查询实例规格时,期望最大内存。单位:GiB。说明 ...

使用向量检索插件(aliyun-knn)

说明 阿里云Elasticsearch 6.7版本请使用 cosineSimilarity(float[]queryVector,DocValues docValues)函数,7.10版本请使用 cosine(float[]queryVector,DocValues docValues)函数。说明 使用script检索功能,需要确保:实例版本为6.7.0且...

DescribeDedicatedHostGroups-查询RDS主机组信息

查询RDS专属集群信息。接口说明 专属集群功能以集群形式批量管理实例...变更历史 变更时间 变更内容概要 操作 2023-06-30 OpenAPI 错误码发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:500 新增错误码:400

DescribeDedicatedHostGroups-查询RDS主机组信息

查询RDS专属集群信息。接口说明 专属集群功能以集群形式批量管理实例...变更历史 变更时间 变更内容概要 操作 2023-06-30 OpenAPI 错误码发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:500 新增错误码:400

DescribeDedicatedHostGroups-查询RDS主机组信息

查询RDS专属集群信息。接口说明 专属集群功能以集群形式批量管理实例...变更历史 变更时间 变更内容概要 操作 2023-06-30 OpenAPI 错误码发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:500 新增错误码:400

DescribeDedicatedHostGroups-查询RDS主机组信息

查询RDS专属集群信息。接口说明 专属集群功能以集群形式批量管理实例...变更历史 变更时间 变更内容概要 操作 2023-06-30 OpenAPI 错误码发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:500 新增错误码:400

自定义SQL查询

用于计算退出率 session_event_code Array(String)事件名序列,顺序匹配发生顺序 session_event_start_ts Array(Int64)事件发生时 session_event_duration Array(Float32)事件发生间隔 session_event_num Nullable(Int32)session事件长度 ...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

该模式适用于生产站点确实发生短时无法恢复的故障,需立即切换至容灾站点的场景。故障恢复类型 数据同步后切换 该故障恢复会停止保护组中被保护的实例,并且一直等到所有被保护的实例停止,再进行最后一轮数据同步,并等待数据同步完成后再...

步骤七:故障切换

该模式适用于生产站点确实发生短时无法恢复的故障,需立即切换至容灾站点的场景。故障恢复类型 数据同步后切换 该故障恢复会停止保护组中被保护的实例,并且一直等到所有被保护的实例停止,再进行最后一轮数据同步,并等待数据同步完成后再...

操作流程

本文介绍使用云盘异步复制容灾的基本操作流程。操作流程 在云备份服务控制台,实现对关键应用的容灾保护,主要步骤包括如下:步骤一:资源规划。...该模式适用于生产站点确实发生短时无法恢复的故障,需立即切换至容灾站点的场景。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用