跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 面板,选择 恢复...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

故障演练

确保操作人员熟悉容灾恢复流程,确保在生成站点真正发生故障时,操作人员可以顺畅地进行容灾切换。前提条件 保护组处于 增量复制中 或者已有恢复点之后,您就可以进行故障演练。如何创建跨可用区和跨地域容灾的保护组,请参见 跨可用区容灾...

故障演练

确保操作人员熟悉容灾恢复流程,确保在生成站点真正发生故障时,操作人员可以顺畅地进行容灾切换。前提条件 保护组处于 增量复制中 或者已有恢复点之后,您就可以进行故障演练。如何创建跨可用区和跨地域容灾的保护组,请参见 跨可用区容灾...

高性能版实例

即使计算节点发生故障,也可以保证实例无数据丢失。高可用 AnalyticDB PostgreSQL版 高性能版由于减少了一个副本,在高可用方面出现了一些下降,在物理机故障等极端情况下,集群恢复的时间会变长(8小时以内)。高性能版通过ESSD多副本技术...

容灾管理服务介绍

针对有高可用需求的用户,CADT容灾管理服务提供规划、优化、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行容灾演练,验证系统是否能够抵御资源故障或者AZ故障,保障系统健壮性。主要功能 容灾规划 在用户部署资源前,通过...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。容灾演练操作步骤如下:登录 混合云容灾管理控制台。单击 切换到连续复制型容灾。在 概览 页面,单击目标容灾站点对。在容灾中心页面,单击 受...

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

API安全

API安全模块基于内置检测机制和自定义检测策略,自动梳理已接入 Web应用防火墙(Web Application Firewall,简称WAF)防护的业务的API资产,检测API风险(例如未授权访问、敏感数据过度暴露、内部接口泄露等),通过报表还原API异常事件,...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

数据接口配置说明

本文介绍区块内部的数据接口的配置的方法,帮助您理解区块的数据接口功能。在区块编辑器内,您可以单击区块编辑器右上角的 图标,在 数据接口设置 页签中支持如下数据接口配置操作。切换模式 在对话框上方可以切换数据接口模式,可选 视图...

数据接口配置说明

本文介绍区块内部的数据接口的配置的方法,帮助您理解区块的数据接口功能。在区块编辑器内,您可以单击区块编辑器右上角的 图标,在 数据接口设置 页签中支持如下数据接口配置操作。切换模式 在对话框上方可以切换数据接口模式,可选 视图...

诊断规则

而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现故障的快速定位与处理。本节将向您介绍诊断规则的相关操作。诊断规则是诊断节点的构成,诊断规则...

混合云应用双活容灾最佳实践

说明 演练前,基于MSHA流量监控或其他监控产品,确定业务稳态的监控指标(如日常情况RT≤200ms,错误率),以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。步骤二:应用故障注入 这里使用阿里云故障演练产品,对...

产品架构介绍

多活流量必须经过接入层,以便在故障发生时,通过接入层切换入口流量。比例分流:接入层支持按比例将流量分流到机房。特殊场景下,可以将机房流量切零,从而实现故障情况下的流量切换。精准路由:接入层支持根据HTTP请求Header/Cookie/...

服务等级目标SLO概述

告警规则 告警规则能够根据故障的严重程度,在故障发生时及时发出不同等级的提醒,帮助您在错误预算被过多消耗之前及时响应。ASM基于“多窗口多燃烧率告警策略”生成告警规则,适用于大多数场景。多燃烧率策略下,短时间内的高故障率或持续...

服务等级目标SLO概述

告警规则 告警规则能够根据故障的严重程度,在故障发生时及时发出不同等级的提醒,帮助您在错误预算被过多消耗之前及时响应。ASM基于“多窗口多燃烧率告警策略”生成告警规则,适用于大多数场景。多燃烧率策略下,短时间内的高故障率或持续...

代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

公网NAT网关监控与运维

新建连接速率/新建丢弃连接速率(countS)新建连接速率:NAT网关每秒可新建的TCP和UDP连接数。新建丢弃连接速率:NAT网关每秒新建连接数超过每秒最大新建数连接限制,而导致新建连接数被丢弃。并发连接水位/新建连接水位(%)并发连接水位...

混沌工程缓存实战系列-Redis

由于Redis最常用来做分布式缓存,本文以简单的商品查询场景为例,涉及的基本信息如下:业务场景是查询商品信息,首先查询缓存;如果没有查询到,则查询数据库。使用Jedis连接Redis,并且使用了Jedis-pool的技术。Redis是自建的集群(当然也...

概述

percent 节点/机器内存使用率 磁盘读 io_read_bytes 节点/磁盘读 磁盘写 io_write_bytes 节点/磁盘写 磁盘 IO 等待 io_await 节点/磁盘 IO 等待 包流入速率 traffic_bytin 节点/包流入速率 包流出速率 traffic_bytout 节点/包流出速率 重传...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

调用链采样配置最佳实践

例如电商系统中,商品详情和购买流程的业务逻辑是比查询或编辑用户信息的优先级高,对于这类业务逻辑对应的后端接口,是需要被优先采集以便确保重要的、难以快速复现的链路故障能够被立刻分析和解决。所以这类接口对应的调用链采样率建议...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

查看消费者状态

应用场景 消费者状态信息包括在线状态、订阅关系、消费TPS、消息堆积量和线程堆栈信息等,经常被应用于以下故障排查场景:故障场景 现象 处理建议 订阅关系不一致 在 Group 详情 页面,看到Group ID的 订阅关系 显示 订阅关系不一致,请...

Pod诊断

容器服务平台构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查、...

应用容灾

当灾难发生时,多活系统可以分钟级内实现业务流量切换,用户甚至感受不到灾难发生。“同城多活架构”和“异地多活架构”(代号“单元化”)都是典型的应用多活实现技术。应用多活的优势 分钟级RTO:恢复时间快,阿里内部生产级别恢复时间...

DescribeDBProxyPerformance-查询数据库代理的性能...

接口用于查询RDS实例数据库代理的性能数据。接口说明 适用引擎 RDS MySQL RDS PostgreSQL 说明 云数据库 RDS MySQL 集群系列于 2023 年 10 月 17 日起逐步在各个单元赠送代理数量为 1 的数据库独享代理服务,详情请参见【优惠】RDS MySQL...

DescribeDBProxyPerformance-查询数据库代理的性能...

接口用于查询RDS实例数据库代理的性能数据。接口说明 适用引擎 RDS MySQL RDS PostgreSQL 说明 云数据库 RDS MySQL 集群系列于 2023 年 10 月 17 日起逐步在各个单元赠送代理数量为 1 的数据库独享代理服务,详情请参见【优惠】RDS MySQL...

DescribeDBProxyPerformance-查询数据库代理的性能...

接口用于查询RDS实例数据库代理的性能数据。接口说明 适用引擎 RDS MySQL RDS PostgreSQL 说明 云数据库 RDS MySQL 集群系列于 2023 年 10 月 17 日起逐步在各个单元赠送代理数量为 1 的数据库独享代理服务,详情请参见【优惠】RDS MySQL...

通信能力技术服务协议

API接口:API(Application Programming Interface,应用程序编程接口)提供给开发人员的实现某一特定功能的接口,以下简称“接口”。App key&App secret:指开发者在申请开发新应用时获得的由阿里授予的应用程序接入账户和密钥。App key是...

PushExperimentTask

调用PushExperimentTask接口推进故障演练任务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String 是...

FinishExperimentTask

调用FinishExperimentTask接口停止故障演练任务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String ...

基本概念

本部分将向您介绍本产品中涉及的几个基本概念,以便于您更好地理解混合云容灾产品。概念 描述 故障转移(Fail Over)即容灾恢复,指您的 IDC 应用出现故障时,在阿里云上恢复应用的过程。故障恢复(Fail Back)当您的 IDC 内的环境恢复以后...

ExecuteExperiment

调用ExecuteExperiment接口执行故障演练。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String 是 ...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

GetExperimentTask

调用GetExperimentTask接口查询故障演练任务详情。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 边缘网络加速 负载均衡 邮件推送 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用