容灾管理服务介绍

容灾切换:模拟故障发生时,验证业务系统是否能够达到预期的灾备效果。容灾切回:故障恢复后,将资源切回到之前的状态,验证系统的灾难恢复预案是否合理。相关概念 容灾计划 当CADT应用需要进行容灾演练时,需要为其创建容灾计划,加入了容...

云上整机恢复VMware虚拟机

在VMware虚拟机故障时,您可以把已备份的VMware虚拟机整机恢复到阿里云ECS,保障业务快速恢复。本文介绍如何把已备份的VMware虚拟机整机恢复到阿里云ECS上。前提条件 已完成VMware虚拟机备份。更多信息,请参见 备份VMware虚拟机。已了解...

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...

如何管理故障

故障发生条件 当事件重要程度上升、整体影响面恶化、持续长时间未解决,综合评估已达到故障时(P1-P4),处理人可手动将事件升级为故障。当报警来源的指标持续恶化,触发故障产生规则,系统自动产生故障。故障过程 故障过程用于记录管理...

应用场景

以此,降低产品使用过程中故障发生概率,提高故障恢复效率,进而实现产品高可用性的有效提升。机房级容灾 同城双活 同一个城市,建设两个机房环境,两地距离 50 km 以内,万兆光纤专线互连,业务应用层面可以两个机房同时提供业务服务,当...

诊断决策树

对于已知的明确故障,可以根据诊断现象,编排诊断决策树,进而故障发生时执行,完成故障定位。对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策树 登录高可用管理控制台。在左侧导航栏上,单击 ...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换设备故障。用户侧交换...

创建专有宿主机

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕自动迁移。重要 本地SSD型DDH不支持宿主机...

诊断规则

而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现故障的快速定位与处理。本节将向您介绍诊断规则的相关操作。诊断规则是诊断节点的构成,诊断规则...

创建DDH

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕自动迁移。重要 本地SSD型DDH不支持宿主机...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

什么是消息演练

单个或多个模块都可能会有不同类型的故障发生,导致模块不能正常运行,例如Producer无法发送消息,这种场景叫做消息的演练场景。需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

产品架构介绍

多活流量必须经过接入层,以便在故障发生时,通过接入层切换入口流量。比例分流:接入层支持按比例将流量分流到机房。特殊场景下,可以将机房流量切零,从而实现故障情况下的流量切换。精准路由:接入层支持根据HTTP请求Header/Cookie/...

服务等级目标SLO概述

告警规则 告警规则能够根据故障的严重程度,在故障发生时及时发出不同等级的提醒,帮助您在错误预算被过多消耗之前及时响应。ASM基于“多窗口多燃烧率告警策略”生成告警规则,适用于大多数场景。多燃烧率策略下,短时间内的高故障率或持续...

服务等级目标SLO概述

告警规则 告警规则能够根据故障的严重程度,在故障发生时及时发出不同等级的提醒,帮助您在错误预算被过多消耗之前及时响应。ASM基于“多窗口多燃烧率告警策略”生成告警规则,适用于大多数场景。多燃烧率策略下,短时间内的高故障率或持续...

使用动态IVR实现呼转

以上述应用场景为例,您在语音服务平台申请可以呼入呼出的号码,并使用动态IVR功能,用户使用产品时发生故障主动拨打使用动态IVR功能的号码,整个业务流程为:本文通过Spring Boot实现供动态IVR流程中语音平台调用的回调接口。实现思路 ...

IvrCall-向指定号码发起交互式语音通话

用户接听电话后会听到一段语音,提示用户按键选择。如果开启了 消息回执,语音服务会将客户按键信息返回给调用的业务系统。该接口可用于收集客户的订单确认、问卷调查、满意度调查等信息。QPS 限制 单用户调用频率:100 次/秒。调试 您可以...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

灾备规划

如果您的AD服务器是集中部署在一个数据中心,可能发生同一时间离线的情况,建议您:用混合云灾备一体保护AD服务器,在云下发生故障时首先恢复这台AD服务器。在云上VPC里部署一个从AD服务器,与云下的主AD服务器保持连接。云下发生故障时...

设备级高可用

在购买智能接入网关设备时,您可以选择购买两台设备,两台设备绑定到同一实例中,互为备份,在一台设备发生故障时进行设备切换,保障业务不中断。通过本文您可以在智能接入网关控制台查看设备级备份信息。前提条件 您购买的智能接入网关...

故障管理

通过建立一个规范可遵循、全流程闭环的故障管理体系,配合技术手段的提升,可以有效降低故障发生的几率,缩短故障的MTTR,最终使故障造成的破坏性趋近于0。在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

SendDtmfSignaling-发送按键信息

调用SendDtmfSignaling在通话过程中发送DTMF按键信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 ...

坐席工作台

运营商对于同一号码的呼叫一般都有频次限制,如果您使用了该模式请联系运营商对于场外模式接听的电话进行加白处理,否则也会造成场外模式接听坐席手机接不到电话的问题。点击以场内模式上线重新回到坐席工作台接听 三、错误反馈与帮助 1、...

坐席工作台

运营商对于同一号码的呼叫一般都有频次限制,如果您使用了该模式请联系运营商对于场外模式接听的电话进行加白处理,否则也会造成场外模式接听坐席手机接不到电话的问题。点击以场内模式上线重新回到坐席工作台接听 三、错误反馈与帮助 1、...

高可用拓扑

背景信息 您可以通过购买两台智能接入网关设备组成高可用网络接入阿里云,智能接入网关设备备份方式分为双冷备和双热备两种:双冷备:主设备在线,当主设备发生故障时,用备设备替换主设备连接入网,且需在智能接入网关管理控制台...

订阅事件通知

云监控的报警服务为您提供以下两种报警通知能力,当阿里云产品发生系统异常时,您可以及时知晓发生的事件,并自动处理异常事件(例如云产品故障)。提供通过 短信、邮件、钉钉机器人的方式,对事件发生进行报警。提供将事件分发到您的消息...

订阅事件通知

云监控的报警服务为您提供以下两种报警通知能力,当阿里云产品发生系统异常时,您可以及时知晓发生的事件,并自动处理异常事件(例如云产品故障)。提供通过 短信、邮件、钉钉机器人的方式,对事件发生进行报警。提供将事件分发到您的消息...

概述

分布式系统将计算任务和数据分布在多个节点上以实现更高的性能、可靠性和可扩展性,当一个节点发生故障或错误时,其他节点可以继续工作,相比于单机系统,架构本身就有较高的节点容错性。但随着服务拆分,更多组件的引入,分布式系统的复杂...

配置设备级高可用

当主网关设备发生故障时,HA机制能够从备份的网关设备中选举一台设备成为新的主网关设备,用来承担数据流量,从而保障网络的可靠通信。动态HA功能无需配置虚IP地址,系统会主动帮您探测设备状态,在主网关设备故障时,自动帮您切换流量。...

双机冷备切换至双机热备

当主设备发生故障时,需在智能接入网关管理控制台切换备设备为主设备,备设备替换主设备连接入网。双热备:两台设备同时在线。自动检测,自动切换主备设备。SAG-100WM默认为双冷备模式,您可以通过本文操作将其切换为双热备模式。在...

恢复VMware虚拟机

背景信息 完成VMware虚拟备份任务后,您可以在VMware虚拟出现故障时,在Cloud Backup控制台将其备份时的状态迅速恢复至本地或者阿里云VMware服务,以保证业务连续性。虚机备份服务从1.0.13开始支持在Cloud Backup控制台上统一管控备份...

演练场景说明

Java 场景名称 特性 虚拟场景 故障演练支持的虚拟场景。代码逻辑场景 故障演练支持的代码逻辑场景。JVM注入动态脚本 向指定的Java方法注入一段动态代码,您可通过代码方式实施任意故障场景,例如篡改方法入参、篡改方法返回值等。K8s类...

API概览

专有宿主机是单租户独享的物理资源,您可以在专有宿主上自行创建ECS实例和获取物理服务器属性等信息。DescribeDedicatedHosts 查询专有宿主机详细信息 调用DescribeDedicatedHosts查询一台或多台专有宿主机的详细信息,包括物理性能...

什么是混合云容灾服务

RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云上将应用恢复运行所需要的时间。混合云灾备一体 阿里云推出的具有容灾备份功能的一体。混合云容灾定价 HDR支持按量付费和包年包月资源包。关于混合云容灾HDR的计量项...

功能概览

通过简单、安全及可靠的方式将虚拟整机数据备份上云,确保客户本地机房出现故障、虚拟、生产系统数据发生误删、勒索病毒等事故时可以从云上的备份库将虚拟整机恢复到本地VMware环境、阿里云VMware服务或阿里云ECS,实现业务系统...

RedeployDedicatedHost-执行专有宿主机的故障迁移

调用RedeployDedicatedHost执行专有宿主机的故障迁移。接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询...

RedeployDedicatedHost-执行专有宿主机的故障迁移

调用RedeployDedicatedHost执行专有宿主机的故障迁移。接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

回切至本地VMware

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟出现问题后把云上恢复出来的ECS回切到云下VMware环境中。前提条件 已部署CDR网关。更多信息,请参见 步骤三:部署CDR网关。已在被保护的Windows服务器上安装阿里云复制...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云虚拟主机 运维安全中心(堡垒机) 云数据库 Redis 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用