设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生,可以...

故障基础数据管理

服务组&值班管理 将故障应急的相关人员群体,通过前置到故障场景的干系人做绑定配置,同时支持服务组和值班,实现故障启动自动快速通知负责人上线处理的效果。在设计相应的管理方案时,需要考虑以下内容:服务组:提供服务的人员群体...

可定制列表

ViewTabFullScreen 工具栏>视图>全屏显示 ToolsTabExportImage 工具栏>效率>导出图片 Mobile 端 CommandBarId 位置 WPPMobileCommentButton 底部工具栏>评论按钮 WPPMobileMarkButton 浮动备注按钮 property 格式Tab insert 插入Tab ...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

Node演练场景

Kubernetes集群中Node资源故障场景,包含CPU、网络和进程等基础资源类演练场景。每个Node场景下都包含通用的Node筛选参数,用于查找目标Node。通用参数说明 参数名称 参数说明 节点名称 节点资源名,选择多个节点资源时资源名之间使用逗号...

功能特性

自动SQL优化 智能压测 确认数据库实例规格是否需要扩容,并验证在真实业务场景下的实际效果,降低上线引发故障的风险。此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索...

无法ping通ECS实例公网IP的排查方法

相关文档 无法连接Linux实例的排查方法 无法远程连接Windows实例的排查方法 无法访问ECS实例中的服务的排查方法 Windows系统的ECS实例ping外网地址提示“一般故障”错误怎么办?为什么Windows系统的ECS实例配置辅助私网IP,无法从ECS实例...

业务连续性

在主地域故障消除,应该将备地域服务在故障期间记录的新增数据同步到主地域,确保主地域恢复时,用户看到的业务数据不会丢失。部署架构示意图 为了尽可能地提升可用性以确保业务连续不中断,上述实践是可以组合使用的。下图是一个同时...

如何配置流转规则

如 P3 故障持续 60分钟未解决 ,自动升级至 P2。故障升级仅支持逐级上升,不可跨上升。业务监控来源:触发事件&报警&故障 重要 以下规则 仅适用于业务监控 的监控源。且进行流转规则配置时,会按当前 关联服务 进行告警数据过滤,因此...

使用ping命令检测ECS与Lindorm之间的连接

新建Lindorm实例,或者使用中的Lindorm实例突然无法连接时,请检查ECS与Lindorm之间的连接。您可以先在ECS的命令行中使用ping命令检测ECS与Lindorm是否能够连通。操作步骤 查看连接地址。登录ECS系统并在命令行中使用如下命令。ping说明 ...

动态与公告

功能/版本 历史版本GTM标准版 新版GTM标准版 新版GTM旗舰版 全网故障恢复时间=故障切换时间+全网生效时间 在健康检查间隔设置为1分钟,TTL60秒,连续失败次数3次的配置下,GTM能在4分钟左右准确发现故障并切换,故障切换理论上60秒左右...

Container演练场景

Kubernetes集群中Pod资源下的容器故障场景,包含容器以及容器内故障场景。每个容器故障场景下都包含通用的容器筛选参数,用于查找目标容器。通用参数 参数名称 参数说明 Pod资源名称 Pod资源名称,多个资源名称之间使用逗号分隔,表示选择...

ZooKeeper的使用场景和MSE ZooKeeper的优势

例如,当一个5节点的ZooKeeper集群,部署在3个可用区的时候,它应该是2/2/1的分布,任意一个可用区出现故障,不影响ZooKeeper的整体可用性,同时阿里云AZ之间的延时低于3ms,可以做到故障的风险可控。高可用负载均衡:MSE ZooKeeper提供的...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

Pod演练场景

Kubernetes集群中Pod资源故障场景,包含删除Pod和Pod网络异常场景。每个Pod场景下都包含通用的Pod筛选参数,用于查找目标Pod。通用参数 参数名称 参数说明 Pod资源名称 Pod资源名称,多个资源名称之间使用逗号分隔,表示选择多个Pod。Pod...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

容灾恢复

集群中通常一个服务有多个服务提供者,其中部分服务提供者可能由于网络、配置、长时间 fullgc、线程池满、硬件故障等导致长连接还存活但是程序已经无法正常响应。单机故障剔除功能会将这部分异常的服务提供者进行降级,使客户端的请求更多...

服务等级目标SLO概述

短时间内的高故障率和低故障率且持续时间较长的故障才能触发告警,避免不必要的告警分散运维人员的精力从而错过真正关键的问题。多窗口能够在计算一段时间的故障率时同时设置一个短时间窗口,当短时间窗口内的故障率低于阈值时结束告警。...

服务等级目标SLO概述

短时间内的高故障率和低故障率且持续时间较长的故障才能触发告警,避免不必要的告警分散运维人员的精力从而错过真正关键的问题。多窗口能够在计算一段时间的故障率时同时设置一个短时间窗口,当短时间窗口内的故障率低于阈值时结束告警。...

产品价格

版本配置 功能项 标准版 旗舰版 全网故障恢复时间=故障切换时间+全网生效时间 在健康检查间隔设置为1分钟,TTL60秒,连续失败次数3次的配置下,GTM能在4分钟左右准确发现故障并切换,故障切换理论上60秒左右可以全网生效,但实际情况取决...

容灾管理服务介绍

针对有高可用需求的用户,CADT容灾管理服务提供规划、优化、部署、演练高可用业务的能力,在业务上线前及业务上线定期进行容灾演练,验证系统是否能够抵御资源故障或者AZ故障,保障系统健壮性。主要功能 容灾规划 在用户部署资源前,通过...

色块

配置滤镜 说明 滤镜配置示例为模糊函数的配置样式,更多配置请参见 CSS层叠样式表)-filter。数据面板 此组件不需要配置数据。交互面板 此组件没有交互事件。蓝图编辑器交互配置 在画布编辑器页面,右键单击组件,选择 导出到蓝图编辑...

访问策略

概述 访问策略是针对用户配置相应的访问策略,在此环节需要设置最终用户访问哪一个地址池。前提条件 已完成创建实例和云资源访问授权的操作。...如默认地址池摘除故障地址,还有存活的IP地址,那么则响应剩余存活的IP地址。

组复制简介

例如,5个节点的集群,3个节点收到Binlog,2个节点未收到Binlog,此时有2个节点故障:如果故障的2个节点是收到Binlog的节点,那至少还有1个节点上有数据。如果故障的2个节点是没收到Binlog的节点,那至少还有3个节点上有数据。说明 多数派...

色块

未配置滤镜 配置滤镜 说明 滤镜配置示例为模糊函数的配置样式,更多配置请参见 CSS层叠样式表)-filter。数据源面板 此组件不需要配置数据。高级面板 此组件没有交互事件。蓝图交互 单击页面左上角的 图标,进入 蓝图 页面。在 图层...

AIOps 解决方案专家服务内容说明

协助实施完成客户应在5个工作日内确认方案,线上签署《服务验收报告》完成验收 8.3.验收计划 根据《8.1验收分项清单》所列示各阶段的交付内容与交付物,本项目将按照以下验收计划进行项目验收,甲方同意根据此验收计划对乙方的交付物...

操作流程

步骤七:故障切换 数据同步切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止再进行最后一轮数据同步,等待数据同步完成再启动切换。这样可以保证容灾端与生产端数据完全一致,无数据丢失。该切换模式适用...

操作流程

步骤七:故障切换 数据同步切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止再进行最后一轮数据同步,等待数据同步完成再启动切换。这样可以保证容灾端与生产端数据完全一致,无数据丢失。该切换模式适用...

网站HTTPS

证书有效期90天,到期前一周自动续期。...登录,单击 控制台。...情形3:申请证书时填写的域名与访问域名不一致。解决方案:重新申请证书并填写正确的域名即可。情形4:使用了不受信任的根证书。解决方案:按上所示步骤重新申请即可。

网站HTTPS

证书有效期90天,到期前一周自动续期。...登录,单击 控制台。...情形3:申请证书时填写的域名与访问域名不一致。解决方案:重新申请证书并填写正确的域名即可。情形4:使用了不受信任的根证书。解决方案:按上所示步骤重新申请即可。

使用PING命令检测ECS与Redis之间的网络连接

新建Redis实例,或在使用过程中突然无法连接Redis实例时,您可以在ECS的命令行中使用PING命令检测ECS与Redis实例网络是否能够连通。操作步骤 获取Redis实例的连接地址,更多信息请参见 查看连接地址。登录客户端所在的ECS实例,并在命令...

通过CADT实现NLB可用区级容灾演练

云速搭CADT(Cloud Architect Design Tools)容灾管理服务提供规划、部署、演练高可用业务的能力,在业务上线前及业务上线定期进行容灾演练,验证系统是否能够抵御资源故障或者可用区故障,保障系统健壮性。本文为您介绍如何通过CADT实现...

高可用性

当可用区故障恢复,通过恢复操作,恢复被切流的可用区,并自动移除切流时补充的计算资源。从而在潜在的可用区故障情况下,实现对客户业务无感知的切换,提升服务稳定性。更多信息,请参见 部署和使用跨可用区实例。AliES内核增强 阿里云...

通过CADT实现ALB可用区级容灾演练

云速搭CADT(Cloud Architect Design Tools)容灾管理服务提供规划、部署、演练高可用业务的能力,在业务上线前及业务上线定期进行容灾演练,验证系统是否能够抵御资源故障或者可用区故障,保障系统健壮性。本文为您介绍如何通过CADT实现...

级联选择器

图表样式 级联选择器是控件组件的一种,可以作为级联表单在可视化应用中使用,将用户选择的数据提交到端进行处理或者通过交互配置,在其他组件上显示用户选择的内容。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索配置...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流可能有5分钟...
共有128条 < 1 2 3 4 ... 128 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用