替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

ListTransitRouterCidr-查询转发路由器下CIDR地址

如果当前参数的返回值为 true,则在您创建了私网网关类型的 VPN 连接,并为私网网关类型的 VPN 连接创建了路由学习关系后,系统自动在与 VPN 连接建立路由学习关系的转发路由器路由表中添加一条路由条目:目标网段为转发路由器地址的黑洞...

使用Hint语法

执行该命令后,后续所有命令只发往rr-bpxxxxx实例,如果这个实例发生故障,则返回报错 set force node 'rr-bpxxxxx' is not found,please check.说明 通常不建议使用/*force_proxy_internal*/语法,会导致后续所有请求都发往该实例,读写...

故障处理流程

当智能接入网关设备发生网络故障后,您可以先观察现象、收集信息,然后对现象和信息进行分析诊断,尝试修复问题。本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下...

HINT语法使用说明

例如/*force_proxy_internal*/set force_node='pi-bpxxxxxxxx',执行该命令后,后续所有查询命令只发往 pi-bpxxxxxxxx 节点,如果该节点发生故障,则返回报错 set force node 'rr-bpxxxxx' is not found,please check.当开启列存和行存...

SSL VPN客户端连接失败

解决方案 检查客户端路由是否正常,具体操作如下:Windows客户端:执行以下命令,查看客户端本地路由,检查是否有包含云上网段路由。route print-4 系统显示类似如下。Linux或Mac客户端:执行以下命令,查看客户端本地路由,检查是否有包含...

DTS通过物理专线访问本地IDC数据库

高级配置 系统默认为您选中三种高级功能,即 自动关联至转发路由器的默认路由表、自动传播系统路由至转发路由器的默认路由表 和 自动为VPC的所有路由表配置指向转发路由器的路由。本文保持默认配置。在 连接网络实例 页面,单击 继续创建...

通过物理专线实现本地IDC与云上VPC互通

配置项 地址 云上VPC网段 192.168.0.0/16 本地IDC网段 172.30.0.0/24 VBR互联IP 阿里云侧:10.0.0.1/30 客户侧:10.0.0.2/30 子网掩码:255.255.255.252 健康检查 源IP:172.16.0.2 目的IP:10.0.0.2 前提条件 您已经在阿里云华东1(杭州...

云下IDC网络互联配置(同一地域)

VPC专有网络互联配置(同一地域)互联配置添加路由 操作步骤 经过路由条目检查后,确认转发路由器及云下IDC的路由表等都有对应的路由条目后,在VMware服务控制台的 互联配置 下选择 云下互联 点击 添加云下网 输入路由的 名称 及 网段 ...

产品架构介绍

多活流量必须经过接入层,以便在故障发生时,通过接入层切换入口流量。比例分流:接入层支持按比例将流量分流到机房。特殊场景下,可以将机房流量切零,从而实现故障情况下的流量切换。精准路由:接入层支持根据HTTP请求Header/Cookie/...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

专有网络概述

路由器 路由器是专有网络的枢纽。作为专有网络中重要的功能组件,它可以连接专有网络内的各个交换机,同时也是连接专有网络和其他网络的网关设备。每个专有网络创建成功后,系统会自动创建一个路由器。每个路由器至少关联一张路由表。更多...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

混合网络概述

配置云下网络到云上云产品内网IP地址路由。具体操作如下。ACR:ACK组件内网镜像地址与路由网段对照表。Prometheus:Prometheus内网域名与路由网段对照表。OSS:OSS内网域名与VIP网段对照表。相关文档 部署和配置Terway网络插件 配置...

基于ACK One构建混合云同城容灾系统

配置云下网络到云上云产品内网IP地址路由。具体操作如下。ACR:ACK组件内网镜像地址与路由网段对照表。Prometheus:Prometheus内网域名与路由网段对照表。OSS:OSS内网域名与VIP网段对照表。步骤四:关联注册集群和ACK集群到ACK One ...

Spring Cloud Gateway应用路由

EDAS会强制添加 r-前缀,避免与应用原有的路由ID发生冲突。URI 网关上游服务的URI。支持 http:// 、https:// 、lb:/三种前缀的URI,其中 lb:/代表服务发现场景。说明 URI配置 lb:/svcName 服务发现类型时,要求Spring Cloud Gateway应用内...

托管节点池节点自动恢复

当节点的运行状态发生变化并持续一段时间后,ACK将判定该状态符合故障状态,存在节点故障。当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。完整的故障演练...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

围绕混沌工程的平台实践

因此混沌工程是一门学科,它提供了基本的理论指导,而故障演练是混沌工程的具体实践,通过向目标系统注入真实可能发生故障来考量系统的稳定性。混沌工程和AHAS Chaos AHAS Chaos是以混沌工程为理论指导的故障演练平台,目标是成为混沌...

高可用拓扑

背景信息 您可以通过购买两台智能接入网关设备组成高可用网络接入阿里云,智能接入网关设备备份方式分为双机冷备和双机热备两种:双机冷备:主设备在线,当主设备发生故障时,用备设备替换主设备连接入网,且需在智能接入网关管理控制台...

流水单据型业务场景多活实践

在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复。说明 这里区别于传统的解决思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦。容灾切换...

名词解释

这种模式下,两个城市的三个数据中心互联互通,如果⼀个数据中心发生故障或灾难,其他数据中心可以正常运行并对关键业务或全部业务实现接管。命名空间 多活命名空间MSHA Namespace,是一个逻辑租户的概念,用于进行租户粒度的管控配置和云...

网络架构容灾

当地址池中地址发生故障时,HealthCheck模块会准确的检测到异常情况并与DNS交互(如下图中序号3所示),摘除故障地址(如下图中序号4所示),这样用户端会自动解析到可用的地址池(如下图中序号5所示)。并当故障地址恢复时,自动恢复至...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

基于多集群实现跨地域容灾和流量负载均衡

跨地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现跨地域容灾。以Bookinfo应用为例,本文介绍如何使用跨地域故障转移和流量分布能力实现跨地域容灾和流量负载均衡。网络规划 在进行操作前,您需要对vSwitch...

基于多集群实现跨地域容灾和流量负载均衡

跨地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现跨地域容灾。以Bookinfo应用为例,本文介绍如何使用跨地域故障转移和流量分布能力实现跨地域容灾和流量负载均衡。网络规划 在进行操作前,您需要对vSwitch...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进,避免历史同类故障重复发生

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

CreateTransitRouterCidr-创建转发路由器下CIDR地址

转发路由器地址是您为转发路由器自定义的一个地址,该地址类似于为路由器环回口(Loopback接口)分配IP地址的地址。您可以调用CreateTransitRouterCidr接口创建转发路由器下CIDR地址。接口说明 转发路由器地址是您为转发路由器...

读写分离

以此确保单个只读节点发生故障时,不会影响应用的正常访问。当节点被修复后,该节点会自动被加入请求分配体系内。功能限制 暂不支持如下命令或功能:不支持Replication-mode方式进行建连,即不支持通过读写分离地址自行搭建主备复制集群。...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 负载均衡 云解析DNS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用