诊断决策树

对于已知的明确故障,可以根据诊断现象,编排诊断决策树,进而故障发生时执行,完成故障定位。对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策树 登录高可用管理控制台。在左侧导航栏上,单击 ...

诊断规则

而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现故障的快速定位与处理。本节将向您介绍诊断规则的相关操作。诊断规则是诊断节点的构成,诊断规则...

地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

功能概览

地域容灾 容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免...

什么是消息演练

单个或多个模块都可能会有不同类型的故障发生,导致模块不能正常运行,例如Producer无法发送消息,这种场景叫做消息的演练场景。需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

地域灾备

同时MaxCompute统一元数据能力支持元数据地域高可用,则当主集群地域发生故障且无法恢复时,通过修改项目归属地域的元数据,将项目快速切换到备份集群地域,实现业务的无缝恢复,示意图如下所示。重要 目前地域灾备功能处于邀测阶段,...

服务等级目标SLO概述

告警规则 告警规则能够根据故障的严重程度,在故障发生时及时发出不同等级的提醒,帮助您在错误预算被过多消耗之前及时响应。ASM基于“多窗口多燃烧率告警策略”生成告警规则,适用于大多数场景。多燃烧率策略下,短时间内的高故障率或持续...

服务等级目标SLO概述

告警规则 告警规则能够根据故障的严重程度,在故障发生时及时发出不同等级的提醒,帮助您在错误预算被过多消耗之前及时响应。ASM基于“多窗口多燃烧率告警策略”生成告警规则,适用于大多数场景。多燃烧率策略下,短时间内的高故障率或持续...

地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 面板,选择 恢复...

多可用区部署

当主实例1发生故障或者可用区A不可用时,用户将访问的连接切换至备实例2或者可用区B,从而实现高可用,主备容灾的高可用架构图如下所示。主备容灾的方案虽然能够满足大部分用户的高可用需求,但是这种主备容灾方案并不适用所有的业务,存在...

CLB结合全局流量管理实现地域负载均衡

在一个地域服务发生故障时,流量可以被转发到另一个地域的正常服务上,从而确保业务的连续性。全局流量管理简介 全局流量管理(Global Traffic Manager),简称GTM,是在 DNS 层面上实现的全球流量管理和负载均衡服务,可以帮助企业在短...

网络架构容灾

当地址池中地址发生故障时,HealthCheck模块会准确的检测到异常情况并与DNS交互(如下图中序号3所示),摘除故障地址(如下图中序号4所示),这样用户端会自动解析到可用的地址池(如下图中序号5所示)。并当故障地址恢复时,自动恢复至...

RDS SQL Server异地容灾

RDS SQL Server提供了异地容灾方案,可以将源实例的业务数据自动同步至容灾实例中,当源实例所在地域的RDS实例发生故障时,可手动切换系统到容灾地域的RDS实例上,从而保障业务的连续性和可用性。前提条件 已在地域A和地域B分别创建了RDS ...

产品架构介绍

多活流量必须经过接入层,以便在故障发生时,通过接入层切换入口流量。比例分流:接入层支持按比例将流量分流到机房。特殊场景下,可以将机房流量切零,从而实现故障情况下的流量切换。精准路由:接入层支持根据HTTP请求Header/Cookie/...

概述

异地容灾 如果业务部署在多个地域,可以通过在多个地域创建主备实例,实现地域的数据库高可用,当一个地域出现故障时,只需要将业务手动切换到备实例即可。说明 主备实例切换耗时约 5 分钟,切换过程中,可能会出现链接闪断。建议在业务...

术语

主地址(Primary Endpoint)主节点的访问点,当发生故障切换(Failover)后,系统会将访问点自动指向新的主节点。集群地址(Cluster Endpoint)整合集群下的多个节点,对外提供一个统一的读写地址,可以设置为只读或读写。集群地址具有自动...

集群高可用架构推荐配置

多可用区的地域:所有托管组件均严格采用多副本、多AZ均衡打散部署策略,确保在单个可用区或节点发生故障时,集群仍然能够正常提供服务。单可用区地域:所有托管组件均严格采用多副本、多节点打散部署策略,确保在单个节点发生故障时,集群...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。容灾演练操作步骤如下:登录 混合云容灾管理控制台。单击 切换到连续复制型容灾。在 概览 页面,单击目标容灾站点对。在容灾中心页面,单击 受...

备份和灾难恢复

阿里金融云可以支持同城双活/灾备、两地三中心等架构方式。1.同城双活 同城双活、灾备是阿里金融云的...故障切换回切:DNS将生产IP从原生产中心修改到灾备中心,实现Region的故障切换和服务恢复机制,主站发生故障时,由备站继续提供服务。

网络资源

容灾:建立容灾和高可用的系统架构,将系统部署在多个地理位置或数据中心,并使用负载均衡和故障切换技术,以确保即使发生网络分区,系统仍然可以继续提供服务。网络闪断故障 指网络连接在短时间内频繁中断和恢复,造成网络连接不稳定的...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用分析快速定位问题代码。本文介绍如何通过调用分析快速定位五种经典线上问题,更直观地了解调用分析的用法与价值。背景...

错误码

200 请求处理成功 131077 参数错误 327685 Fabric 区块参数错误 459265 Access Token 权限不足 1179905 阿里云内容安全服务未授权 1179653 内容安全检查参数错误,交易过大 1180418 内容安全检查不通过 1114113 区块SDK发生错误

搭建高可用架构

为保障您的业务正常运行,RDS提供各类高可用功能,例如独享型规格、高可用系列、多可用区、地域备份恢复等等。创建高可用架构实例 在 创建实例 时,您需要关注如下几个涉及高可用架构的选项:系列:RDS支持多种系列,建议您选择 高可用...

境SaaS:深圳市易仓科技有限公司

PolarDB 采用存储和计算分离的架构,提供分钟级的配置升降级、秒级的故障恢复、全局数据一致性和免费的数据备份容灾服务,既融合了商业数据库稳定可靠、高性能、可扩展的特征,又具有开源云数据库简单开放、自我迭代的优势。本文介绍深圳市...

应用容灾

当灾难发生时,多活系统可以分钟级内实现业务流量切换,用户甚至感受不到灾难发生。“同城多活架构”和“异地多活架构”(代号“单元化”)都是典型的应用多活实现技术。应用多活的优势 分钟级RTO:恢复时间快,阿里内部生产级别恢复时间...

应用场景

库表级恢复 全量数据备份是最普遍的备份解决方案,发生数据误删除时,传统方案需要将整个实例数据全部恢复,然后从中找出误删除表,其他数据都丢弃掉,大部分时间花费在无效工作上,这种方案会大大延长故障恢复时间。为了降低数据库故障...

联通境服务相关文件下载

文件名称 使用场景 下载地址 联通境协议授权书 在提交境合规资料时必须提供。下载链接 联通境增加发票多抬头说明函 联通默认...下载链接 联通境云专线调账模板 如果发生错账需要调账,请按照此文件格式向联通发起调账申请。下载链接

阿里云上稳定性保障服务(容灾)内容说明

1.服务概述 1.1 服务说明 帮助客户在云上建立容灾能力,当灾难发生时,在保证生产环境的数据尽量少丢失的情况下,保证生产系统的业务不间断运行,促进故障逃逸能力的提升。1.2 适用的客户场景 云上容灾服务适用于客户同一个地域(Region)...

关键技术竞争力

生产运维智能化:技术风险体系保障业务连续性 TRaaS(Tech Riskdefend as a Service)技术风险防控平台,以蚂蚁内部 SRE 长期实践方法论和内部工具沉淀为依托,解决用户上云和分布式改造过程中所面临的可观测、故障应急、容灾、混沌工程、...

基于多集群实现地域容灾和流量负载均衡

地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现地域容灾。以Bookinfo应用为例,本文介绍如何使用地域故障转移和流量分布能力实现地域容灾和流量负载均衡。网络规划 在进行操作前,您需要对vSwitch...

故障管理

通过建立一个规范可遵循、全流程闭环的故障管理体系,配合技术手段的提升,可以有效降低故障发生的几率,缩短故障的MTTR,最终使故障造成的破坏性趋近于0。在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的...

基于多集群实现地域容灾和流量负载均衡

地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现地域容灾。以Bookinfo应用为例,本文介绍如何使用地域故障转移和流量分布能力实现地域容灾和流量负载均衡。网络规划 在进行操作前,您需要对vSwitch...

实体多账号关联协议

4.1.3 用户应自行对实体多账号关联及相应授权的行为及后果承担责任,阿里云不因对用户提供相应的功能与服务,承担超出技术服务之外的义务。4.1.4 用户建立实体多账号关联及相应授权的行为及后续操作,不会置阿里云于违约或者违法的境地...

主从(备)切换原因

实例故障 阿里云检测到实例发生故障,无法正常使用,系统会发起主从(备)切换,及时恢复业务正常运转,缩小故障影响范围。主从(备)切换完成后,实例状态会显示运行中,您不需要进行任何操作,实例可以正常运行。您可以在 服务可用性 ...

云服务集成简介

阿里云区块服务的云服务集成为您提供了便捷的下协同功能,帮您省去了区块与其它云服务的集成开发成本。同时云服务集成也为您提供 REST API,其配置及开发过程相比区块SDK更为简单,您可以直接通过 REST API 调用智能合约、查询...

查看智能洞察事件列表

智能洞察详情 应用服务整体平均响应时间突增 应用服务整体平均响应时间突增 类型的事件详情页面显示了事件发生时间点、根因分析和故障传播。在智能洞察详情页面,您可以执行以下操作:单击 根因分析 区域的疑似根因链接,在疑似根因面板...

云原生多模数据库Lindorm助力蚂蚁IoT数据降本

蚂蚁链坚持核心技术突破,融合包括区块链、AIoT、智能⻛控等技术,通过链接各个产业网络,扎实解决行业实际问题,推动区块链技术平⺠化。从2016到2020年,蚂蚁链的区块链专利申请和授权的数量巨大,技术上已经能够支持10亿账户规模,同时...

应用场景

当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务,CLB 已在各地域部署了多可用区以实现同地域容灾。当...

ECS整机恢复

当ECS整机发生系统故障或者错误操作时,您可以通过备份点的克隆和恢复功能,实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。重要 当源ECS存在时,支持直接...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
区块链服务 云服务器 ECS 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用