教程概览

6、容灾预案:容灾预案可以帮助用户实现容灾演练,或发生故障时快速切换访问流量,包括创建容灾预案、执行/回滚等相关信息。7、日志信息:介绍全局流量管理运行状态的告警日志,包括:健康检查告警、健康检查恢复、地址池可用、地址池...

跨项目克隆说明

跨项目克隆主要用于隔离同租户(阿里云账号)简单模式工作空间下的开发环境和生产环境,您也可以利用跨项目克隆功能实现计算、同步等类型的任务在工作空间之间的克隆迁移。本文为您介绍如何处理跨项目克隆时任务间的依赖关系。通过 跨项目...

MSE注册配置中心高可用最佳实践

无容灾保护 当来自Consumer端的请求量突然增加时,如果Provider容量水位较高,会导致个别Provider发生故障:注册中心会将故障节点摘除,全量流量会给剩余节点。剩余Provider节点负载变高,大概率也会发生故障。最终所有Provider节点故障,...

流水单据型业务场景多活实践

说明 基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。演练预期如下:下单链路对订单应用是强依赖,强依赖故障会影响业务可用。故障爆炸半径控制在...

什么是读写分离

读写属性处理逻辑 读写属性 权限分配方式 主实例权重 正常情况 删除最后一个只读实例 只读实例全部故障 只读 系统分配或自定义 主实例权重不可设置 主实例:不可不可写(不转发)代理地址:可读不可写 主实例:不可不可写(不转发)...

功能特性

专线+Internet备份:智能接入网关支持Internet链路和专线互为备份链路,当主用链路发生故障时,自动切换至备用链路接入阿里云。说明 目前仅 SAG-1000支持专线功能,SAG-100WM支持专线功能。更多信息,请参见 什么是高速通道。路由方式 ...

灾备规划

RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,RPO就要求越小。RPO越小,往往要求数据备份、复制频率更高,对生产环境、网络的压力也会越大,成本通常也越高。RTO:指故障发生后,期望...

读多写少型业务场景多活实践

演练预期如下:导购链路对购物车应用是弱依赖(导购页会展示用户放入购物车的商品数量),弱依赖故障不影响业务。导购链路对商品应用是强依赖,强依赖故障将导致业务不可用,因此故障的爆炸半径应该控制在单元内。创建故障演练。创建杭州...

访问控制常见问题

配置限制访问CDN资源的用户时,如果遇到疑问请参考以下常见问题及处理建议。...远程鉴权服务器发生故障或宕机时,CDN与鉴权服务器之间的数据交互超时后,按照设置的 鉴权超时之后的动作 参数,选择是否放行鉴权超时的用户请求。

跨可用区容灾(Beta)

当生产实例发生故障且容灾实例处于待机状态时,您根据实际情况自行判断是否将容灾实例切换成主实例。重要 生产实例故障时,如存在部分数据未同步至容灾实例。容灾实例异常切换成主实例后,将缺失这部分数据。因此,您在进行异常切换时,...

多节点部署架构

多节点的架构用于保障集群的高可用,当系统发生故障时,读写的主节点和只读节点之间会自动进行故障切换(Failover)。此外,通过 PolarDB 的数据库代理功能,在这些节点的基础上实现读写分离等功能,具体参见 数据库代理。同个集群...

应用场景

通过构建灾备库,使用数据同步服务实时增量同步主库数据以确保主库与灾备库数据的完全一致,当业务中心发生地区故障时,直接将业务流量切换到灾备中心,即可立刻恢复服务。在灾备接管期间,通过反向数据同步,实现随时切回主库。

云盘三副本技术

数据保护机制 当有数据节点损坏,或者某个数据节点上的部分硬盘发生故障时,集群中部分Chunk的有效副本数就会小于三。此时,Master就会发起自动同步任务,在Chunk Server之间复制数据,使集群中所有Chunk的有效副本数达到三份。重要 如果...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

什么是应用高可用服务AHAS

使用场景 架构 容灾能力 适用场景 同城多活 RPO:地域级故障不可控;机房级故障为秒~分钟级。RTO:地域级故障不可控;机房级故障为分钟~十分钟级。说明 具体以主备数据同步延迟的情况而定。预算有限,不考虑异地容灾。期望建设周期短(≤2...

合规审计

可追溯:记录云上管控的整个过程并长期留存,这对于故障排查和历史问题回溯有必不可少的作用。也让企业能够基于历史不断完善和优化运维框架。如果把企业运行在云上的业务比作行驶在高速上的车队,那审计合规就是高速护栏、违章摄像头和行车...

产品系列概述

备节点不可访问。支持增加 只读实例 扩展读能力。大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。集群系列 一主多备的高可用架构,支持自动故障切换。备节点可访问,提升读能力。可增加更多备节点进一步...

集群系列

基于EBS(Elastic Block Storage)提供的秒级快照能力,将数据恢复耗时从几十分钟缩短到1分钟,从而实现了99%的场景下,备节点从故障发生到节点恢复超过10分钟。应用场景 适用于有大量流量高峰读请求和数据智能分析需求的大中型企业的...

网络架构容灾

当地址池中地址发生故障时,HealthCheck模块会准确的检测到异常情况并与DNS交互(如下图中序号3所示),摘除故障地址(如下图中序号4所示),这样用户端会自动解析到可用的地址池(如下图中序号5所示)。并当故障地址恢复时,自动恢复至...

FAQs

GSLB 子域名开启 不支持,需要结合网站监控 需要另行购买监控服务 必须在域名账号下使用 受子域名的TTL限制 不支持,需要结合云解析的线路配置 随机选择正常链路,不可控 全局流量管理(GTM)的CNAME接入域名是否能直接通过URL访问?...

创建DDH

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH支持宿主机...

安装程序时提示目录不可

问题现象 使用Linux云虚拟主机安装网站程序,自动检测主机安装环境时,提示 logreport/的权限为 不可写。问题原因 Linux虚拟主机的 logreport/目录用于存储控制面板的访问统计报告记录,您只有可读权限,无法对该目录执行修改或删除操作。

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

集群架构

数据分片(data shards)每个数据分片均为双副本(分别部署在不同机器上)高可用架构,主节点发生故障后,系统会自动进行主备切换保证服务高可用。配置服务器(config server)采用双副本高可用架构,用于存储集群配置信息及分区策略。各...

概述

分布式系统将计算任务和数据分布在多个节点上以实现更高的性能、可靠性和扩展性,当一个节点发生故障或错误时,其他节点可以继续工作,相比于单机系统,架构本身就有较高的节点容错性。但随着服务拆分,更多组件的引入,分布式系统的复杂...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

EMR Kafka磁盘故障运维

当磁盘发生故障时,应及时完成相关故障的处理,及时恢复集群的容错能力。磁盘运维概述 本文从磁盘监控和磁盘故障恢复角度来介绍磁盘运维策略。磁盘监控 以下内容从Kafka服务层面以及ECS系统层面来简单了解一下磁盘的监控策略。Kafka服务...

故障管理

通过建立一个规范遵循、全流程闭环的故障管理体系,配合技术手段的提升,可以有效降低故障发生的几率,缩短故障的MTTR,最终使故障造成的破坏性趋近于0。在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的...

什么是物模型

物模型是阿里云物联网平台为产品定义的数据模型,用于描述产品的功能。...重要 多个自定义物模型文件内的 functionBlockName 和 functionBlockId 不可重复。相关文档 单个添加物模型 批量添加物模型 设备使用物模型通信 校验物模型数据

观测监控 Prometheus 版何时会自动释放实例资源?

待Prometheus实例数据在指标存储时间内无数据后,会释放对应的实例资源,被释放的实例资源均不可再恢复。若您因其他业务需求不再使用 可观测监控 Prometheus 版 时,您可以选择自主卸载对应的Prometheus实例,终止指标继续上报数据,以停止...

功能概览

跨地域容灾 容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免...

常见问题-FAQ

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM最快在1分钟左右准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台...

创建专有宿主机

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH支持宿主机...

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

欠费说明

欠费后影响 当您的欠费状态持续7天后(从欠费时间起至7个自然日后的同一时间),可观测监控 Prometheus 版 将会停止接收上报的指标数据,待存储时间内无数据后,会释放实例资源,被释放的实例和数据均不可再恢复。在您欠费的7天内,可观测...

欠费说明

欠费后影响 当您的欠费状态持续7天后(从欠费时间起至7个自然日后的同一时间),可观测监控 Prometheus 版 将会停止接收上报的指标数据,待存储时间内无数据后,会释放实例资源,被释放的实例和数据均不可再恢复。说明 按量计费默认存储时...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

克隆安全组

您可以通过克隆安全组快速创建一个或多个安全组,且支持跨地域、跨网络类型克隆安全组。适用于在安全组规则较多时,进行跨地域复制安全组规则、安全组规则备份等场景。本文介绍如何通过ECS管理控制台克隆安全组。前提条件 如果您需要将安全...

步骤五:应用容灾

确保操作人员熟悉容灾恢复流程,当主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 页面,选择 恢复网络、...

GTM如何实现同城容灾

创建1个全局访问策略,解析请求流量 选择 全局,主地址池集合 选择「业务中心01」地址池和「业务中心02」地址池,负载均衡策略 选择 返回全部地址,此设置实现两个数据中心同时提供服务和发生故障时系统自动摘除故障地址的效果。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 商标服务 轻量应用服务器 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用