跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

混合云应用双活容灾最佳实践

说明 演练前,基于MSHA流量监控或其他监控产品,确定业务稳态的监控指标(如日常情况RT≤200ms,错误率),以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。步骤二:应用故障注入 这里使用阿里云故障演练产品,对...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

租户内存使用率告警

集群转储功能可能发生故障。处理方法 查看租户的写入监控,如果发现内存告警期间同时写入突然增大,那么需要根据业务场景来调整租户的内存规格,如果集群内存资源已经分配满了,可以考虑对集群规格进行扩容。如果是集群转储功能出现...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

窃电用户自动识别概述

通过上述数据信息,提取出窃电漏电用户的关键特征,构建窃漏电用户的识别模型,即可自动判断用户是否存在窃电漏电行为,降低稽查工作人员的工作量,并保障用户的正常、安全用电。窃电用户自动识别教程涉及的具体开发流程如下:环境准备 ...

产品架构介绍

多活流量必须经过接入层,以便在故障发生时,通过接入层切换入口流量。比例分流:接入层支持按比例将流量分流到机房。特殊场景下,可以将机房流量切零,从而实现故障情况下的流量切换。精准路由:接入层支持根据HTTP请求Header/Cookie/...

服务等级目标SLO概述

告警规则 告警规则能够根据故障的严重程度,在故障发生时及时发出不同等级的提醒,帮助您在错误预算被过多消耗之前及时响应。ASM基于“多窗口多燃烧率告警策略”生成告警规则,适用于大多数场景。多燃烧率策略下,短时间内的高故障率或持续...

服务等级目标SLO概述

告警规则 告警规则能够根据故障的严重程度,在故障发生时及时发出不同等级的提醒,帮助您在错误预算被过多消耗之前及时响应。ASM基于“多窗口多燃烧率告警策略”生成告警规则,适用于大多数场景。多燃烧率策略下,短时间内的高故障率或持续...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 面板,选择 恢复...

大数据实时计算性能调优服务

本项目计划、实施时间和工作量评估是基于本SOW约定范围制定的,如果项目范围发生调整,双方应依照本工作说明书附件一《项目变更流程与项目变更控制申请单》中规定的程序评估对项目价款、计划和工作量的影响,并在签署《项目变更控制申请单...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

教育培训行业

客户痛点 线下培训机房:课前准备工作量大:上课前老师需要花费大量的时间进行教学环境的准备 广告弹窗影响教学:传统PC无法避免各种弹窗广告,广告内容甚至涉黄涉暴,这对于少儿培训影响巨大 传统电脑灵活性不足:每个班级是固定的坐席...

集群高可用架构推荐配置

多可用区的地域:所有托管组件均严格采用多副本、多AZ均衡打散部署策略,确保在单个可用区或节点发生故障时,集群仍然能够正常提供服务。单可用区地域:所有托管组件均严格采用多副本、多节点打散部署策略,确保在单个节点发生故障时,集群...

应用服务器数据迁移至ECS实例

如果当前轻应用服务器无法满足您的业务需求,您可以将同一阿里云账号下轻应用服务器平滑迁移至同地域或者跨地域下的云服务器ECS,以获取更加灵活的资源配置方案。本文介绍如何将轻应用服务器迁移至ECS实例。迁移影响 影响项 说明 ...

源为PolarDB-X的功能规范和约束说明

警告 异常切流是指源实例或者源实例所在的数据中心发生故障时进行的切流操作。这类操作都是有损操作。在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据...

源为PolarDB-X的功能规范和约束说明

警告 异常切流是指源实例或者源实例所在的数据中心发生故障时进行的切流操作。这类操作都是有损操作,例如导致数据不一致或任务失败。在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,...

组复制简介

数据 强 一致性 在组复制中,事务总是先传输到集群中其他节点,然后写入Binlog文件,这保证无论主节点在什么时刻发生故障,重新启动后数据都不会比集群选出的新主节点多。旧主节点故障重启后,能够自动加回集群,拉取它缺失的Binlog,就...

应用场景

通过构建灾备库,使用数据同步服务实时增量同步主库数据以确保主库与灾备库数据的完全一致,当业务中心发生地区故障时,直接将业务流量切换到灾备中心,即可立刻恢复服务。在灾备接管期间,通过反向数据同步,可实现随时切回主库。

术语

主地址(Primary Endpoint)主节点的访问点,当发生故障切换(Failover)后,系统会将访问点自动指向新的主节点。集群地址(Cluster Endpoint)整合集群下的多个节点,对外提供一个统一的读写地址,可以设置为只读或读写。集群地址具有自动...

术语

主地址(Primary Endpoint)主节点的访问点,当发生故障切换(Failover)后,系统会将访问点自动指向新的主节点。集群地址(Cluster Endpoint)整合集群下的多个节点,对外提供一个统一的读写地址,可以设置为只读或读写。集群地址具有自动...

概述

分布式系统将计算任务和数据分布在多个节点上以实现更高的性能、可靠性和可扩展性,当一个节点发生故障或错误时,其他节点可以继续工作,相比于单机系统,架构本身就有较高的节点容错性。但随着服务拆分,更多组件的引入,分布式系统的复杂...

客户案例

同时容灾上具备任意时间,任意服务器,任意机房,任意城市出现不可抗拒因素灾难时,完全无需人工接入的无损自适应容灾,RPO=0,RTO秒,极大的减少了运营和维护 IT 基础设施的工作量,从而降低了运行和维护的成本。在平台建设期间和投产后,...

ICP备案前准备概述

工作证明 同一个主体负责人或互联网信息服务负责人的证件号码出现在多个单位或个人的ICP备案信息中,部分省份(如四川)管局要求提供该主体负责人或互联网信息服务负责人的工作证明。详细信息请参见 在职证明。经营性说明书 四川省单位备案...

发现并处理大Key和热Key

在使用 云原生内存数据库Tair 的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能...

发现并处理Redis的大Key和热Key

在使用Redis的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能引发的问题及如何快速...

性能监控最佳实践

这样可以大大提高监控效率,减少监控人员的工作量,同时也可以更加全面地监控系统的性能。提高监控精度:传统的性能监控方案往往只能监控系统的基本指标,例如CPU使用率、内存利用率等。而一体化性能监控则可以通过集成多种监控工具和技术...

测试指标

磁盘吞吐 定义及解释 磁盘吞吐是指在无磁盘故障的情况下单位时间内通过磁盘的数据。简称 Disk Throughput。标准 磁盘指标主要有每秒读写多少兆,磁盘繁忙率,磁盘队列数,平均服务时间,平均等待时间,空间利用率。其中磁盘繁忙率是...

基于Kubernetes容器集群的容灾架构与方案

在进行系统架构设计时,您必须考虑到信息系统和基础设施可能遇到的各种潜在威胁,例如:硬件故障、软件系统崩溃、人为操作失误、安全攻击、自然灾害等。为了确保系统能够在各种异常故障场景下快速恢复并保持业务连续性,您必须为系统设计...

阿里云上稳定性保障服务(容灾)内容说明

1.服务概述 1.1 服务说明 帮助客户在云上建立容灾能力,当灾难发生时,在保证生产环境的数据尽量少丢失的情况下,保证生产系统的业务不间断运行,促进故障逃逸能力的提升。1.2 适用的客户场景 云上容灾服务适用于客户同一个地域(Region)...

保险行业解决方案与案例

方案价值 该公司作为我国最大的保险公司之一,其主要业务系统完成国产化迁移工作,标志着保险业机构向基于自主可控技术的数字化转型迈出了重要一步,充分证明了国产化数据库能够满足金融级业务需求,项目实施形成工艺和组件,也具有重要的...

EDAS直播公告

安利的企业微服务架构转型之路 云途时代数字化转型实践 EDAS 3.0核心功能演示 2020-05-15 微服务治理实践之金丝雀发布 应用的有些故障是因为发布直接或间接引起的,因此提升发布的质量,减少错误的发生,是有效减少线上故障的一个关键环节...

东软案例

故障数据全回溯分析。AI辅助异常检测等场景。客户价值 一体化指标、日志、代码链路、网络包等结构化、半结构化、无结构数据存储、检索、分析能力,降低开发部署复杂度。云端低成本海量运维数据存储,TCO大幅降低。高性能、高通量监控数据...

混沌工程缓存实战系列-Redis

借助混沌工程可以了解到问题发生时对系统、业务的影响面是否符合预期。梳理演练场景 对于示例应用,可以按照以下思路来梳理演练场景:明确缓存监控的指标。分析影响这些指标可能的因素、故障场景、参数等。因为客户端层面的影响面可控,...

阿里云上稳定性保障服务(容量规划)

业务目标对齐 确认容量规划目标 确认业务范围 现有系统容量分析 阿里云提供现有系统的数据、流量、消息等分析和风险识别 容量规划的验证 根据业务需求和架构情况,进行容量的合理水位验证 方案实施日报 方案实施期间每日发生的问题、...

域名安全

当前域名注册商接到投诉后,通常会在3个工作日内受理,并要求域名持有者提供域名被盗证据,即域名证明材料,证明材料包含域名持有者证件材料和一份找回声明。国外注册商要求提供英文版的证据和声明。当前的域名注册商收到您的证明材料后,...

基本概念

边车 边车(Sidecar),Sidecar 是一个轻级的网络代理,它们与应用程序部署在一起,对所有流入与流出的网络请求进行拦截,实现各种网络策略,例如服务发现与负载均衡、流量拆分、故障注入(fault injection)、熔断器以及分阶段发布等...

MSE注册配置中心高可用最佳实践

无容灾保护 当来自Consumer端的请求突然增加时,如果Provider容量水位较高,会导致个别Provider发生故障:注册中心会将故障节点摘除,全流量会给剩余节点。剩余Provider节点负载变高,大概率也会发生故障。最终所有Provider节点故障,...

备份MySQL

为避免灾难、硬件故障、数据丢失、损坏和意外删除事故发生,建议您通过 云备份 及时对MySQL数据库进行备份。云备份 支持备份云服务器ECS实例或本地服务器中部署的MySQL数据库,将数据备份至云端。您可以随时根据时间点恢复数据库至源数据库...

备份SQL Server

为避免灾难、硬件故障、数据丢失、损坏和意外删除事故发生,建议您通过 云备份 及时对SQL Server数据库进行备份。云备份 支持备份云服务器ECS实例或本地服务器中部署的SQL Server数据库,将数据 备份至云端。您可以随时根据时间点 恢复数据...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
对象存储 轻量应用服务器 云数据库 Redis 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用