云盘存储卷概述

云盘支持在可用区内自动复制您的数据,防止意外硬件故障导致的数据不可用,保护您的业务免于组件故障的威胁。ESSD云盘:基于新一代分布式块存储架构的超高性能云盘产品,结合25GE网络和RDMA技术,单盘可提供高达100万的随机读写能力和更低...

基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...

云盘存储卷概述

云盘支持在可用区内自动复制您的数据,防止意外硬件故障导致的数据不可用,保护您的业务免于组件故障的威胁。更多信息,请参见 云盘概述。ESSD AutoPL云盘:支持根据业务需求自定义云盘的预配置性能以及性能突发。该类云盘在保持ESSD云盘...

应用场景

传统型负载均衡CLB(Classic Load Balancer)的应用场景为高访问量的业务,提高应用程序的可用性和可靠性。应用于高访问量的业务 如果您的应用访问量很高,您可以通过配置监听规则将流量分发到不同的云服务器ECS(Elastic Compute Service...

应用场景

弹性伸缩有广泛的应用场景,不仅适合业务量不断波动的应用程序,同时也适合业务量稳定的应用程序。本文为您介绍弹性伸缩的典型应用场景,该场景均适用于ECS实例和ECI实例。无规律的业务量波动 某新闻网站播出了热点新闻,访问量突增,新闻...

资源规划

按照业务需求和成本需求进行资源规划,并在即时供应和预置需求之间取得平衡以协调业务增长,资源故障、高可用性和预置时间。根据业务演进计划做资源规划 可预见的业务演进计划可以帮助我们做资源规划,预留资源,并反映到成本预估里面,...

概述

OSS合规管理最佳实践 对象存储OSS(Object Storage Service)是很多客户用来存储业务数据的重要存储服务。如果存储空间(Bucket)设置不符合安全防护要求,则可能带来数据泄露甚至丢失的巨大业务风险。OSS合规管理最佳实践可以帮助您动态且...

异地双活切流

场景三:日常>日常流量调节 说明 非故障场景,根据业务要求调整各单元(地域)或单元格(机房)承担的流量比例。选择 切流组件。选择 切换方式,切换方式分为 范围 和 精准。说明 范围:调整切流规则的比例范围。精准:通过路由标精准路由...

地域及可用区

可用区之间故障隔离,可以避免故障扩散,保证业务的连续性。说明 大型灾害或者大型电力故障除外。注意事项 创建阿里云实时计算Flink版时,选择的地域和可用区,在资源创建成功后,无法更改。不同地域资源的开放情况会根据实际业务使用情况...

同城多活切流

场景二 选择 日常>日常流量调节 说明 指非故障场景,根据业务要求调整各单元(地域)或单元格(机房)承担的流量比例。a.选择 切流组件 b.调整单元格的流量比例 c.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元格前后比例的对比...

站点中如何应用OSS资源

原因:对外应用业务的域名,原本是做了A记录或者Cname记录的,绑定Bucket后,对应的域名Cname到Bucket的外网地址上,对应的域名就与原本的业务无关了,导致原本的站点无法访问。解决方法:解除站点域名的绑定,换一个子域名绑定Bucket(该...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

应用场景

机房级容灾 同城双活 同一个城市,建设两个机房环境,两地距离 50 km 以内,万兆光纤专线互连,业务应用层面可以两个机房同时提供业务服务,当一个机房故障,不影响另外一个机房业务使用。异地主备 满足容灾需求,两地不同城市分别建设两个...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。完整的故障演练...

上传到OSS的文件存储类型为归档存储无法下载文件

问题原因 OSS文件上传时会继承Bucket的存储类型,因此上传到OSS的文件存储类型为归档存储原因如下:Bucket的存储类型为标准存储,但是需要下载的文件为归档存储,则说明上传文件时的代码中设置的存储类型为归档存储。Bucket的存储类型为...

通过一致性复制组实现容灾恢复

背景信息 一致性复制组支持故障切换和反向复制功能,当生产站点中的云盘出现严重故障时,您可以通过故障切换功能开启容灾站点中云盘数据的读写权限,然后将容灾站点中的云盘挂载到临时创建的ECS实例上继续运行业务。当生产站点中的云盘故障...

响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,会向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

同城容灾架构概述

前端部署DNS解析,如果某个可用区出现像IDC机房断电或者火灾等机房级故障时,可以通过前端切换DNS来及时恢复业务。非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障时...

运维事件中心

提供丰富的监控集成、强大的报警降噪、可靠的通知、灵活的事件流转、基于ITIL的故障管理等功能,一站式管理、多端协同,帮助企业实现更实时的数字化管理、更快的故障响应、更短的故障时长、更连续的业务体验。

某新能源汽车造车新势力

业务背景 在碳中和、碳达峰这样的大背景下,国家大力支持新能源汽车的推广使用,但同时监管部门也提出了相应的要求,需要实时存储车辆状态数据,进行故障告警及数据的实时查看。为了能及时响应车辆告警信息,排查车辆故障,需要实时能下载...

开源ChaosBlade与商业化AHAS CHAOS故障演练对比

商业化AHAS CHAOS故障演练是阿里巴巴内部广泛使用的演练平台云上版本,具有灵活的流程编排、丰富的故障场景等特点,可以帮助企业提升分布式系统的容错能力,保障在企业上云或往云原生系统迁移过程中业务的连续性。AHAS CHAOS故障演练在...

容灾演练断网方式说明

可用区断网 当整个机房的外部网络出现中断后,外部请求无法进入故障机房,机房内业务同样无法访问外部网络,但机房内网络互通,形成一个局部环境。可用区断网正是为了模拟此类真实故障而提供的机房级故障模拟能力。可用区断网方式采用租户...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

容灾管理服务介绍

针对有高可用需求的用户,CADT容灾管理服务提供规划、优化、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行容灾演练,验证系统是否能够抵御资源故障或者AZ故障,保障系统健壮性。主要功能 容灾规划 在用户部署资源前,通过...

产品架构

业务背景 伴随着信息技术的飞速发展,各行各业在业务生产中产生的数据种类越来越多,有结构化的业务元数据、业务运行数据、设备或者系统的量测数据,也有半结构化的业务运行数据、日志、图片或者文件等。按照传统方案,为了满足多种类型...

本地盘

本地盘是ECS实例所在物理机上的本地硬盘设备,为ECS实例提供本地存储访问能力。由于本地盘直接连接到物理机上,因此它具有低时延、高随机IOPS、高吞吐量和高性价比的优势。这使得本地盘非常适合需要高性能存储的应用场景,比如需要大量随机...

8.0.1和8.0.2版功能对比

不支持 支持  XEngine高压缩引擎  提供了超大存储容量,可以同时作为多个业务历史数据的汇聚地,以方便对所有历史数据进行集中存储和管理,支持XEngine和InnoDB混启动。支持 支持  冷数据管理  为了降低数据存储成本,PolarDB for ...

什么是云原生数据库PolarDB分布式版

高性能强一致分布式事务,PolarDB-X 采用自研的X-Paxos协议保证数据存储故障切换过程中RPO=0的基础上,使用TSO策略和分布式的MVCC能力保证了分布式事务的隔离性和一致性。分布式线性扩展,PolarDB-X 基于一致性Hash的分区策略有效地进行...

集群规格选型

您可以根据业务特征(如QPS、存储量、读写请求、相应延迟、稳定性等)自由搭配。选型主要包括以下几个方面:Master机器的规格。Core节点的规格和数量。盘的大小和种类。HBase版本。参见 HBase版本选择。ECS版本:独享规格。独享规格是完全...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启后,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...

Tair助力厦门真有趣游戏业务从容应对流量洪峰

数据闪回确保用户数据不丢失:业务可能由于服务器重启或者意外故障、游戏中出现漏洞等原因,需要将游戏数据恢复到此前某个时间点,Tair 支持将实例整体或指定Key的数据恢复至指定的秒级时间点,同时也支持选择将数据恢复至新实例或当前实例...

故障取消

cancelReason Long Body 否 取消原因 取消原因 problemNotifyType Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 ...

预留空间

推荐购买方式 如果今天您的账号下杭州地域的标准-本地冗余存储业务数据量有600 GB,您想要通过购买预付费资源包或 预留空间 的方式来优化成本,建议方案如下:先购买500 GB的中国内地通用 预留空间。再购买100 GB的中国内地通用标准-本地...

故障基础数据管理

P4 故障场景监控覆盖 基于故障等级定义场景,配置对应的监控项接入7*24监控值班,同时对接入的监控数据额外提供基于算法的智能告警,或者接入研发可自闭环的风险预警,保障业务故障的监控发现率,减少故障持续时间,降低故障影响。...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
对象存储 文件存储NAS 云服务器 ECS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用