更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

同城多活常见问题

“5”:基于MSHA流量封闭能力,业务故障时,在业务监控层面看到,A区域业务监控指标下跌,B区域正常。此时业务方可快速决策将A切流至B,避免定位问题及决策的时间开销。“10”:基于MSHA自上而下的流量规则管理和集成数据库同步能力,可...

CLB访问日志功能简介

在使用CLB的七层负载均衡(HTTP/HTTPS监听)期间,如果您遇到业务故障或异常,怀疑是后端服务器问题,您可通过CLB访问日志功能快速定位异常后端服务器。CLB结合阿里云日志服务提供的访问日志功能,可帮助您大幅提升故障定位与处理的效率。...

强弱依赖治理概述

故障根源定位:后台系统的故障,往往通过上一级的业务故障表现出来。故障处理讲究的是争分夺秒,良好的强弱依赖,对于系统自动化诊断有非常大的助力作用。依赖容量评估:正常调用链路下的系统容量需要评估。例如当某个弱依赖挂掉时,需要...

监控与日志

支持对云产品资源的运行状态、资源使用状态、业务故障等问题进行实时监控。您可以通过文件存储NAS控制台或者云监控控制台或者云监控API查看文件存储资源的监控数据。更多信息,请参见 数据监控。通过云监控控制台查看 云监控控制台支持对...

监控与日志

支持对云产品资源的运行状态、资源使用状态、业务故障等问题进行实时监控。您可以通过云监控控制台或者云监控API查看表格存储资源的监控数据。更多信息,请参见 通过云监控控制台与SDK查看监控数据。通过云监控控制台查看 通过云监控控制台...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

标准架构

Tair 作为持久化数据存储使用的业务 标准架构提供持久化机制及备份恢复机制,极大地保证数据可靠性。单个 Tair 性能压力可控的业务 由于Redis原生采用单线程机制,性能在10万QPS以下的业务建议使用。如果需要更高的性能要求,请选用集群...

集群版-单副本

纯缓存应用 单副本集群版的分片服务器由单节点组成,分片服务器某节点出现故障时,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,数据将会丢失,有可能流量被冲击到后端数据库,需要做好应用程序的预热保护机制...

标准版-单副本

使用场景 纯缓存类业务场景 单副本架构不能提供数据可靠性,如果发生节点故障,您需要重新对业务进行预热,因此,在对数据可靠性要求较高的敏感性业务中,建议选用双副本架构。对Redis协议兼容性要求较高的业务 标准版完全兼容Redis协议,...

使用流程

3 创建数据表 创建数据表用于存储业务相关数据。创建数据表时,您可以根据业务需求同时配置如下功能。如果业务中需要使用不同属性作为查询条件来执行数据查询,您可以创建二级索引加速数据查询。如果要落盘加密表中数据,您可以配置数据...

故障发现

7*24监控值班 对于有条件的企业,可以设立全球运行指挥中心(Global Operations Center,简称GOC),实现7*24监控值班,时刻关注核心业务线上异常与故障。对于完成监控覆盖的核心业务场景,在异常上报时,通过工具自动检测或值班人员人工...

评估合适的云服务

存储 存储服务 云相对传统自建数据中心,有更丰富的存储业务场景以及与之相匹配的存储服务,针对业务进行灵活适配,才能充分发挥云的优势。使用单一的存储类型往往无法满足最佳的性能与效率,在架构设计过程中,有必要对业务场景以及对应...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

业务连续性

数据的备份和恢复 故障时流量转移可以很好地避免地域级别故障造成业务中断,但此时故障地域的数据服务也可能同样不可用。为了让业务在备地域的应用启用期间也能正常运转,您需要根据自身的业务设计合适的方案,在非故障期间将数据从主地域...

功能特性

数据库文件存储 功能集 功能 功能描述 参考文档 DBFS特性 原子写 支持DIRECT IO的原子写,需按4K,8K,16K对齐-共享读写 一份数据可共享式多点挂载并进行读写,读写可线性扩展-存储加密 通过对数据库文件存储实施加密,可以确保数据库文件...

宽表模型介绍

创建数据表用于存储业务相关数据。创建数据表时,您可以根据业务需求同时配置如下功能。如果业务中需要使用不同属性作为查询条件来执行数据查询,您可以创建二级索引加速数据查询。如果要落盘加密表中数据,您可以配置数据加密。如果业务中...

高可用版

图数据库GDB支持高可用...备库故障业务无影响,但会快速被检测到并触发备库自愈。可靠性 计算与存储分离,计算节点的故障不会造成数据丢失。基于超大规模的阿里云飞天分布式存储,保证数据多副本的可靠性。适用场景 企业级的生产图数据库。

使用限制

故障切换 对于高可用系列、集群系列实例,当主节点出现故障时,RDS会在30秒内切换到备节点(某些主备不一致等特殊场景可能切换时间较长)。切换过程中有30秒左右的连接闪断,需要您设置好程序的自动重连,避免因为切换导致服务不可用。切换...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

NVMe协议介绍

实际业务使用过程中单点故障是常态,确保故障情况下业务连续性是高可用系统的核心能力,在云上存储和网络具备极高的可用性。而计算节点则经常受断电、宕机、硬件故障等影响,所以业务通常搭建主备模式解决计算的高可用问题。例如数据库场景...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

CDN加速和OSS传输加速的区别

概述 本文主要介绍阿里云对象存储OSS的传输加速功能和CDN加速OSS资源的区别,以便您根据实际业务进行选择。详细信息 阿里云对象存储OSS以海量、安全、低成本、高可靠等特点已经成为用户存储静态资源和文件的首要选择,实际使用中面向全球...

X-Engine最佳实践

由于X-Engine分层存储的架构特点,该引擎特别适合某些业务负载特征的业务,本文介绍X-Engine的典型应用业务场景。X-Engine的分层存储架构特别适合具有如下业务负载特征的业务:数据访问具有鲜明的时间特征。例如大部分读取及修改操作集中在...

设置宕机自动迁移

为了降低物理故障业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能,宕机自动迁移开启后,当DDH因故障停机时,系统会自动迁移至健康的DDH。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。说明 创建专有宿主机DDH时,...

回切至本地VMware

说明 复制存储(Datastore)和复制网络(Network)的选择依赖于计算资源,而计算资源(Compute Resource)的选择依赖于复制位置(Location)所在的Datacenter。在反向实时复制阶段,选择 更多>故障恢复。故障恢复(failback)完成后,您...

迁云咨询服务

在线业务存储迁移设计 乙方收集并评估甲方业务系统的存储现状和甲方预期的存储目标,选择合适的云存储产品及规格,设计符合甲方业务特点的全量和增量迁移方案,规划基于云存储产品的应用改造方案,验证数据存储迁移的核心关键技术,提供...

MongoDB只读节点简介

主从节点可以使用ConnectionStringURI实现读写分离,适用于读多写少的并发场景,从而在性能扩展的同时,避免节点故障业务带来的影响。功能优势 您可以根据业务需求随时更改只读节点个数,节省业务成本。只读节点具有独立的连接地址,适合...

设计方案

在软件系统架构演进中不变的是系统的基本属性,包含存储、计算和网络,变的是存储、计算和网络的实现方式和规模,往大规模、高性能、高可靠、易扩展等方向迭代演进,所以对架构稳定性提出了更高的要求。系统可预见的稳定性风险包含软硬件...

产品架构

日常巡检、业务监控、故障诊断发现风险事件,并将其上报至风险管理中心,由风险管理中心进行统一调度,如触发故障诊断、应急预案等。运行总览集中展示整个平台的运行状态、风险情况。部署架构 HAS 部署时,需要依赖以下底层服务:数据库 ...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

流水单据型业务场景多活实践

在 读多写少型业务场景多活实践 中,已经将导购链路进行了异地多读改造,而该业务后续在一次大促期间,遭遇了一次订单应用大面积故障,导致大促期间下单业务长时间无法使用,于是下单业务的容灾建设也提上了议程。下单业务是典型的流水单据...

产品优势

自动化故障诊断和标准化应急预案快速定位并恢复故障,减少因故障引起的业务中断时间。故障演练主动检验应用高可用能力。支持蚂蚁产品双中心容灾切换,满足监管合规需求。技术风险防控内容库快速更新 阿里云、蚂蚁技术风险团队基于域内、...

应用场景

物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测和故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...

迁移有潜在故障风险的DDH

您可以自主迁移有潜在故障风险的DDH到其他物理机,避免相关业务因DDH故障受到影响。前提条件 请先将DDH上的ECS实例全部停机,否则迁移会失败。警告 停止实例可能导致业务中断,建议您在非业务高峰期时执行该操作。使用限制 本地SSD型DDH不...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
对象存储 文件存储NAS 云服务器 ECS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用