VBR上连监控及预警

结合阿里云的云监控服务,高速通道提供的VBR上连监控及预警功能可以探测VBR上连的实时状态,并且支持根据您配置的报警规则发送报警通知,帮助您更加快捷有效地监控VBR上连状态,避免VBR上连故障影响业务。前提条件 您已经创建了VBR上连。...

公网和VPC接入

在 请选择您要创建的实例的付费方式 面板,选择 付费方式,请根据需要选择 V3系列 或者 V2系列、包年包月 或者 按量付费,然后单击 确定。在 购买 面板,根据自身业务需求设置以下参数,然后单击 立即购买,根据页面提示完成支付。V2系列 ...

设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

Mesh 常见问题

故障注入未生效 故障注入可能发生在客户端,也可能发生在服务端,通常用来注入一段时间异常或者直接注入异常。注入规则没生效时,先检查自己的注入规则是否配置正确,如客户端注入需填写客户端的应用名,服务端注入需填写服务端的应用名。...

应用场景

当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务,CLB 已在各地域部署了多可用区以实现同地域容灾。当...

解析记录分组管理

概述 解析记录分组管理:可以将解析记录通过分组方式进行归类和管理。设置方法 登录 云解析控制台。在 域名解析 页面,权威域名 页签下,单击目标域名,进入 解析设置 页面。在 解析设置 页面,单击 全部记录 下拉框,单击“+”图标,...

如何通过 mPaaS 框架解决 App 线上问题

如果真的在线上发生故障,开发者就可以通过服务器推送开关,及时将故障代码关闭。这种推拉结合的方式,即时到达率 100%。发布 H5 离线包更新如果某些故障是发生在离线包内,在定位到问题后,可以直接通过实时发布控制台发布新的版本即可。...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

交换机事件通知

交换机变更完成事件通知 交换发生变更并且变更操作完成时,会产生此事件。产生该事件的主要场景如下:更换ECS实例的专有网络VPC。更换ECS实例的交换机。预约进行经典网络到专有网络VPC的ECS实例迁移。跨可用区更改ECS实例的实例规格。ECS...

应用规划最佳实践

创建应用分组方式 使用自定义标签创建应用分组 如果您已经使用标签对资源进行分组,并且已经切分到了应用分组维度,那么可以使用现有的标签来创建应用分组。应用分组会和标签绑定:资源绑定、解绑标签的同时也会加入、退出应用分组。在...

标签体系

创建标签:点击即可保存该规则,完成 指标统计标签 统计用户完成某个行为的次数(或其他属性)等指标的数值,按数值对用户分组 创建方式 标签名称:输入标签名称 标签类目:选择标签分类,分类后在人群圈选时可根据类目找标签。标签描述:...

域名管理

五、域名分组管理 域名分组管理:是指对云解析DNS控制台中的域名,通过分组方式进行归类和管理,包含创建分组、修改分组、删除分组、更换分组等功能。创建分组 登录 云解析DNS产品控制台。在 域名解析 页面,权威域名 页签,单击 全部...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

混合云解决方案

如果MASTER 宕机,发生故障转移,此时SLAVE如果要提供服务,日志读取器会等待镜像日志先同步,再做发布,但如果MASTER发生硬件故障,此时SLAVE需要打开一个跟踪标记1448,在镜像故障的情况下可以继续分发数据。说明 1448标记用于在事务...

备份和灾难恢复

阿里金融云可以支持同城双活/灾备、两地三中心等架构方式。1.同城双活 同城双活、灾备是阿里金融云的...故障切换回切:DNS将生产IP从原生产中心修改到灾备中心,实现跨Region的故障切换和服务恢复机制,主站发生故障时,由备站继续提供服务。

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

什么是混合云容灾服务

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

使用资源组和云监控实现不同业务线资源的监控管理

基于资源组创建云监控的应用分组,将指定资源组中的所有实例添加到该应用分组中进行监控管理。应用场景 当企业对云上资源进行监控时,通常需要从业务角度集中管理业务线涉及到的云服务器、数据库、负载均衡和存储等资源。您可以使用资源组...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

订阅事件通知

数据传输服务DTS(Data Transmission Service)已接入云监控平台,您可以通过事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。背景信息 云监控...

域名分组管理

域名分组是阿里云域名服务为用户提供的一种批量管理域名的功能服务。...本文将为您介绍如何创建域名分组...在对应操作页签(例如:域名信息修改)下,批量方式 选择 分组分组 选择对应的分组名称,即可对该域名分组下的所有域名进行批量操作。

功能特性

运维人员通过决策树方式,图形化地编排故障诊断过程、设计排查顺序。继而在风险事件发生时,将例行化、程式化、标准化的排查过程,通过故障决策树自动执行,并直接反馈诊断结果。通过故障诊断平台,能够极大地缩短故障排查时间。同时,屏蔽...

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

灾备规划

RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,RPO就要求越小。RPO越小,往往要求数据备份、复制频率更高,对生产环境、网络的压力也会越大,成本通常也越高。RTO:指故障发生后,期望...

使用HTTPS并用域名访问

用户可以将自己的域名绑定到API网关的API分组上,API网关通过域名来定位到一个唯一的API分组,再通过Path+HTTPMethod确定唯一的API。API网关为每个分组默认提供了公网二级域名,如果客户端直接调用API分组提供的公网二级域名,将会受到每天...

GTM如何实现同城容灾

创建1个全局访问策略,解析请求流量 选择 全局,主地址池集合 选择「业务中心01」地址池和「业务中心02」地址池,负载均衡策略 选择 返回全部地址,此设置可实现两个数据中心同时提供服务和发生故障时系统自动摘除故障地址的效果。...

通过资源组创建应用分组

当应用分组内资源发生严重和警告级别的事件时,云监控发送报警通知。取值:true:开启。false(默认值):关闭。true EnableInstallAgent boolean 否 应用分组是否开启自动安装云监控插件。云监控自动为应用分组内的主机安装云监控插件。...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

麒麟CRM-阿里云k8s服务计算巢模式部署文档

当前选择一个,后期可通过维护的方式扩展交换机数量。Pod交换机 选择Pod交换机。当前选择一个,后期可通过维护的方式扩展交换机数量。重要 此交换机需要Pod专用,不能与Worker交换机相同。Service网段 选择Ack集群的Service网段,不能与VPC...

新建 Kafka 数据源

重要 仅选择实例类型为 VPC 内自建 Kafka 实例 时,支持选择部署方式交换机。跨网络部署时,静态路由地址(其它云或线下机房 VPC 中的地址或网段)会根据选择的第一个交换机自动关联处理。接入点 输入 Kafka 服务器 IP 地址及端口列表。...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

智能压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

云盘异步复制概述

启动云盘异步复制功能 通过异步复制功能实现容灾恢复 您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制提供的故障切换以及反向复制功能对主盘进行容灾恢复。通过异步复制功能实现容灾恢复 删除云盘异步复制关系 创建...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用高可用服务 云数据库 OceanBase 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用