什么是复影实例?

复影实例是容灾切换或故障演练过程中一个中间状态的实例,仅负责容灾端对数据的实时写入,该实例只在数据复制阶段产生。当您确认故障切换完成后,复影实例自动会被删除。该实例由HDR官方镜像创建,操作系统、实例规格等可能与源端实例不同...

安装故障演练探针

对指定机器进行演练时,需要在机器上面安装故障演练探针,探针的作用是下发故障演练执行命令。背景信息 一次完整的故障演练包括以下四个阶段:安装探针>创建演练>执行演练>停止演练 操作步骤 登录 AHAS控制台。在左侧导航栏选择 探针管理,...

回切至本地VMware

背景信息 目前阿里云的混合云容灾服务对本地的数据中心做保护,并实现在本地虚拟机出现故障的时候以秒级RPO、分钟级RTO在阿里云ECS上进行恢复。但是对于完整的容灾场景,还要求在本地虚拟机出现问题后,将云上恢复出来的ECS回切到云下...

回切至本地物理机

背景信息 目前阿里云的混合云容灾服务对本地的数据中心做保护,并实现在本地虚拟机出现故障的时候以秒级RPO、分钟级RTO在阿里云ECS上进行恢复。但是对于完整的容灾场景,还要求在本地虚拟机出现问题后,可以选择将云上恢复出来的ECS回切到...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

演练场景说明

故障演练场景是演练任务的核心。AHAS提供基础资源类场景和Kubernetes类场景,帮助分布式系统提升容错性和可恢复性。每一个执行阶段的演练场景都对应一个恢复阶段的演练任务。恢复阶段的演练任务目的是清除故障演练的影响,使应用或服务恢复...

日志字段详情

DI:请求处理被延迟一段时间,该延迟时间由故障注入指定。FI:请求被故障注入指定的响应码中止。RL:请求在本地被HTTP速率限制过滤器限制,除了429响应码之外。UAEX:请求被外部授权服务拒绝。RLSE:请求被拒绝,因为速率限制服务出现错误...

关键技术竞争力

基于混沌工程的红蓝攻防能力 TRaaS 基于混沌工程、建立演练机制,提供故障注入、演练编排体系能力,支持在不同环境、不同阶段,主动对业务系统进行故障注入,从而在主动观测单应用健壮性的同时,验证整个体系的故障发现能力、应急响应能力...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

ECS系统事件概述

说明 计划内运维事件也称主动运维事件,是阿里云基于百万级服务器的管理运维经验,服务上万家大型企业客户的能力沉淀,以及达摩院的前沿机器学习算法,对底层宿主机的软硬件故障风险进行预测和主动规避。当宿主机上的故障风险无法规避时,...

托管节点池节点自动恢复

当节点的运行状态发生变化并持续一段时间后,ACK将判定该状态符合故障状态,存在节点故障。当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后...

分区剪枝

若不包含,则会把分区从查询计划中排除(剪枝)。分区剪枝极大地减少了从磁盘检索的数据量并缩短了处理时间,从而提高了查询性能并优化了资源利用率。根据实际的SQL语句,PolarDB PostgreSQL版 数据库支持使用静态或动态剪枝。静态剪枝发生...

分区剪枝

若不包含,则会把分区从查询计划中排除(剪枝)。分区剪枝极大地减少了从磁盘检索的数据量并缩短了处理时间,从而提高了查询性能并优化了资源利用率。根据实际的SQL语句,PolarDB PostgreSQL版(兼容Oracle)数据库支持使用静态或动态剪枝...

分区剪枝

若不包含,则会把分区从查询计划中排除(剪枝)。分区剪枝极大地减少了从磁盘检索的数据量并缩短了处理时间,从而提高了查询性能并优化了资源利用率。根据实际的SQL语句,PolarDB PostgreSQL版(兼容Oracle)数据库支持使用静态或动态剪枝...

JVM注入动态脚本

向指定的Java方法注入一段动态代码,您可通过代码方式实施任意故障场景,例如篡改方法入参、篡改方法返回值等。参数说明如下:参数名称 是否必选 默认值 参数说明 脚本类型 否 Java 动态脚本的语言类型,可选项:Java、Groovy。脚本名称 否...

什么是故障演练

故障演练是一款遵循混沌工程实验原理并融合了阿里巴巴内部实践的产品,提供丰富故障场景,能够帮助分布式系统提升容错性和可恢复性。流程 故障演练建立了一套标准的演练流程,包含准备阶段、执行阶段、检查阶段和恢复阶段。通过四阶段的...

什么是应用高可用服务AHAS

应用高可用服务(Application High Availability Service)是一款专注于提高应用高可用能力的SaaS产品,主要包含多活容灾、故障演练和流量防护三个独立的功能模块。其中流量防护已迁移至微服务治理服务MSE。多活容灾 多活容灾MSHA(Multi-...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

PageableQueryExperimentTaskByExperimentId

ExperimentName String 故障演练 故障演练名称。ExtInfo Object 演练其他信息。SchedulerConfig Object 演练定时执行信息。FixedTime String 1611835105000 指定一次时间执行。CronExpression String 0 0 1*?定时任务表达式。Creator ...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障的发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

GetExperimentTask

调用GetExperimentTask接口查询故障演练任务详情。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String...

PolarDB应用最佳实践

谨慎使用单节点版数据库,故障恢复慢。为PolarDB集群设置合理的维护时间 PolarDB集群的可维护时间在参数指定的其中一个时间范围内,视为“合规”。如果企业业务高峰时段与维护时间有重叠,可能会对业务造成影响。PolarDB集群开启...

功能优势

本文向您介绍故障演练产品的功能优势,故障演练以下简称 AHAS Chaos。灵活的流程编排 AHAS Chaos 将故障演练的环节分为了准备、注入、检查以及恢复四个阶段,每个阶段除了系统初始化完成的必要节点之外,您也可以根据需要添加所需的流程...

构建阶段

变更管理:变更管理工作贯穿在整个云上环境及各类系统的生命周期,是ITIL管理中非常重要的一个流程环节,和其他流程关系非常紧密,稍有不慎就容易导致故障。如何让变更有章可循,是企业需要在这个阶段重点考虑的问题。

应用场景

混合型的业务场景 如果某公司的业务场景比较复杂,日常业务量波动不明显,且在某个时间内,业务量是在一定基础上波动的,您已经订购了一部分包年包月的实例,只是想针对波动的业务量合理调整实例数量。您可以手动将已订购的包年包月实例...

代码逻辑场景

本文列出了故障演练支持的代码逻辑场景。篡改Java方法返回值 修改Java指定方法的返回值,返回指定的值。具体示例,请参见 JVM注入动态脚本。参数名称 是否必选 默认值 参数说明 类名 是 无 完整的类名,包含包名。例如:...

故障隔离

时间窗口大小 设置故障检测的时间,与 时间窗口内最少调用次数 配合,只有在指定时间内进行指定次数的请求才会被采集。取值范围:(1,60]单位:秒 时间窗口内最少调用次数 设置指定时间内的最少调用请求次数。取值≥0。异常比例阈值(%)...

一键诊断

在数据库出现故障时,您可以利用一键诊断功能,快速诊断选定时间内数据库性能情况,直观地查看数据库性能情况的全貌,快速定位异常原因。前提条件 实例为如下版本:RDS MySQL 8.0 高可用系列或集群系列 RDS MySQL 5.7 高可用系列或集群...

多可用区部署

如果可用区A的网络存在故障,由于同步延迟问题,在可用区A网络恢复之前的时间内可用区B的数据会一直处于缺失的状态。备实例资源利用率不高。在主备容灾下,大部分时间备实例的资源不会被使用,只有在主备切换操作的时候才会被访问。主备...

一键诊断

在数据库出现故障时,您可以利用一键诊断功能,快速诊断选定时间内数据库性能情况,直观地查看数据库性能情况的全貌,快速定位异常原因。前提条件 目标数据库引擎为:RDS MySQL MyBase MySQL 自建MySQL 目标数据库实例已经接入DAS,详情...

数据管理

以每周几作为消费时间分析,分析统计时间内会员用户的消费时段情况,在根据会员用户消费时间的集中度进行某些活动运营。1.5.5 会员地域分析 在未选中店铺的情况下该页面显示的数据为在本视角下本账号拥有店铺权限的所有店铺的汇总...

配置DDoS高防后访问网站提示502错误

网络出现拥塞或抖动 在已经排除以上两种原因后,偶发的局部网络抖动、运营商线路故障等因素,也可能导致502错误。相关文档 常见问题概览 配置DDoS高防后访问网站提示504错误 适用于 DDoS高防 如果您的问题仍未解决,您可以在阿里云社区 ...

故障排查

Service无法正常工作 在排除网络插件自身的问题外,最可能的是 label 配置有问题,您可以通过查看 endpoints 进行故障排查。具体操作,请参见 检查Service。如何升级集群?升级集群的Kubernetes版本,具体操作,请参见 手动升级ACK集群。从...

Mesh 常见问题

故障注入未生效 故障注入可能发生在客户端,也可能发生在服务端,通常用来注入一段时间异常或者直接注入异常。注入规则没生效时,先检查自己的注入规则是否配置正确,如客户端注入需填写客户端的应用名,服务端注入需填写服务端的应用名。...

教育培训行业

体验始终如一,不会随着使用时间变长而变得卡顿 灵活便捷:支持无影云终端、手机、PAD、电脑等多端登录 云上管理:极速交付,手机移动运维,健康状态自动检测,故障实时感知,分钟级修复 方案架构 培训机房 无影云电脑通过云电脑池批量创建...

通知订阅详情

problemNotifyType String PROBLEM_NOTIFY 故障通知类型 level String P1 等级 action String INCIDENT_TRIGGER 时间动作 periodChannel Object 分时间渠道 workday String DINGDING 工作时间 nonWorkday String DINGDING 非工作时间 ...

故障演练常见问题

欢迎您反馈在使用故障演练过程中遇到的问题,目前提供以下常见问题供您参考。单个演练活动成功状态怎么判断?因为一个活动可能会有很多目标机器,当所有机器执行完毕之后,如果有机器没有执行成功,那么这个演练活动就会被系统判断为失败。...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间对该应用的运行情况做一个自动诊断。如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地...

概述

为了最大化的提升小版本升级、扩缩容以及故障容灾等场景的实用价值,推出了热备无感秒切的技术。该技术也是 PolarDB 向Serverless演进的一个必要条件。PolarDB 的无感秒切技术从故障探测、切换速度和切换体验三个方面对切换场景进行了优化...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...
共有117条 < 1 2 3 4 ... 117 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用