PushExperimentTask

调用PushExperimentTask接口推进故障演练任务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String 是...

FinishExperimentTask

调用FinishExperimentTask接口停止故障演练任务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String ...

API概览

本文列举了AHAS支持的API接口。监控 监控相关的API如下表。API 描述 GetMetricsOfResource 调用GetMetricsOfResource接口获取资源监控数据。流控规则 流控规则相关的API如下表。API 描述 CreateFlowRule 调用CreateFlowRule接口创建流控...

以太网接口频繁Up/Down

接口接口模块或设备故障。解决方案 检查本端和对端设备线缆、模块是否插好。检查设备两端链路、接口模块是否故障。设备之间是通过双绞线连接,需要做如下检查。检查项 检查标准 后续操作 用测试仪测试双绞线是否故障。测试仪显示双绞线...

ExecuteExperiment

调用ExecuteExperiment接口执行故障演练。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String 是 ...

UpdateExperiment

调用UpdateExperiment接口编辑故障演练基本信息及流程定义。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 ...

GetExperimentTask

调用GetExperimentTask接口查询故障演练任务详情。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String...

ECS整机恢复

当ECS整机发生系统故障或者错误操作时,您可以通过备份点的克隆和恢复功能,实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。重要 当源ECS存在时,支持直接...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

故障处理流程

当智能接入网关设备发生网络故障后,您可以先观察现象、收集信息,然后对现象和信息进行分析诊断,尝试修复问题。本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下...

混合云解决方案

如果MASTER 宕机,发生故障转移,此时SLAVE如果要提供服务,日志读取器会等待镜像日志先同步,再做发布,但如果MASTER发生硬件故障,此时SLAVE需要打开一个跟踪标记1448,在镜像故障的情况下可以继续分发数据。说明 1448标记用于在事务...

设置账户安全

已拦截量 在 异常时间段 内,接口发生的所有被当前WAF防护策略拦截的请求的数量。这里的策略指全部已经生效的防护策略,例如Web攻击防护规则、精准访问控制、CC攻击防护、区域封禁等。这个数字占总请求量的比值在一定程度上反映了当前...

API安全

API安全模块支持自动梳理已接入 Web应用防火墙(Web Application Firewall,简称WAF)防护的业务中开放的API资产,检测API风险(例如敏感数据泄露、内部接口暴露等),并通过报表还原API异常事件,提供详细的风险处理建议和API生命周期管理...

围绕混沌工程的平台实践

因此混沌工程是一门学科,它提供了基本的理论指导,而故障演练是混沌工程的具体实践,通过向目标系统注入真实可能发生故障来考量系统的稳定性。混沌工程和AHAS Chaos AHAS Chaos是以混沌工程为理论指导的故障演练平台,目标是成为混沌...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

配置设备级高可用

当主网关设备发生故障时,HA机制能够从备份的网关设备中选举一台设备成为新的主网关设备,用来承担数据流量,从而保障网络的可靠通信。动态HA功能无需配置虚IP地址,系统会主动帮您探测设备状态,在主网关设备故障时,自动帮您切换流量。...

API安全

遍历爬取接口数据 该接口发生了遍历某个参数,高频爬取接口数据的行为。非预期的接口调用 调用请求中的某个参数不符合接口参数规范,例如,正常情况下参数A是整数格式,但发现调用请求中的参数A使用了字符串格式。API安全如何帮助企业...

前端接口说明

若不手动调用此接口发生JS Error会自动触发上报当前行为队列,最大为100条,若超出100条,队列头的行为将被舍弃。说明 您需要在SDK配置中将 behavior 配置为 true,才可调用此方法。reportBehavior()语法:_bl.reportBehavior()...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进,避免历史同类故障重复发生

API概览

您可以调用DescribeClusterEvents接口,获取指定集群中发生的事件列表,并查询事件的详细信息,包括事件级别、时间状态、时间发生时间等。任务 API 标题 API概述 DescribeTaskInfo 查询任务详情 您可以调用DescribeTaskInfo接口,查询集群...

API概览

推荐您使用托管节点池,以帮助您自动完成部分节点运维操作,例如高危CVE漏洞自动修复、部分故障修复等,从而降低您的节点运维负担。DeleteClusterNodepool 删除节点池 您可以调用DeleteClusterNodepool接口删除不再使用的节点池。...

API概览

您可以调用DescribeEvents接口,查询某类事件的详细信息,包括事件级别、时间状态、时间发生时间等。DescribeClusterEvents 查询指定集群的事件 集群操作事件包括集群创建、集群变更、节点池创建、节点池扩容、Addon安装、集群升级等。您...

ECS系统事件概述

说明 非预期运维事件一般指的是因底层宿主机发生了无法预测的故障,或者ECS实例的操作系统发生了内核错误等问题,导致ECS实例突然出现宕机或重启。因宿主机故障导致ECS实例宕机或重启事件(SystemFailure.Reboot)属于偶发现象,无法避免。...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

MSE注册配置中心高可用最佳实践

无容灾保护 当来自Consumer端的请求量突然增加时,如果Provider容量水位较高,会导致个别Provider发生故障:注册中心会将故障节点摘除,全量流量会给剩余节点。剩余Provider节点负载变高,大概率也会发生故障。最终所有Provider节点故障,...

应用场景

Node.js 提供的精确到虚拟机级别的深度监控,能够如实的反应应用运行状态,通过配置报警规则,用户可以在发现系统出现故障(内存泄露或者 CPU 热点等)趋势时,通过诊断接口迅速定位故障点。Node.js 性能平台特别适合业务发展迅速、应用...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障的原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

密钥托管交易接口

该参数有唯一性校验,当请求参数发生变化或接口发生变化时,需确保每次传入的值唯一,否则会引起调用失败。bizid 是 string 链id account 是 string 账户名 content 是 string 存证内容 mykmsKeyId 是 string 创建账户时使用的mykmsKeyId ...

多可用区部署

当主实例1发生故障或者可用区A不可用时,用户将访问的连接切换至备实例2或者可用区B,从而实现高可用,主备容灾的高可用架构图如下所示。主备容灾的方案虽然能够满足大部分用户的高可用需求,但是这种主备容灾方案并不适用所有的业务,存在...

查看智能洞察事件列表

Top N接口平均响应时间突增 Top N接口平均响应时间突增 类型的事件详情页面显示了事件发生时间点、根因分析和故障传播链。在智能洞察详情页面,您可以执行以下操作:单击 根因分析 区域的疑似根因链接,在疑似根因面板可以查看事件产生的...

应用故障自动诊断

应用的某个接口或者服务故障导致的整体故障。应用的下游应用故障导致本应用故障。根因分析:这一部分包含了诊断模型推测出来的深层原因,深层原因比较多,根据实际的情况有所不同。数据支持:这一部分包含了得到推测结论的数据支持,不同...

应用场景

以此,降低产品使用过程中故障发生概率,提高故障恢复效率,进而实现产品高可用性的有效提升。机房级容灾 同城双活 同一个城市,建设两个机房环境,两地距离 50 km 以内,万兆光纤专线互连,业务应用层面可以两个机房同时提供业务服务,当...

EasyCkpt:AI大模型高性能状态保存恢复

因此,在发生故障时,迫切需要一种以低成本的方法来保存最新的Checkpoint。这样在重新启动训练时就无需重复计算,从而减少时间和成本的浪费。功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

归档存储服务等级协议

赔偿方案 阿里云对用户存在故障的每个Archive按不可用时间的100倍赔偿,即赔付金额=发生故障的Archive故障前24小时平均每分钟费用×不可用时间×100倍;其中:(1)赔偿只针对使用归档存储服务已产生费用的用户,以归档存储代金券的形式赔偿,...

Link Visual视频Media SDK

状态变更事件如:播放中发生错误、主动停止播放等。IDLE:播放器没有任何内容播放时的状态。BUFFERING:播放器正在缓冲,当前的位置还不可以播放。状态变更事件如:开始播放时缓冲、seekTo()后重新缓冲、网络不佳引起点播缓冲。READY:播放...

CreateExperiment

调用CreateExperiment接口新建一个故障演练。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String 是 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 微服务引擎 负载均衡 邮件推送 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用