更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

基本概念

连接器的类型分为以下两种:内置连接器:由逻辑编排提供的通用流程服务,例如逻辑控制、数据处理、HTTP 请求类等。此类连接器提供的触发器和操作无需认证授权即可使用。托管 API 连接器:是指一些公共服务类的开放 API 定义托管在阿里云上...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

归并节点

背景信息 归并节点是DataStudio中提供的逻辑控制系列节点中的一类,可以对上游节点的运行状态进行归并,用于解决分支节点下游节点的依赖挂载和运行触发问题。目前归并节点的逻辑定义不支持选择节点运行状态,仅支持将分支节点的多个下游...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

分支节点

分支节点是DataStudio中提供的逻辑控制系列节点中的一类。分支节点可以定义分支逻辑和不同逻辑条件时下游分支走向。注意事项 您需购买DataWorks标准版及以上版本,才可以使用分支节点。DataWorks版本介绍及购买,详情请参见 DataWorks各...

配置快捷控制按钮

判断是否配置使用快捷控制按钮,需要确认当前产品的功能使用场景、控制逻辑以及是否在设备端显示。判断快捷控制按钮的功能使用场景,该功能是为了让消费者方便快捷地使用一个控制按钮进行开关等两档或多档切换的操作控制。在配置之后,快捷...

AliPG功能模块

逻辑订阅故障转移 Failover Slot 社区版PostgreSQL的Logical Slot在主备切换时会导致逻辑订阅断开,AliPG对此进行优化,可以将所有的Logical Slot从主实例同步到备实例,避免逻辑订阅断开。位图功能扩展 varbitx 社区版PostgreSQL内置的...

GxP欧盟附录11标准合规包

他要求涵盖了计算机化系统的开发、验证、操作、维护和监测等方面,以确保这些系统符合相关法规和标准,用于生产、控制和保证产品质量和可靠性。Annex 11是GMP(Good Manufacturing Practice)的一部分,作为药品生产过程中的重要指导标准之...

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

故障协同处理(基于钉钉)

云钉运维故障协同效果 功能概述 移动应用端(目前仅支持“钉钉”,以下功能说明均基于钉钉场景)支持接收故障消息提示和进行故障操作,且支持移动端操作管理故障,操作记录实时同步到 运维事件中心 控制台。故障协同处理使用条件 成功开通...

Redis客户端重连指南

引发暂时性故障原因 原因 说明 故障触发了高可用机制 云数据库Redis支持节点健康状态监测,当监测到实例中的主节点不可用时,会自动触发主备切换,例如将主节点和从节点进行互换,保障实例的高可用性。此时,客户端可能会遇到下列暂时性...

消费重试

应用场景 云消息队列 RocketMQ 版 的消费重试主要解决的是业务处理逻辑失败导致的消费完整性问题,是一种为业务兜底的策略,不应该被用作业务流程控制。以下场景建议使用消息重试 业务处理失败,且失败原因跟当前的消息内容相关,比如该...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

配置消息监控告警实现风险预警

根据堆积原因,判断是进行消费者应用扩容还是消费逻辑缺陷修复。配置消费堆积延迟时间告警最佳实践 说明 消费堆积延迟时间是根据当前消费组所有未消费消息中,最早一条堆积消息的延迟时间计算,因此具备累积性和敏感性。收到消费堆积延迟...

配置消息监控告警实现风险预警

根据堆积原因,判断是进行消费者应用扩容还是消费逻辑缺陷修复。配置消费堆积延迟时间告警最佳实践 说明 消费堆积延迟时间是根据当前消费组所有未消费消息中,最早一条堆积消息的延迟时间计算,因此具备累积性和敏感性。收到消费堆积延迟...

消息发送重试和流控机制

消息发送重试机制 重试基本概念 云消息队列 RocketMQ 版 客户端连接服务端发起消息发送请求时,可能会因为网络故障、服务异常等原因导致调用失败。为保证消息的可靠性,云消息队列 RocketMQ 版 在客户端SDK中内置请求重试逻辑,尝试通过重...

如何实现无损发布或无损上下线

下游服务正常停止,但上游服务因其他原因(例如网络故障、资源不足、处理逻辑异常等),没有及时处理和使用注册中心给予的新下游服务地址列表。使用了旧版本的客户端,由于机制问题移除下线的地址列表时效性较低。解决方案 最佳方式为接入...

混沌工程缓存实战系列-Redis

登录 AHAS控制台,在左侧栏选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练>新建空白演练。在 演练配置 页面,填写相关参数,选择 演练内容 为 主机内网络延迟。更多参数信息,请参见 创建演练。单击 主机内网络延迟,在 本地...

消息堆积和延迟问题

通过了解 云消息队列 RocketMQ 版 客户端的消费原理和消息堆积的主要原因,帮助您可以在业务部署前更好的规划资源和配置,或在运维过程中及时调整业务逻辑,避免因消息堆积和延迟影响业务运行。背景信息 消息处理流程中,如果客户端的消费...

实时分析链路数据

如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障...

AIOps 解决方案专家服务内容说明

智能故障发现解决方案 基于调研与评估的结果,为客户设计智能故障发现解决方案,包含:多账号统一监控数据接入,并根据应用分组为客户设计AI算法能力用于实时故障发现,并根据分析结果智能定位根因,提供实时异常检测的稳定性方案,保障...

演练场景说明

代码逻辑场景 故障演练支持的代码逻辑场景。JVM注入动态脚本 向指定的Java方法注入一段动态代码,您可通过代码方式实施任意故障场景,例如篡改方法入参、篡改方法返回值等。K8s类场景 场景名称 特性 Node演练场景 Kubernetes集群中Node资源...

入门概述

完成个人或企业 实名认证...使用阿里云账号登录 逻辑编排控制台,在界面上方,您可以根据业务所在地切换地域,目前逻辑编排支持的地域可以参考:可用地域。接下来,您可以通过 新建工作流 的教程,来学习如何使用逻辑编排自动化您的日常工作。

逻辑复制槽故障转移(Logical Replication Slot ...

RDS PostgreSQL逻辑复制槽故障转移(Logical Replication Slot Failover)功能可以将所有的逻辑复制槽从主实例同步到备实例,从而实现逻辑复制槽的故障转移。前提条件 PostgreSQL 10或以上版本均支持此功能,如提示不支持,请升级内核小...

通过模板创建工作流

首先进入 逻辑编排控制台,进入左侧菜单 模板中心(图示中①),在控制台上方切换到 上海 地域(图示中②),在模板中心标题下方的搜索框内,输入 定时检查域名是否可以注册(图示中③),下方会出现该模板,单击模板标题(图示中④),...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

定时导出阿里云账单数据

具体白名单地址请提交工单获取,参考文档:设置IP白名单 创建工作流 使用阿里云主账号,登录逻辑编排控制台后,单击左侧的 我的工作流,进入到工作流列表。单击 创建工作流,在弹出的对话框中填写实例的 名称、资源组 等信息,单击 确定 后...

逻辑复制槽故障转移(Logical Replication Slot ...

PolarDB PostgreSQL版(兼容Oracle)的逻辑复制槽故障转移(Logical Replication Slot Failover)功能可以将所有的逻辑复制槽从主实例同步到备实例,从而实现逻辑复制槽的故障转移。背景信息 在主实例创建的Replication Slot,不会通过流...

逻辑复制槽故障转移(Logical Replication Slot ...

PolarDB PostgreSQL版(兼容Oracle)的逻辑复制槽故障转移(Logical Replication Slot Failover)功能可以将所有的逻辑复制槽从主实例同步到备实例,从而实现逻辑复制槽的故障转移。背景信息 在主实例创建的Replication Slot,不会通过流...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

逻辑复制槽故障转移(Logical Replication Slot ...

PolarDB PostgreSQL版 的逻辑复制槽故障转移(Logical Replication Slot Failover)功能可以将所有的逻辑复制槽从主实例同步到备实例,从而实现逻辑复制槽的故障转移。前提条件 支持的 PolarDB PostgreSQL版 的版本如下:PostgreSQL 11...

新建工作流

进入 逻辑编排控制台,进入左侧菜单 我的工作流(图示中①),在控制台上方选择您要创建工作流的地域(图示中②),单击 创建工作流(图示中③):2.在弹出的创建工作流对话框中,填入 工作流名称 后,选择对应 资源组(本示例中选择默认...

批量查询RAM用户相关信息

创建RAM用户 为RAM用户授权 操作步骤 登录阿里云控制台并进入 逻辑编排控制台。打开左侧导航 我的工作流 进入实例列表页,单击 创建工作流。填写 工作流名称 和 资源组 等信息,单击 确定 完成工作流创建。选择默认的 空白设计,单击 确定 ...

读多写少型业务场景多活实践

导购链路对商品应用是强依赖,强依赖故障将导致业务不可用,因此故障的爆炸半径应该控制在单元内。创建故障演练。创建杭州单元商品中心故障的演练,具体操作,请参见 创建演练。故障注入。在多活容灾的 监控大盘 页面 异地双活 区域,查看...

设备显示离线

可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的运营商网络正常。如果不正常,请处理运营商网络问题。如果正常,请跳转至 步骤2。请检查设备本身是否上电。电源状态...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 逻辑编排 智能语音交互 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用