诊断规则

通过故障诊断平台,运维人员可以将诊断过程、排查顺序进行图形化编排与设计,即故障诊断决策树。而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现...

升级ASM实例

容器智能运维平台提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。具体操作,请参见 使用集群诊断。关于ASM功能的最新动态,请参见 功能发布记录。

AIMaster:弹性自动容错引擎

配置容错消息通知 任务开启容错监控后,如果您希望容错发生时可以进行通知,比如任务发生了重启,那么您可以在 工作空间详情,选择 事件中心,点击 新建事件规则,事件类型选择 DLC任务>任务自动容错。具体操作,请参见 工作空间事件中心。...

Mesh 常见问题

重启电脑或者 Docker。重新 pull 一下脚手架代码。在 go-plugin 目录执行以下命令:git pull 开源 Mesh demo 编译问题 当编译 sofastack-mesh-demo 遇到无法拉取 JAR 问题,报错如下:[ERROR]Non-resolvable import POM:Could not transfer...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

修改预约重启时间

在 计划内运维事件 列表中,在 云服务器 页签下,找到已经设置了重启计划的ECS实例,在 操作 列,单击 预约重启。在 预约重启时间 页面,选择 预约日期 和 预约时间。说明 预约重启时间不能超过 最晚可预约时间。其中,最晚可预约时间 比 ...

EMR Kafka ECS磁盘事件处理

重启故障ECS实例。在ECS修复磁盘事件流程中,单击 重启。在EMR控制台启动故障Broker节点服务。观察Broker节点状态是否处于正常状态。当执行完ECS实例重启后,修复磁盘 事件处于 新盘插入中 阶段。等待ECS修复磁盘。在 新盘插入中 阶段,...

重启节点

PolarDB 提供了重启节点功能,您可以在控制台上手动重启节点解决数据库连接和性能问题。注意事项 重启只读节点之后新建的读写分离连接会转发请求到该只读节点。重启只读节点之前建立的读写分离连接不会转发请求到重启后的只读节点,您可以...

重启节点

PolarDB 提供了重启节点功能,您可以在控制台上手动重启节点解决数据库连接和性能问题。注意事项 重启只读节点之后新建的读写分离连接会转发请求到该只读节点。重启只读节点之前建立的读写分离连接不会转发请求到重启后的只读节点,您可以...

重启节点

PolarDB 提供了重启节点功能,您可以在控制台上手动重启节点解决数据库连接和性能问题。注意事项 重启只读节点之后新建的读写分离连接会转发请求到该只读节点。重启只读节点之前建立的读写分离连接不会转发请求到重启后的只读节点,您可以...

监控、诊断故障排除

诊断错误 客户端应用程序会在请求发生错误时接收到服务端返回的相关错误信息,监控服务也会记录并显示各种错误类型请求的计数和占比。您也可以通过检查服务器端日志、客户端日志和网络日志来获取相关单个请求的详细信息。通常,响应中返回...

包年包月实例升配规格

如果选择了预约重启并设置了重启时间,您可以在ECS控制台的 事件>待处理事件>变配重启事件 中查看或修改预约时间。警告 重启实例会造成您的实例停止工作,可能导致业务中断,建议您在非业务高峰期时执行该操作。阅读升配须知,如无问题,...

企业版和标准版功能对比

支持 不支持 监控与优化 一键诊断 PolarDB MySQL版 的一键诊断融合了DAS部分功能,支持自治中心、会话管理、实时性能、空间分析、锁分析、诊断报告和性能洞察等功能,方便您查看数据库相关的诊断与优化结果。支持 支持 自治中心 PolarDB ...

EDAS旧版本监控报警功能下线通知

EDAS于2020年2月13日对监控报警功能进行了升级,经过4个月的迁移过渡期,绝大部分用户已经对应用进行了重启,并完成迁移。EDAS项目组决定于2020年8月31日将老版本的监控报警系统下线。下线影响 旧版监控报警功能下线以后,将会对EDAS产品...

续费降配

是否需要重启实例 降低实例规格:需要 若设置了重启时间,实例将在您设置的时间自动重启使规格配置生效。若未设置重启时间,必须在新的计费周期内手动重启实例,否则降配操作不会生效。变更公网带宽:不需要 转换数据盘计费方式:不需要 新...

续费降配

是否需要重启实例 降低实例规格:需要 若设置了重启时间,实例将在您设置的时间自动重启使规格配置生效。若未设置重启时间,必须在新的计费周期内手动重启实例,否则降配操作不会生效。变更公网带宽:不需要 转换数据盘计费方式:不需要 新...

设计方案

从提前发现系统风险、提升测试质量、完善风险预案、加强监控告警、提升故障应急效率等方面做到故障发生前有效预防,故障发生时及时应对,故障恢复后回归验证。基于故障本身打造分布式系统韧性,持续提升软件质量,增强团队对软件生产运行的...

托管节点池概述

自愈:托管节点池会监控节点的运行状态,如果节点超过10分钟未上报节点状态,或者状态为NotReady,容器服务会尝试通过重启故障节点来恢复潜在的故障。因此,节点上的Pod会被重启。托管节点池与普通节点池的区别 ACK提供普通节点池和托管...

功能特性

产品主要功能包括风险管理、日常巡检、故障诊断、应急预案、故障演练等。风险管理 风险管理 是高可用管理平台核心,是风险事件汇集、处置的中枢平台,具体如下。风险事件 风险事件汇集:负责将监控、巡检、诊断产生的风险或告警信息进行...

使用私有池保障节省停机模式ECS实例的重启成功率

但是节省停机模式重启成功率依赖于实例库存,当业务峰值到来时,开启了节省停机模式的实例可能会因为库存不足导致重启失败,对业务带来更大的影响。本文介绍如何通过私有池保障节省停机模式实例的重启成功率。操作步骤 假设已有一台按量...

公共错误码

诊断 403 ZoneMigrationError.StillingRunning Zone migration task is still running.-诊断 400 OperationDenied VPC IP is in use,please check.-诊断 400 InvalidTags.Format-诊断 400 NoPermission.SystemTag-诊断 400 SSLNotSupport-...

公共错误码

诊断 403 ZoneMigrationError.StillingRunning Zone migration task is still running.-诊断 400 OperationDenied VPC IP is in use,please check.-诊断 400 InvalidTags.Format-诊断 400 NoPermission.SystemTag-诊断 400 SSLNotSupport-...

代码逻辑场景

本文列出了故障演练支持的代码逻辑场景。篡改Java方法返回值 修改Java指定方法的返回值,返回指定的值。具体示例,请参见 JVM注入动态脚本。参数名称 是否必选 默认值 参数说明 类名 是 无 完整的类名,包含包名。例如:...

应用诊断

应用诊断是对应用的单独故障诊断,可以由链路诊断触发或人工触发。高可用管理平台通过应用诊断初步定位问题,锁定可疑应用,再通过 Arthas 和线程分析进一步确认问题。目前,应用诊断支持用户应用和蚂蚁应用。应用诊断是故障诊断的原子能力...

实例事件通知

以 因系统维护实例重启(SystemMaintenance.Reboot)的事件为例,事件通知的JSON格式如下所示。首次发布运维事件,事件处于 已计划(Scheduled)状态。{"id":"2256A988-0B26-4E2B-820A-8A*E5","product":"ECS","resourceId":"acs:ecs:...

RDS

RAM用户通过控制台重启RDS实例 以下示例表示,在北京时间2021年08月04日10:54:38,RAM用户 Alice 调用RestartDBInstance接口重启了杭州地域ID为 rm-bp15hkr5tb57v*的RDS实例。{"apiVersion":"2014-08-15","requestId":"532F2CED-F931-57FC-...

应用安全常见问题

在控制台单击 接入 后没有重启目标应用对应的实例(或只重启了部分实例)。目标应用的Java探针版本较低。应用安全对探针版本要求如下。更多信息,请参见 接入应用安全 容器服务应用、EDAS应用等自动升级场景要求版本需为v2.7.1.2或以上。...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

混合云解决方案

如果MASTER 宕机,发生了故障转移,此时SLAVE如果要提供服务,日志读取器会等待镜像日志先同步,再做发布,但如果MASTER发生硬件故障,此时SLAVE需要打开一个跟踪标记1448,在镜像故障的情况下可以继续分发数据。说明 1448标记用于在事务...

PTS压测快速入门

阿里云提供的业务高可用架构体系,为企业提供营销活动、成本控制(压测、容量规划、流量控制)、应急(开关)、容灾逃逸(架构感知、故障演练、异地多活)的解决方案。其中PTS压测作为容量规划阶段重要的环节,可模拟海量用户的真实业务...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

三网合一卡2.0使用入门

步骤四:验证重启是否切网成功 设备手工重启后自动切换网络,查看运营商信息是否更新 步骤五:验证网络故障设备自动重启切网 登录阿里云控制台,对当前使用的运营商卡片进行停机操作,模拟断网场景,在 步骤二 的基础上等触发检测后,设备...

产品架构

日常巡检、业务监控、故障诊断发现风险事件,并将其上报至风险管理中心,由风险管理中心进行统一调度,如触发故障诊断、应急预案等。运行总览集中展示整个平台的运行状态、风险情况。部署架构 HAS 部署时,需要依赖以下底层服务:数据库 ...

什么是高可用管理平台

事前:通过应用巡检、故障诊断以及和监控平台的联动,实现应用运行风险的主动发现。事中:通过故障诊断、应急预案、容灾切换实现风险事件快速定位和恢复。事后:通过风险定级、回溯,实现风险事件的闭环管理。有效提升 IT 技术风险防御水平...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...

产品优势

自动化故障诊断和标准化应急预案快速定位并恢复故障,减少因故障引起的业务中断时间。故障演练主动检验应用高可用能力。支持蚂蚁产品双中心容灾切换,满足监管合规需求。技术风险防控内容库快速更新 阿里云、蚂蚁技术风险团队基于域内、...

托管节点池节点自动恢复

如果打开了 当节点故障重启节点 开关,则重启ECS实例。KubeletNotReady(PLEG)PLEG健康检查失败,导致节点NotReady。中 180s 重启containerd或Docker。重启kubelet。如果打开了 当节点故障重启节点 开关,则重启ECS实例。...

混合云应用双活容灾最佳实践

说明 演练前,基于MSHA流量监控或其他监控产品,确定业务稳态的监控指标(如日常情况RT≤200ms,错误率),以便在故障发生时判断故障影响面以及在故障恢复后判断业务的实际恢复情况。步骤二:应用故障注入 这里使用阿里云故障演练产品,对...

跟踪概览

使用场景 在阿里云操作审计服务(ActionTrail)中,跟踪(Trail)是个非常推荐的功能,您可以通过跟踪中心化收集更长时间的审计日志后,用于安全监控、合规审计、故障诊断、资源变更追踪等多个领域。以下是跟踪收集到审计日志后一些具体的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 数据库审计 云数据库 OceanBase 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用