故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

网站被劫持问题概述

DNS解析一般都与DNS有关,如果有这类故障,请先排除本地绑定hosts的情况后,再收集出口DNS信息和被劫持的IP地址。如下所示,异常的DNS解析没有经过阿里云CNAME解析,即被劫持到2个IP地址。您可以通过使用阿里云的 HTTPDNS,防止被劫持。...

设备无法连接SSID

问题症状 无线终端连接SSID,显示未连接,无法关联SSID。解决方案 检查AP配置中的最大连接数,最大可设置为128.2.DHCP不在AP上要检查一下地址池的使用情况,检查可用地址是否够用。3.更换新的AP,排除是否是AP故障。适用于 云AP

ECS整机恢复

当ECS整机发生系统故障或者错误操作时,您可以通过备份点的克隆和恢复功能,实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。重要 当源ECS存在时,支持直接...

目标规则(Destination Rule)CRD说明

consecutiveLocalOriginFailures UInt32Value 否 触发排除需要的连续本地故障数。默认为5。该字段仅在 splitExternalLocalOriginErrors 设置为true时生效。consecutiveGatewayErrors UInt32Value 否 将主机排除出连接池需要的网关错误数。...

跨可用区批量克隆ECS实例

功能介绍 跨可用区克隆实例功能允许用户在不同的可用区之间创建相同的实例,实现以下目标:故障切换:当一个可用区出现异常或故障时,可以将实例迅速克隆到另一个可用区,以确保业务的高可用性和持续性。负载均衡:为了实现多个可用区之间...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份点或者复制到目标地域后的备份点,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

演练方案

演练方案指针对不同故障场景设计、编排的一套容灾演练计划。故障演练模块支持创建、编辑、发布、复用、删除、导出演练方案,以及查看演练记录,下面逐一进行操作说明。创建演练方案 在左侧导航栏选择 运维管理>高可用管理。在左侧导航栏上...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

故障排查

Service无法正常工作 在排除网络插件自身的问题外,最可能的是 label 配置有问题,您可以通过查看 endpoints 进行故障排查。具体操作,请参见 检查Service。如何升级集群?升级集群的Kubernetes版本,具体操作,请参见 手动升级ACK集群。从...

配置DDoS高防后访问网站提示502错误

网络出现拥塞或抖动 在已经排除以上两种原因后,偶发的局部网络抖动、运营商线路故障等因素,也可能导致502错误。相关文档 常见问题概览 配置DDoS高防后访问网站提示504错误 适用于 DDoS高防 如果您的问题仍未解决,您可以在阿里云社区 ...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

通过一致性复制组实现容灾恢复

当您创建并启动一致性复制组后,如果生产站点中的云盘发生严重故障,您可以通过一致性复制组批量对生产站点的云盘数据进行容灾恢复。本文主要介绍如何通过一致性复制组进行容灾恢复。背景信息 一致性复制组支持故障切换和反向复制功能,当...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

标准架构

阿里云自研 故障探测切换系统(HA)阿里云 Tair 服务封装HA切换系统,实时探测主节点的异常情况,可以有效解决磁盘IO故障,CPU故障等问题导致的服务异常,及时进行主从切换,从而保证服务高可用。主从复制机制 阿里云针对 Tair 主从复制...

标准版-双副本

支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的可用区(例如杭州可用区H+I)创建的实例,还具备同城容灾的能力。兼容性 标准版完全兼容Redis协议,自建的Redis数据库可以平滑...

DescribeWebLockExclusiveFileType-查询排除文件类型

查询排除文件类型。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中使用,...

高可用和容灾设计

在大多数场景下,您可以将7天内任意一个时间点的数据恢复到RDS临时实例或克隆实例上,数据验证无误后即可将数据迁回RDS主实例,从而完成数据回溯。更多信息请参见 备份恢复。除了默认的备份恢复功能,RDS MySQL还提供跨地域备份恢复功能,...

诊断节点

克隆节点 在 诊断节点 页面,单击目标节点 操作 列下的 克隆,并在弹出的对话框中单击 确定。查看节点详情 在 诊断节点 页面,单击目标节点名称即可进入节点详情页查看该诊断节点的基础信息与绑定规则。基础信息:包括节点名称、类型、超时...

管理配置

克隆配置:选中目标配置,在页面下方单击 克隆,将配置克隆到同地域的其他命名空间内。批量删除配置:选中多条配置,在页面下方单击 批量删除。查看配置详情 查询配置。具体操作,请参见 查询配置。在 配置列表 页面,单击目标配置的 Data ...

DescribeExcludeSystemPath-查询防勒索系统排除目录

查询防勒索系统排除目录。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中...

管理演练空间

查看、编辑、创建、克隆、添加、移除演练。说明 编辑权限包含了查看权限。执行 可执行以下操作:查看空间。查看执行概要。查看、执行演练。说明 执行权限包含了查看权限。相关信息 关于演练的具体操作,请参见以下文档:创建演练 执行演练 ...

使用限制

故障切换 对于高可用系列、集群系列实例,当主节点出现故障时,RDS会在30秒内切换到备节点(某些主备不一致等特殊场景可能切换时间较长)。切换过程中有30秒左右的连接闪断,需要您设置好程序的自动重连,避免因为切换导致服务不可用。切换...

ECS灾备解决方案

基于ECS快照实现的ECS整机备份,支持ECS实例的备份与恢复,可一键克隆快速搭建开发测试环境。更多信息,请参见 ECS整机备份。同时云备份基于 云盘异步复制功能,还提供ECS跨地域、跨可用区容灾方案,具备多机一致性、多机编排能力,可快速...

API概览

FailoverDiskReplicaPair 启用云盘异步复制故障切换 启用异步复制关系的故障切换功能。DescribeDiskReplicaPairProgress 查询复制对的同步进度 查询复制对的同步进度。DeleteDiskReplicaPair 删除云盘异步复制关系 删除一个异步复制关系。...

pg_trigger

tgparentid oid 此被克隆的触发器的父触发器,如果不是克隆则为0;这种情况会在创建分区或附加到分区表时发生。tgname name 触发器名(在同一个表的触发器中必须唯一)。tgfoid oid 触发器调用的函数。tgtype int2 标识触发器触发条件的位...

管理配置

选中目标配置,在页面下方单击 克隆 来将配置克隆到同地域的其他命名空间内。查看配置详情 查询配置,具体操作,请参见 查询配置。在 配置列表 页面单击目标配置的 Data ID。在 配置详情 页面查看配置的基本信息、配置内容、示例代码、历史...

如何使用 Git LFS

可以发现,本地仓库大小仅仅为 188K(排除LFS缓存目录),这也基本是远端Git仓库的大小,也达到了Git LFS瘦身仓库的目的。du-sh-exclude=lfs.git 188K.git$du-sh.git 1.1G.git 克隆已使用Git LFS的仓库 本地需预先已安装Git LFS工具,否则...

怎么配置业务监控

支持通过克隆方式,微调触发条件,实现快速覆盖多等级告警的能力创建。规则名称 系统自动生成,可以自定义命名。影响程度 提醒、警告、严重、致命。生效时间 设置告警生效的时间段,精确到时分。生效时间外,即使监控指标触发条件也不产生...

管理配置

Beta发布 对于重要的配置变更,一个变更错误可能导致巨大故障,因此需要将该配置发到几台机器上先验证一下。如果没有问题再全部推送,降低错误变更影响。勾选 Beta发布单选框,填写需要Beta发布的机器IP(本机测试注意填写公网IP)。删除...

常见问题

A:目前,基于备份集(快照)进行恢复(克隆)的速度是40分钟/TB。如果是恢复到任意时间点,则需要包含应用Redo日志的时间,这部分的恢复速度大概是20~70秒/GB,整个恢复时间是这两部分之和。性能和容量 Q:表个数上限是多少?表个数到多少...

部分索引

通常,本数据库会对索引使用做出合理的选择(例如,它会在检索公值时避开索引,这样前面的例子只能节约索引尺寸,它并非是避免索引使用所必需的),非常不正确的规划选择则需要作为故障报告。记住建立一个部分索引意味着我们知道的至少和...

光伏发电异常检测提效

同时,无法有效排除环境因素的干扰,例如一天不同的时段发电量不同,也受天气影响巨大,按照该检测方法无法动态适应各个变化的情况,为运维工作增加了不确定性,并带来运维负担。解决方案 物联网平台的数据服务提供数据智能功能,可以基于...

AddSasContainerWebDefenseRule-增加容器防篡改规则

增加容器防篡改规则。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。...500 ServerError ServerError 服务故障,请稍后重试!访问 错误中心 查看更多错误码。

ModifySasContainerWebDefenseRule-修改容器防篡改...

修改容器防篡改规则。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。...500 ServerError ServerError 服务故障,请稍后重试!访问 错误中心 查看更多错误码。

ModifyBackupPolicy-修改防勒索策略

500 ServerError ServerError 服务故障,请稍后重试!访问 错误中心 查看更多错误码。变更历史 变更时间 变更内容概要 操作 2023-03-23 OpenAPI 错误码发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生变更。删除错误码:400 ...

RDS数据库有大量不明连接

aurora rds_service 远程管控账号,实例故障时,阿里云工程师通过该账号登录实例执行管控操作,例如主备切换、实例监控等。aurora_proxy 数据库代理服务账号,在开启数据库代理服务以后,通过这个账号来转发连接。replicator 高可用架构下...
共有140条 < 1 2 3 4 ... 140 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
风险识别 数据库自治服务 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用