故障协同处理(基于钉钉)

云钉运维故障协同效果 功能概述 移动应用端(目前仅支持“钉钉”,以下功能说明均基于钉钉场景)支持接收故障消息提示和进行故障操作,且支持移动端操作管理故障,操作记录实时同步到 运维事件中心 控制台。故障协同处理使用条件 成功开通...

创建和管理服务器组

在使用 网络型负载均衡NLB(Network Load Balancer)服务前,您必须创建服务器组并至少添加一台端服务器来接收 NLB 转发的客户端请求。默认情况下,NLB 使用您为服务器组指定的端口和协议将请求发送到对应的端服务器。本文为您介绍如何...

托管节点池节点自动恢复

当节点的运行状态发生变化并持续一段时间,ACK将判定该状态符合故障状态,存在节点故障。当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成故障状态解除,节点恢复正常状态。当恢复任务完成...

实例的节点故障处理机制

本文档介绍云数据库MongoDB版实例的节点故障处理机制。单节点实例 由于单节点实例架构的特殊性,单节点实例仅拥有一个节点。当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于...

设计方案

基于稳定性支柱设计原则,整体稳定性设计方案可参考如下:架构设计原则 软件系统从所有的功能都在一个应用程序内运行的单体应用架构,到不同的功能模块分别部署在不同的服务器上的传统分布式应用架构,再到服务细分通过轻量的通信机制...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;影响服务:选择 影响服务(可多选);进展摘要:处理人将事件升级为...

健康检查

为确保ALB端服务器的业务可用性,您可以通过为ALB服务器组配置健康检查来检查服务器组的运行状况,以避免端服务器异常对业务的影响,并提升业务可靠性。本文为您介绍如何创建、编辑和删除健康检查等操作。背景信息 ALB 支持基于每个...

智能压测

面对即将到来的短期业务高峰或数据库结构变更(尤其是索引变更)时,您可以通过智能压测功能,确认数据库实例规格是否需要扩容,并验证在真实业务场景下的实际效果,降低上线引发故障的风险。此外,在数据库发生故障且无法定位原因时,...

通过一致性复制组实现容灾恢复

当您创建并启动一致性复制组,如果生产站点中的云盘发生严重故障,您可以通过一致性复制组批量对生产站点的云盘数据进行容灾恢复。本文主要介绍如何通过一致性复制组进行容灾恢复。背景信息 一致性复制组支持故障切换和反向复制功能,当...

流量回放和压测

面对即将到来的短期业务高峰或数据库结构变更(尤其是索引变更)时,您可以通过流量回访与压测功能,确认数据库实例规格是否需要扩容,并验证在真实业务场景下的实际效果,降低上线引发故障的风险。此外,在数据库发生故障且无法定位原因...

应用场景

当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务,CLB 已在各地域部署了多可用区以实现同地域容灾。当...

单实例快速恢复

为了能够快速恢复系统故障,Hologres提供了单实例快速恢复的机制。本文为您介绍单实例快速恢复的触发条件和行为。实例快速恢复逻辑说明 Hologres在 V2.0版本之前,Hologres计算节点均为容器调度(即下图中的Worker Node),资源管理器...

灾备方案

图 1.Tair 容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

灾备方案介绍

图 1.Redis容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

基于MSE云原生网关实现同城多活

在同城多活的场景下,能够确保对跨可用区的多个业务集群的请求实现高效负载均衡分配,在单个可用区内的业务集群发生故障时,可在1秒内完成故障节点的自动摘除从而实现故障转移,有效的保障服务连续性和高可用性。容灾概述 目前云上容灾主要...

集群版-单副本

纯缓存应用 单副本集群版的分片服务器由单节点组成,分片服务器某节点出现故障时,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成,数据将会丢失,有可能流量被冲击到端数据库,需要做好应用程序的预热保护机制...

轻量应用负载均衡概述

添加端实例 当您创建轻量应用负载均衡,需要添加端实例实现流量分发,其中,端实例指轻量应用服务器。绑定域名 轻量应用负载均衡支持将域名解析到负载均衡的公网服务地址上,使您更加方便地访问互联网。修改轻量应用负载均衡名称或...

TSDBConfig.Builder

因为目前TSDB采用多节点提供服务,当一个节点故障后,客户端到该节点的连接会切换到其他正常节点。故障节点恢复,如果使用长连接会导致该节点在没有新的连接请求的情况时,无法提供服务。客户端通过设置httpConnectionLiveTime可以使客户...

同城高可用

同城高可用功能可有效避免单个可用区故障导致的服务中断,确保业务的稳定性。Flink支持对包年包月的工作空间开启跨可用区,以实现同城高可用。本文为您介绍如何开启并使用跨可用区,以及停止跨可用区计费等。功能介绍 包年包月工作空间...

部署高可用及共享存储Web服务

1个公网负载均衡CLB:基于对流量按需分发的能力,可以将流量分发到不同的端服务器,可消除系统中的单点故障,当某个服务器发生故障时,CLB会自动将请求分配到其他正常的服务器上,从而保证服务的连续性和稳定性。2个文件存储NAS:实现多...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

云数据库Redis版产品选型必读

选择容灾方案 图 3.Redis容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

ECS服务器的外网地址ping不通的排查方法

Windows系统:具体操作请参见 Windows实例ping外网地址提示“一般故障”。运营商问题:检查运营商是否存在网络问题,如公网运营商链路中断,路由震荡等。具体操作请参见 使用ping命令丢包或不通时的链路测试方法。相关文档 ECS实例间ping...

部署初始化

changepassword 登录成功显示下面的界面:输入命令:ls/etc/sysconfig/network-scripts 上面示例,显示有6个网卡配置文件(ifcfg-enp61s0f0、ifcfg-enp61s0f1、ifcfg-enp95s0f0、ifcfg-enp95s0f1、ifcfg-enp95s0f2、ifcfg-enp95s0f3)...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

采集ping和tcping数据

本文介绍通过Logtail采集ping和tcping数据到日志服务Metricstore的操作步骤。前提条件 已创建Project和MetricStore。具体操作,请参见 创建Project 和 创建MetricStore。使用限制 只有Linux Logtail 1.0.31及以上版本的Logtail支持采集ping...

功能概览

支持的容灾场景 容灾场景 支持类型 故障切换 数据同步切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止再进行最后一轮数据同步,等待数据同步完成再启动切换。这样可以保证容灾端与生产端数据完全一致,...

功能概览

支持的容灾场景 容灾场景 支持类型 故障切换 数据同步切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止再进行最后一轮数据同步,等待数据同步完成再启动切换。这样可以保证容灾端与生产端数据完全一致,...

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障”错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

配置DDoS高防无法Ping

本文主要介绍配置DDoS高防无法Ping通的解决方法。适用于 云安全防御 详细信息 确认DDoS高防实例的状态。如果DDoS高防实例处于黑洞状态,则无法被外网访问。您可以在 DDoS高防控制台 的 实例管理 页面,查询DDoS高防实例的 实例状态。确认...

故障演练

故障演练能力是ADP基于阿里云故障演练产品AHAS提供的一项能力,在线上集成环节即可对线下交付中常见的各类故障场景下产品编排的容错性、可靠性和可恢复性进行演练,保障编排稳定可靠。在进行故障演练之前,需要进行以下步骤:创建产品;...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘故障都能对业务连续性形成改进,避免历史同类故障重复发生。

应用场景

故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘故障都能对业务连续性形成改进。其他应用场景 降低管理难度:同时维护多套监控系统,操作成本高,降低管理难度。规避报警风暴:单监控源的报警不能...

步骤七:故障切换

保护组进入增量复制状态,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止再进行最后一轮数据同步,等待数据同步...
共有128条 < 1 2 3 4 ... 128 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用