替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

测试指标

标准 现代的操作系统为了最大利用内存,在内存中存放了缓存,因此内存利用率100%并不代表内存有瓶颈,衡量系统内有瓶颈主要靠SWAP(与虚拟内存交换交换空间利用率,一般情况下,SWAP交换空间利用率要低于70%,太多的交换将会引起系统性能...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

访问策略配置

重要 如未设置备地址池集合,则代表当主地址池集合出现故障时,系统将摘除故障地址,但不支持故障切换。如主地址池集合摘除故障地址后,还有存活的IP地址,那么则响应剩余存活的IP地址。基于访问延时的访问策略配置 在 基本配置 页面,点击...

进入Linux系统的单用户模式

在某些特殊场景下(例如排查Linux实例启动故障、修复系统异常、维护硬盘分区或root用户被锁定,需要修改密码),您可以通过Linux系统系统引导器(GRUB)进入单用户模式进行操作。在该模式下,只启动最基本的组件和服务,并且操作者拥有...

副本集架构

从节点具有高可用保障,即某个从节点故障时,系统会自动将其与隐藏节点切换,若未自动切换,您可以自行切换,从节点的连接地址保持不变。说明 如何切换从节点和隐藏节点,请参见 切换节点角色。触发节点的角色切换后,会产生1次30秒内的...

米连科技

但是由于自建的ES平台在高业务量下查询变得非常缓慢,当出现系统问题时故障排查效率较低,用户体验无法得到充分和及时的保障。数据分析能力缺乏 伊对始终坚持以数据驱动产品运营,从最早的统计报表类需求,逐步扩展到基于算法的推荐、风控...

系统架构

本文为您介绍云数据库Memcache的系统架构。简介 云数据库Memcache版采取集群版架构。云数据库Memcache版内置数据分片及读取算法,整体过程对用户透明,免去用户开发及运维烦恼。每个分片节点采取主备架构保证服务高可用。系统架构 云数据库...

可运维性咨询服务内容说明

乙方专家团队通过对甲方应用系统和云平台的调研,评估系统是否具备故障演练和逃逸能力,并基于阿里巴巴多年业务的真实线上故障库的积累,通过模拟调用延迟、服务不可用、机器资源满载等,真实检验应用的高可用能力,同时考察相关人员对问题...

托管节点池概述

如果您希望将节点进行分组纳管,同时降低节点的运维负担,例如操作系统(OS)CVE漏洞自动修复、kubelet自动升级、节点故障时重启节点等,您可以启用托管节点池。托管节点池是ACK推出的自动化运维型节点池,在普通节点池的基础上支持多种...

Linux实例负载高问题排查和异常处理

本文档介绍Linux云服务器负载高导致ECS实例运行变慢、自动...故障处理 Linux系统ECS实例CPU使用率或CPU负载较高问题的排查及解决方案 如何查看Linux系统网络流量负载情况?如何查看Linux系统I/O负载情况?如何处理系统内存使用率过高问题?

Linux实例系统总体负载的查询及分析

y:报告TTY设备活动状况 使用htop查看系统负载情况 htop是Linux系统中的一个互动进程查看器,可以让用户进行交互式操作,可横向或纵向滚动浏览进程列表,支持鼠标操作。用户可以安装htop,监控服务器的负载。Linux系统默认不存在htop工具,...

配置网络

交换机所在的子网故障或子网中的IP地址已用尽,您可以在配置VPC时提供两个或者多个交换机ID,如果一个可用区出现故障,您的函数可以在其他可用区运行,提高容错能力。安全组配置错误,请您按照以下要求配置安全组。需要设置VPC中的安全组的...

常见问题

可能原因 您创建时选择的交换机VSW使用了专有网络VPC的附加网段。CPFS不支持使用附加网段创建的交换机。文件系统所在地域当前可用区储备已用尽,建议您更换可用区购买。解决方案 重新创建CPFS文件系统,并在选择交换机或可用区时,更换可用...

集群版-单副本

纯缓存应用 单副本集群版的分片服务器由单节点组成,分片服务器某节点出现故障时,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,数据将会丢失,有可能流量被冲击到后端数据库,需要做好应用程序的预热保护机制...

基于Kubernetes容器集群的容灾架构与方案

在进行系统架构设计时,您必须考虑到信息系统和基础设施可能遇到的各种潜在威胁,例如:硬件故障、软件系统崩溃、人为操作失误、安全攻击、自然灾害等。为了确保系统能够在各种异常故障场景下快速恢复并保持业务连续性,您必须为系统设计...

通过CADT实现NLB可用区级容灾演练

云速搭CADT(Cloud Architect Design Tools)容灾管理服务提供规划、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行容灾演练,验证系统是否能够抵御资源故障或者可用区故障,保障系统健壮性。本文为您介绍如何通过CADT实现...

功能特性

高可用 OceanBase 数据库采用基于无共享(Shared-Nothing)的多副本架构,让整个系统没有任何单点故障,保证系统的持续可用。支持单机、机房、城市级别的高可用和容灾,可以进行单机房、双机房、两地三中心、三地五中心部署。经过实际测试...

通过CADT实现ALB可用区级容灾演练

云速搭CADT(Cloud Architect Design Tools)容灾管理服务提供规划、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行容灾演练,验证系统是否能够抵御资源故障或者可用区故障,保障系统健壮性。本文为您介绍如何通过CADT实现...

MongoDB只读节点简介

为了扩展主从节点的读请求能力,云数据库MongoDB提供具备独立连接地址的只读节点,适合独立系统直连访问,以减轻大量读请求给主从节点造成的压力。在有大量读请求的应用场景下,数据库的主从节点可能难以承受读取压力,甚至对业务造成影响...

通过PrivateLink实现同地域跨VPC挂载NAS

属性 VPC1 VPC2 网络实例所属的地域 西南1(成都)西南1(成都)网络实例的网段规划 VPC网段:10.0.0.0/8 交换机1网段:10.0.23.0/24 交换机2网段:10.0.24.0/24 VPC网段:192.168.0.0/16 交换机3网段:192.168.2.0/24 交换机4网段:192....

实例启动异常常见错误与对应解决方案

问题原因 该问题可能是因为Windows系统引导配置数据(Boot Configuration Data,BCD)配置异常或者磁盘文件系统故障,导致系统无法加载。解决方案 在存有快照的情况下,您可以使用快照来恢复系统盘。具体操作如下:警告 回滚云盘是不可逆...

企业单AZ架构升级到多AZ

多可用区部署的常见应用:关键业务系统:对于需要高可用性和连续性的关键业务系统,如金融服务、医疗保健和电子商务平台,多AZ部署可以确保系统即使在一个数据中心发生故障的情况下也能继续运行。容灾要求高的场景:当组织需要符合特定的...

配置快速倒换组

物理专线链路故障时,系统从探测出链路中断到完成路由切换消耗的时长约为秒级。您可以将2个VBR配置为一个快速倒换组,当BFD(Bidirectional Forwarding Detection)探测到链路故障后,流量自动从故障链路的VBR快速切换到备份VBR,完成亚秒...

【升级公告】IPsec-VPN连接升级为双隧道模式

尊敬的阿里云用户,为提高VPN网关产品的使用体验,VPN网关产品将IPsec-VPN连接升级为双隧道模式,一个IPsec-VPN连接下将包含主备两条隧道,且两条隧道分布在不同的可用区,在主隧道故障后,流量可以通过备隧道进行传输,实现IPsec-VPN连接...

常见问题

code=exited”错误 启动SSH服务时出现“error while loading shared libraries”错误 ECS网络问题 Windows实例ping外网地址提示“一般故障”Linux系统的ECS中没有禁ping却ping不通的解决方法 使用ping命令测试ECS实例时ping不通的排查方法 ...

API概览

本产品(专有网络/2016-...ModifyVSwitchCidrReservationAttribute 修改交换机预留网段的名称和描述信息 CreateVSwitch 创建交换机 创建一个交换机。CreateDefaultVSwitch 创建默认交换机 调用CreateDefaultVSwitch接口创建一个默认的交换机。...

接口说明

参数名称 参数类型 参数说明 action String 系统规定参数,取值:ApplyDigit。speaker_id String 可自定义说话人ID,必填(长度不超过32位字节)。{"header":{"message_id":"05450bf69c53413f8d88aed1ee60*","task_id":"640bc797bb684bd...

使用NLB挂载跨地域VPC内的服务器

交换机1在ECS创建时需要使用 名称:VPC1交换机1 可用区:成都 可用区A IPv4网段:172.16.20.0/24 交换机2 为实现多可用区容灾,配置时需要至少选择两个可用区的交换机 名称:VPC1交换机2 可用区:成都 可用区B IPv4网段:172.16.21.0/24 ...

GxP欧盟附录11标准合规包

13.1 应报告和评估所有事件,而不仅仅是系统故障和数据错误。应确定重大事件的根本原因,并应成为纠正和预防行动的基础。使用云安全中心企业版 使用云安全中心企业版或者更高级别的版本,视为“合规”。1.1 风险管理应贯穿计算机化系统的...

如何排查Java场景下故障注入不生效的问题

为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,您需要先确认该演练的故障执行步骤是否已开启Debug模式。若...

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

容灾预案

系统则会将故障地址池中的地址全部设置为 永远离线 的工作模式,地址池状态变为不可用,并按照您配置的访问策略自动执行切换。注意:永远离线是地址的一种工作模式,您可以参阅 地址池配置 文档来了解地址工作。6.回滚 指容灾演练或流量...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

可观测性的设计原则

链路追踪 当系统出现问题时,需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求...

查看历史系统事件

您可以查询过去一周内已处理的云服务器ECS系统事件,获取故障诊断和复盘分析数据。通过控制台查看 登录 ECS管理控制台。在左侧导航栏,单击 事件。在 事件 页面,您可以选择相应的事件类型查看不同地域下的系统事件,获取实例ID、事件类型...

功能概述

③ 容灾演练或流量切换完成后,如希望恢复到执行前的访问策略,那么可以通过 回滚功能 实现,操作回滚,系统则会将故障地址池中的地址恢复为“智能返回”的工作模式,并会恢复访问策略。使用指南您可以参阅 容灾预案 文档。

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

云数据库Redis版是否支持主从节点的故障切换?

云数据库Redis版支持自动执行主从节点的故障切换。主从(Master-Replica)节点之间的同步和故障切换,由系统来自行管理,无需用户来维护。

挂载文件系统或读取文件系统报错时该如何解决?

本文主要介绍挂载文件系统或读取文件系统报错的原因以及解决方案。问题现象 文件系统挂载失败,未挂载的文件系统在尝试挂载时会报 Bad geometry 错误。文件系统读写失败,报 Cannot read inode bitmap 内核日志。问题原因 使用LVM(Logical...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
实时数仓 Hologres 智能语音交互 负载均衡 云安全中心 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用