主从(备)切换

注意事项 实例切换过程中会出现闪断,请确保您的应用程序具有自动重连机制。实例切换后,只读实例的数据会有几分钟的延迟,因为需要重建复制链路、同步增量数据等。手动切换主备实例 说明 仅 MyBase MySQL 高可用版实例支持主备切换。登录 ...

在/var/log/messages日志中出现“INFO:task jbd2/vda1...

系统内核问题:当系统内核存在漏洞或者其他问题时,可能会出现hung task故障。系统资源紧张:ECS实例中应用或进程占用系统资源使用率(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考...

使用云监控功能监控网站环境(部署于ECS实例)

设置合理的监控可以让您实时了解系统业务的运行情况,并能帮助您提前发现问题,避免可能会出现的业务故障。同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。前提条件 在开始设置云监控前,您需要...

通过Mongo Shell连接MongoDB副本集实例

重要 不建议在生产环境的应用程序通过该地址连接实例,当主节点出现故障时,发生主备切换,主节点地址发生变化,您需要连接新的主节点确保读写操作不受影响。Secondary:从节点,连接从节点地址仅能执行数据库的读操作。Readonly:只读...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现故障 ...

自动故障剔除

自动故障剔除功能自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

自动故障转移和读写分离

libpq实现自动故障转移和读写分离 通过libpq函数连接多个数据库,当出现故障自动切换到可用的数据库。命令 postgresql:/[user[:password]@][netloc][:port][,.][/dbname]?param1=value1&.]示例 如下示例为连接1个RDS PostgreSQL主实例...

应用场景

如果现有计算资源突然出现故障导致业务受到影响,很难及时进行故障修复或者替换。您可以利用弹性伸缩的高可用优势,开启健康检查模式。阿里云会自动检查实例的健康状态,当发现存在实例不健康时,自动增加实例替换不健康的实例,确保...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

SSL-VPN连接常见问题

原因分类 原因 解决方案 公网链路质量不佳 如果您使用SSL-VPN连接进行长距离通信(例如美国(硅谷)到新加坡),在客户端访问VPC的过程中,则可能会出现客户端间歇性中断下线的情况。请在阿里云侧将SSL服务端的 协议 修改为 TCP(可靠性更...

主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

云解析DNS如何实现故障切换

全局流量管理支持IP地址健康检查功能,并根据健康检查的结果,来判断运营商IP地址是否出现故障,如果出现故障,则将域名解析切换到备份的运营商IP上,并最终帮用户实现自动故障转移的功效。请参阅 GTM实现跨网访问加速与故障切换 操作...

常见问题

警告 创建单节点地址后,当此节点故障时,该地址可能会出现最多1小时不可用的情况,请勿用于生产环境。Q:一个集群内最多允许创建多少个单节点地址?A:如果您的集群内有3个节点,则只允许为其中1个只读节点创建单节点地址;若集群内有4个...

常见问题

警告 创建单节点地址后,当此节点故障时,该地址可能会出现最多1小时不可用的情况,请勿用于生产环境。Q:一个集群内最多允许创建多少个单节点地址?A:如果您的集群内有3个节点,则只允许为其中1个只读节点创建单节点地址;若集群内有4个...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

如何确认AP为正常工作

详细信息 查看AP指示灯 AP指示灯将根据不同故障问题,进行不同频率的闪烁。闪烁情况请见下表:闪烁间隔 原因 不亮 没通电 50ms 没有IP地址 200ms 到网关没通 1000ms 到公网不通 2000ms DNS有问题 4000ms 其它原因导致连不上云端 常亮 ...

访问云虚拟主机网站时无法正常访问(无报错信息)

当访问网页出现以下问题时,可能造成网页中的图片不能正常显示或显示不全:原因一:您上传的图片所在目录下,文件名的大小写与网页中引用的文件名不统一。原因二:调用图片文件时采用了绝对路径。例如 file:/c:/images/abc.gif,这种形式...

远程桌面无法连接到Windows实例的快速排查方法

异常三:终端服务器角色配置 用户在使用远程桌面访问Windows实例时,有时会出现如下提示。这种情况一般是由于在服务器上安装配置了 终端服务器,但是没有配置有效的访问授权导致的。可参见如下两个解决方案处理。Windows服务器远程桌面提示...

无法远程连接Windows实例的排查方法

异常三:终端服务器角色配置 在使用远程桌面访问Windows实例时,可能会出现如下提示。这种情况一般是由于在服务器上安装配置了 终端服务器,但是没有配置有效的访问授权导致的,可参考以下三种解决方案处理:Windows服务器远程桌面提示...

常见问题

code=exited”错误 启动SSH服务时出现“error while loading shared libraries”错误 ECS网络问题 Windows实例ping外网地址提示“一般故障”Linux系统的ECS中没有禁ping却ping不通的解决方法 使用ping命令测试ECS实例时ping不通的排查方法 ...

添加IP应用加速域名

当您的加速域名审核通过后,会出现在 IP应用加速 的域名列表中,状态为 正常运行,表示添加成功。步骤三:配置CNAME IP应用加速域名添加成功后,需要记录IP应用加速域名对应的CNAME记录值,将加速域名的解析指向该CNAME记录值,即可体验IP...

Pod诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

节点诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

ZooKeeper的使用场景和MSE ZooKeeper的优势

节点故障自愈:依托于K8s的Liveness能力,在节点出现故障时,自动恢复故障节点,及时地保障服务的可持续性。数据安全:MSE ZooKeeper专业版提供了快照的备份能力,在集群出现非预期的情况时,能够快速重建恢复集群中的数据,保障数据的...

用云成本需求分析

伴随云计算的发展,新技术、新产品、新工具不断出现,往往都会带来性能或效率上的提升,从而提升企业用云性价比和管理效率。如服务器、数据库的升级、研发效能平台的推出等,企业利用新技术架构或产品类型适配自身业务发展可提升用云效能...

网站耗资源(客户程序故障)常见问题

网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能会出现问题。网站访问量过大或者流量过大导致内存耗尽。网站耗资源(客户程序故障)的处理方法是什么?为了保证您的站点能够安全、稳定地运行,阿里云的...

EMR Kafka磁盘故障运维

业务场景 Kafka将日志数据存储到磁盘中,当磁盘出现故障时,导致磁盘IO能力下降、集群吞吐下降、消息读写延时或日志目录offline等问题。这些情况有可能影响到线上业务平稳运行、数据丢失、Kafka集群容错能力下降,单块盘故障甚至有可能...

跨地域容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。故障切换步骤如下:在左侧导航栏,选择 连续复制型容灾>云上容...

跨可用区容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。故障切换步骤如下:在左侧导航栏,选择 连续复制型容灾>云上容...

DATASOURCE:ECS:DedicatedHosts

故障潜伏期,其物理机处于可用状态,但可能导致专有宿主机中的ECS实例出现问题。PermanentFailure:故障。永久性故障,专有宿主机不可用。ZoneId String 否 是 可用区ID。无 ResourceGroupId String 否 是 资源组ID。无 ...

使用须知

实例升级 GDB实例升级的过程中会出现短时间的连接闪断,需要您提前做好准备,并设置好程序的自动重连,避免因为升级导致服务不可用。故障切换 GDB高可用版实例主节点出现故障时,系统会快速切换到备节点。切换过程中有短时间的连接闪断,...

切换接入点

智能接入网关设备连接阿里云时,因公网质量影响,上云链路可能会出现不稳定等情况,您可以根据业务需求切换智能接入网关设备的接入点,方便您更加灵活、稳定地使用上云服务。背景信息 接入点是智能接入网关设备接入云连接网时的连接点。...

云盒计算资源配置最佳实践

反之,如果选择最大实例规格为ecs.g6.26xlarge的SKU,由于该规格族的vCPU和内存配比1:4,则会出现内存浪费的情况。根据业务需求选择SKU时,可能会需要多种不同配比的ECS实例,此时可以选择多种规格族混合的SKU,以减少资源浪费。例如:您...

自动切换可用区

说明 集群自动切换到备可用区后,网络是处于跨可用区访问状态,会出现一定的访问延迟,建议您回切到原主可用区。选择 回切原主可用区 进行回切时,仍然使用原来的交换机。选择 更换主可用区 进行回切时,可以重新选择交换机。回切原主可用...

混沌工程缓存实战系列-Redis

示例架构图如下:从架构图可以看出,在Jedis配置、缓存查询、网络传输、服务端处理这条链路上,每个环节都有可能出现问题。借助混沌工程可以了解到问题发生时对系统、业务的影响面是否符合预期。梳理演练场景 对于示例应用,可以按照以下...

DDH生命周期

是 物理机风险 稳定状态 DDH处于故障潜伏期,其物理机处于可用状态,但可能导致DDH中的ECS实例出现问题。您可以自主迁移故障潜伏期的DDH到其他物理机,具体操作请参见 迁移有潜在故障风险的DDH。是 故障 稳定状态 DDH出现故障。您可以 提交...

响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

云数据库Redis版是否开放了从节点?

当主节点出现故障,HA系统自动进行主从切换,保证业务平稳运行。高可用类型的集群架构也是由多个主从(Master-Replica)双节点组成,其中从节点仅用于故障切换(HA),不提供读写服务。如需使用只读节点实现读写分离场景,您可以使用读写...

DescribeDedicatedHosts-查询专有宿主机详细信息

UnderAssessment:物理机风险,即故障潜伏期,其物理机处于可用状态,但可能导致专有宿主机中的 ECS 实例出现问题。PermanentFailure:永久性故障,专有宿主机不可用。TempUnavailable:宿主机临时不可用。Redeploying:宿主机恢复中。默认...
共有99条 < 1 2 3 4 ... 99 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用