主从(备)切换

注意事项 实例切换过程中会出现闪断,请确保您的应用程序具有自动重连机制。实例切换后,只读实例的数据会有几分钟的延迟,因为需要重建复制链路、同步增量数据等。手动切换主备实例 说明 仅 MyBase MySQL 高可用版实例支持主备切换。登录 ...

读写访问文件类问题

使用Linux操作系统在NFS协议文件系统中执行ls命令时,为什么会返回523错误?为什么SMB协议文件系统挂载有时候连接不上?为什么Administrator能看见挂载的SMB目录,其他用户看不到?如何解决Linux挂载SMB协议文件系统性能不佳?Linux访问SMB...

常见问题

警告 创建单节点地址后,当此节点故障时,该地址可能会出现最多1小时不可用的情况,请勿用于生产环境。Q:一个集群内最多允许创建多少个单节点地址?A:如果您的集群内有3个节点,则只允许为其中1个只读节点创建单节点地址;若集群内有4个...

常见问题

警告 创建单节点地址后,当此节点故障时,该地址可能会出现最多1小时不可用的情况,请勿用于生产环境。Q:一个集群内最多允许创建多少个单节点地址?A:如果您的集群内有3个节点,则只允许为其中1个只读节点创建单节点地址;若集群内有4个...

常见问题

警告 创建单节点地址后,当此节点故障时,该地址可能会出现最多1小时不可用的情况,请勿用于生产环境。Q:一个集群内最多允许创建多少个单节点地址?A:如果您的集群内有3个节点,则只允许为其中1个只读节点创建单节点地址;若集群内有4个...

配置源站

在某些情况下,用户实际请求回源到不同源站的比例并不一定会与域名配置中源站的权重比例相同,例如:回源QPS较低(例如不到10QPS),回源到不同源站的概率分布不太均匀,因此会出现实际回源权重与源站配置的权重不一致的情况。所有的请求均...

添加加速域名

说明 在某些情况下,用户实际请求回源到不同源站的比例并不一定会与域名配置中源站的权重比例相同,例如:回源QPS较低(例如不到10QPS),回源到不同源站的概率分布不太均匀,因此会出现实际回源权重与源站配置的权重不一致的情况。...

自动故障剔除

自动故障剔除功能自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

自动故障转移和读写分离

libpq实现自动故障转移和读写分离 通过libpq函数连接多个数据库,当出现故障自动切换到可用的数据库。命令 postgresql:/[user[:password]@][netloc][:port][,.][/dbname]?param1=value1&.]示例 如下示例为连接1个RDS PostgreSQL主实例...

应用场景

如果现有计算资源突然出现故障导致业务受到影响,很难及时进行故障修复或者替换。您可以利用弹性伸缩的高可用优势,开启健康检查模式。阿里云自动检查实例的健康状态,当发现存在实例不健康时,自动增加实例替换不健康的实例,确保...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

资源伸缩和系统扩展

如果现有计算资源突然出现故障导致业务受到影响,很难及时进行故障修复或者替换。此时可以利用弹性伸缩的高可用优势,开启健康检查模式。阿里云自动检查实例的健康状态,当发现存在实例不健康时,自动增加实例替换不健康的实例,确保...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

云解析DNS如何实现故障切换

全局流量管理支持IP地址健康检查功能,并根据健康检查的结果,来判断运营商IP地址是否出现故障,如果出现故障,则将域名解析切换到备份的运营商IP上,并最终帮用户实现自动故障转移的功效。请参阅 GTM实现跨网访问加速与故障切换 操作...

在/var/log/messages日志中出现“INFO:task jbd2/vda1...

问题原因 在Linux系统的ECS实例中,当某个进程因为某种原因无法继续执行,并且长时间停滞在某个状态下无法响应,就发生挂起任务(hung task)故障出现hung task故障可能原因如下:进程卡住(blocked):当某个进程在执行过程中出现死锁...

RPC 常见问题

什么 SOFABoot 应用已经启动,但服务没有发布成功?您可以根据以下几个情况进行排查:应用非正常启动 通常可以查看 health-check 日志。如果有 error 日志,可以根据相关信息进行排查,常见的故障信息包括:redis 没有正确配置。一个服务...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

常见问题

答:对于GDB高可用版,当主节点出现故障时,GDB会快速切换到备节点。切换过程中会出现短时间的连接闪断(切换很快,主要为主节点故障诊断和确认时间),需要用户设置好程序的自动重连,避免因为切换导致服务不可用。问:图数据库GDB支持跨...

副本集实例连接说明

重要 不建议在生产环境的应用程序通过该地址连接实例,当主节点出现故障时,发生主备切换,主节点地址发生变化,您需要连接新的主节点确保读写操作不受影响。Secondary:从节点,连接从节点地址仅能执行数据库的读操作。Readonly:只读...

节点异常问题排查

常见排查方法 节点故障诊断 当节点出现故障时,您可以使用容器服务ACK提供的故障诊断功能,一键诊断节点异常。登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...

节点异常问题排查

常见排查方法 节点故障诊断 当节点出现故障时,您可以使用容器服务ACK提供的故障诊断功能,一键诊断节点异常。登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...

Linux系统常用内核网络参数介绍与常见问题处理

net.ipv4.tcp_app_win = 31net.ipv4.tcp_adv_win_scale = 2net.ipv4.tcp_tw_reuse = 0net.ipv4.tcp_frto = 2net.ipv4.tcp_frto_response = 0net.ipv4.tcp_low_latency = 0net.ipv4.tcp_no_metrics_save = 0net.ipv4.tcp_moderate_rcvbuf = 1net.ipv4.tcp_tso_win_divisor = 3net.ipv4.tcp_congestion_control = cubicnet.ipv4.tcp_abc = 0net.ipv4.tcp_mtu_probing = 0net.ipv4.tcp_base_mss = 512net.ipv4.tcp_workaround_signed_windows = 0net.ipv4.tcp_challenge_ack_limit = 1000net.ipv4.tcp_limit_output_bytes = 262144net.ipv4.tcp_dma_copybreak = 4096net.ipv4.tcp_slow_start_after_idle = 1net.ipv4.cipso_cache_enable = 1net.ipv4.cipso_cache_bucket_size = 10net.ipv4.cipso_rbm_optfmt = 0net.ipv4.cipso_rbm_strictvalid = 1修改内核参数。临时修改。sbin/sysctl-w kernel.parameter="[$Example]"说明 kernel.parameter请...

使用云监控功能监控网站环境(部署于ECS实例)

设置合理的监控可以让您实时了解系统业务的运行情况,并能帮助您提前发现问题,避免可能会出现的业务故障。同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。前提条件 在开始设置云监控前,您需要...

ZooKeeper的使用场景和MSE ZooKeeper的优势

节点故障自愈:依托于K8s的Liveness能力,在节点出现故障时,自动恢复故障节点,及时地保障服务的可持续性。数据安全:MSE ZooKeeper专业版提供了快照的备份能力,在集群出现非预期的情况时,能够快速重建恢复集群中的数据,保障数据的...

EMR Kafka磁盘故障运维

业务场景 Kafka将日志数据存储到磁盘中,当磁盘出现故障时,导致磁盘IO能力下降、集群吞吐下降、消息读写延时或日志目录offline等问题。这些情况有可能影响到线上业务平稳运行、数据丢失、Kafka集群容错能力下降,单块盘故障甚至有可能...

CLB健康检查FAQ

如上所述,由于健康检查成功后,负载均衡服务器直接发送TCP RST包中断了连接,并没有做进一步的业务数据交互,导致上层业务(例如Java连接池等)认为相应的连接是异常的,所以会出现 Connection reset by peer 等错误信息。解决方案 更换...

Linux系统常用内核网络参数介绍与常见问题处理

net.ipv4.tcp_app_win = 31net.ipv4.tcp_adv_win_scale = 2net.ipv4.tcp_tw_reuse = 0net.ipv4.tcp_frto = 2net.ipv4.tcp_frto_response = 0net.ipv4.tcp_low_latency = 0net.ipv4.tcp_no_metrics_save = 0net.ipv4.tcp_moderate_rcvbuf = 1net.ipv4.tcp_tso_win_divisor = 3net.ipv4.tcp_congestion_control = cubicnet.ipv4.tcp_abc = 0net.ipv4.tcp_mtu_probing = 0net.ipv4.tcp_base_mss = 512net.ipv4.tcp_workaround_signed_windows = 0net.ipv4.tcp_challenge_ack_limit = 1000net.ipv4.tcp_limit_output_bytes = 262144net.ipv4.tcp_dma_copybreak = 4096net.ipv4.tcp_slow_start_after_idle = 1net.ipv4.cipso_cache_enable = 1net.ipv4.cipso_cache_bucket_size = 10net.ipv4.cipso_rbm_optfmt = 0net.ipv4.cipso_rbm_strictvalid = 1修改内核参数。临时修改。sbin/sysctl-w kernel.parameter="[$Example]"说明 kernel.parameter请...

事件中心

该视图可以帮助您在应用出现故障时,快速排查关联的资源各自发生了什么问题。例如在大型企业中,由于某个员工的误操作,重启了生产环境的RDS,导致线上业务故障,利用该视图,可以快速的发现应用访问的RDS出现了重启操作。订阅规则 订阅...

K8s应用运维管理最佳实践

在Java类型应用中,如果出现故障Pod实例,可以借助Arthas诊断,排查Pod故障点。相关文档,请参见 Arthas诊断。如果应用无法正常启动,可以将启动命令修改为 sleep,再通过 kubectl exec 手动启动进程,观察输出并分析原因。相关文档,请...

事件中心

该视图可以帮助您在应用出现故障时,快速排查关联的资源各自发生了什么问题。例如在大型企业中,由于某个员工的误操作,重启了生产环境的RDS,导致线上业务故障,利用该视图,可以快速的发现应用访问的RDS出现了重启操作。集群视图 集群...

Windows系统ECS实例激活失败

查看IP安全策略,详情请参见 服务器ping外网提示一般故障处理方法 中查看是否设置了 IP 安全策略章节。查看是否有其它安全软件对kms.cloud.aliyuncs.com的1688 TCP端口的访问做了拦截。执行 route print 命令查看服务器内部的路由是否正常...

通过Mongo Shell连接MongoDB副本集实例

重要 不建议在生产环境的应用程序通过该地址连接实例,当主节点出现故障时,发生主备切换,主节点地址发生变化,您需要连接新的主节点确保读写操作不受影响。Secondary:从节点,连接从节点地址仅能执行数据库的读操作。Readonly:只读...

添加IP应用加速域名

当您的加速域名审核通过后,会出现在 IP应用加速 的域名列表中,状态为 正常运行,表示添加成功。步骤三:配置CNAME IP应用加速域名添加成功后,需要记录IP应用加速域名对应的CNAME记录值,将加速域名的解析指向该CNAME记录值,即可体验IP...

远程连接FAQ

检查是否为海外服务器 中国内地访问其他国家和地区地域下的轻量应用服务器,可能会出现较大延迟和丢包,造成无法访问服务器的问题。该问题受国际运营商的影响,无法在服务器中修复。更多信息,请参见 远程连接非中国内地服务器时,提示连接...

常见问题

code=exited”错误 启动SSH服务时出现“error while loading shared libraries”错误 ECS网络问题 Windows实例ping外网地址提示“一般故障”Linux系统的ECS中没有禁ping却ping不通的解决方法 使用ping命令测试ECS实例时ping不通的排查方法 ...

添加服务域名

在某些情况下,用户实际请求回源到不同源站的比例并不一定会与域名配置中源站的权重比例相同,例如:回源QPS较低(例如不到10QPS),回源到不同源站的概率分布不太均匀,因此会出现实际回源权重与源站配置的权重不一致的情况。所有的请求均...

诊断项与诊断结果说明

实例所在宿主机告警 实例所在的物理设备出现故障告警。检查该实例所在的底层物理机是否有故障。如果底层物理机存在故障,则可能影响实例的运行状态或性能。您可以尝试通过重启实例进行恢复。实例性能受限 积分型实例当前处于性能受限模式...

如何快速定位及解决数据库问题

SHOW PROCESSLIST WHERE INFO IS NOT NULL 一般情况下,语句堆积伴随着数据库卡慢一起出现,因此如果该语句的显示结果中没有大量执行时间大于0的语句,则基本可以断定问题不在数据库层面,反之,则说明数据库可能存在瓶颈。通过堆栈信息...

错误代码

Env:*,UnitName:null.Message from pool:wait millis 5000,active 3,maxActive 5.PolarDB-X 1.0 向后端RDS MySQL异步创建连接时,如果短时间内创建大量连接,或者RDS MySQL建立连接速度太慢,会出现等待超时。该问题通常是由后端RDS ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
负载均衡 数据库自治服务 应用高可用服务 云数据库 OceanBase 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用