消费进度管理

某消息被指定消费者消费过一次后,如果业务出现异常需要做故障恢复,该消息能否被重新消费?消费进度原理 消息位点(Offset)参考 云消息队列 RocketMQ 版 主题 和 队列 的定义,消息是按到达服务端的先后顺序存储在指定主题的多个队列中,...

进入Linux系统的单用户模式

在某些特殊场景下(例如排查Linux实例启动故障、修复系统异常、维护硬盘分区或root用户被锁定,需要修改密码),您可以通过Linux系统的系统引导器(GRUB)进入单用户模式进行操作。在该模式下,只启动最基本的组件和服务,并且操作者拥有...

Windows系统ECS实例激活失败

查看IP安全策略,详情请参见 服务器ping外网提示一般故障处理方法 中查看是否设置了 IP 安全策略章节。查看是否有其它安全软件对kms.cloud.aliyuncs.com的1688 TCP端口的访问做了拦截。执行 route print 命令查看服务器内部的路由是否正常...

离线同步并发和限流之间的关系

在一些数据同步场景,脏数据的出现会导致任务同步效率下降,以关系数据库写出为例,默认是执行batch批量写出模式,在遇到脏数据时退化为单条写出模式(以找出batch批次数据具体哪一条是脏数据,保障正常数据正常写出),但单条写出效率...

如何快速定位及解决数据库问题

SHOW PROCESSLIST WHERE INFO IS NOT NULL 一般情况下,语句堆积伴随着数据库卡慢一起出现,因此如果该语句的显示结果中没有大量执行时间大于0的语句,则基本可以断定问题不在数据库层面,反之,则说明数据库可能存在瓶颈。通过堆栈信息...

消息存储和清理机制

评估和控制存储成本:云消息队列 RocketMQ 版 消息一般存储于磁盘介质上,您可以通过存储机制评估消息存储空间,提前预留存储资源。消息存储机制 原理机制 云消息队列 RocketMQ 版 使用存储时长作为消息存储的依据,即每个节点对外承诺消息...

集群负载不均问题的分析方法及解决方案

建议单节点shard总数按照单节点内存*30进行评估,如果shard数量太多,极易引起文件句柄耗尽,导致集群故障建议单个节点上同一索引的shard个数不要超5个。如果您使用了自动创建索引功能,可通过设置场景模板,调整索引shard均衡,详情请...

云原生网关FAQ

在MseIngressConfig中有相关的配置项,MSE Ingress自动同步MseIngressConfig中的配置项到MSE网关控制台,在控制台修改配置项后有可能出现被MSE Ingress同步信息覆盖的情况,建议统一使用MSE Ingress方式修改配置项。云原生网关路由优先级...

定时/延时消息

定时/延时消息为 云消息队列 RocketMQ 版 中的高级特性消息,本文为您介绍定时/延时消息的应用场景、功能原理、使用限制、使用方法和使用建议。应用场景 说明 定时消息和延时消息本质相同,都是服务端根据消息设置的定时时间在某一固定时刻...

Linux系统挂载NFS协议文件系统

典型问题 文件创建“延迟”问题现象:ECS-1创建了文件 abc,但是ECS-2需要过一段时间才能看到ECS-1创建的文件 abc,有时延迟1s,有时甚至到1分钟,这是为什么?问题原因:这是Lookup Cache导致的,符合预期T时间。例如,ECS-2在ECS-1...

升级实例版本

Kafka提供0.10.x、2.2.0和 2.6.2大版本,其中,0.10.x大版本提供0.10版本和0.10.2版本。通过升级大小版本可以获得性能提升和新特性支持。前提条件 云消息队列 Kafka 版 实例的状态为 服务中。背景信息 升级大版本 升级大版本是指跨版本升级...

X-Engine简介

X-Engine是阿里云数据库产品事业部自研的联机事务处理OLTP(On-Line Transaction Processing)数据库存储引擎。目前已经广泛应用在阿里集团内部诸多业务系统中,包括交易历史库、钉钉历史库等核心应用,大幅缩减了业务成本,同时也作为双...

集群管理FAQ

当Kubernetes集群出现问题或者节点异常时,您可通过容器服务ACK提供的一键故障诊断功能,辅助您定位集群中出现的问题,详情请参见 使用集群诊断。如果集群诊断功能无法满足需求,您需要分别在Master节点和异常的Worker节点上收集Kubernetes...

常见问题

A:切换域名后,可能会存在DNS解析缓存问题,在缓存过期时间内可能会出现连接不上数据库或数据库只支持读操作无法执行写入操作等情况,建议您刷新一下服务器的DNS缓存。Q:迁移切换后,为什么在PolarDB-X 2.0标准版控制台上看不见 完成迁移...

自动/手动主备切换

注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请务必确保应用具备重连机制;当只读节点开启了热备功能时,主备切换将在5~10秒内完成。关于如何开启只读节点的热备...

自动故障剔除

自动故障剔除功能自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

V2.2.X升级至V2.3.0

注意 继续使用2.2.X版本可能会出现不兼容的情况,建议您升级至V2.3.0。与旧版本相比,V2.3.0的主要变化如下:资源引用接入流程 主SDK(Caster-next)版本升级为2.3.0,包括CSS和JS资源。播放器方案升级,需要变更相关依赖,移除 adapter.min....

自动或手动主备切换

A:RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

自动故障转移和读写分离

libpq实现自动故障转移和读写分离 通过libpq函数连接多个数据库,当出现故障自动切换到可用的数据库。命令 postgresql:/[user[:password]@][netloc][:port][,.][/dbname]?param1=value1&.]示例 如下示例为连接1个RDS PostgreSQL主实例...

自动或手动主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

管理主备切换

背景信息 自动切换:实例默认开启自动切换,当主实例出现故障无法访问时,自动切换到备实例。主备切换的触发时机,请参见 主备切换原因。手动切换:即使自动切换是开启状态,您也可以手动进行主备切换。手动切换可用于容灾演练或多可用区...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

INSTALL_FAILED_NO_MATCHING_ABIS

问题分析 当安装的App包含native libraries(一般是so文件)的时候,如果没有对应机器CPU架构的库文件,就会出现这种问题。比如,开发者编译了一个armv7平台的App,但是想要装在intel架构的设备上,就会出现这个错误。解决方案 安装的App...

高可用系列

说明 当备节点出现故障不可用时,主节点进行实时备份,主节点备份临近完成时产生全局锁(FTWRL),导致主节点只读,一般不会超过5秒。功能全面 高可用系列实例提供完整的产品功能,包括弹性伸缩、备份恢复、性能优化、读写分离等,且...

CDN的回源流量较大

缓存命中率差,那么回源流量增大,一般缓存命中率建议在90%及以上。缓存命中率高,当CDN总流量基数大时,回源流量相对来说也增大,属于正常情况。解决方案 缓存命中率差的解决方法如下所示。登录 CDN控制台,单击目标域名右侧的管理,...

MSE注册配置中心高可用最佳实践

多可用区实例将物理服务器部署在不同的可用区,当可用区A出现故障时,流量在短时间内切换到另一个可用区B。整个过程您无需感知,应用代码无需变更。您只需配置多个节点部署,MSE自动部署到多个可用区。图 1.MSE三节点同城双活架构图 图 2...

更换实例所属的可用区

说明 当实例的网络类型为专有网络,该选项才会出现且需要配置。执行时间 立即执行:单击 确定 后,系统立即执行迁移可用区任务,直到实例状态为 运行中 时,迁移可用区成功。可维护时间内执行(推荐):单击 确定 后,系统立即执行迁移可用...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

更换实例所属的可用区

说明 当实例的网络类型为专有网络,该选项才会出现且需要配置。执行时间 立即执行:单击 确定 后,系统立即执行迁移可用区任务,直到实例状态为 运行中 时,迁移可用区成功。可维护时间内执行(推荐):单击 确定 后,系统立即执行迁移可用...

同步方案选取指南

当您在使用关系型数据库(RDS)遇到查询慢的问题时,可将RDS中的...需要您自行保证Canal的可用性,避免出现业务不可用或故障。例如:当出现ECS重启,Canal异常退出等场景时如何继续同步数据等。通过Canal将MySQL数据同步到阿里云Elasticsearch

访问策略配置

说明 GTM使用的是云解析的调度能力,如果您在测试过程中,发现偶尔会出现DNS解析结果和权重配置不符的现象,这属于一种正常现象。因为加权轮询是一个粗粒度的解析流量调度方式,它针对的是localdns的请求,而localdns在TTL时间内是只会向...

集群容量规划

通常的建议如下:至少选择2个节点,避免出现单节点故障建议选择较高规格的节点,例如选择16C 64GB的实例规格。如果实际测试发现计算资源不符合,扩容时,建议优先进行纵向扩容,例如把节点规格从4C 16GB的规格升级到8C 32GB,然后再考虑...

ECS系统事件汇总

系统事件用于记录和通知云资源信息,例如运维任务执行情况、资源是否出现异常和资源状态变化等。您可以通过系统事件获取ECS资源的风险和异常信息,例如 某一实例到期、实例因底层升级需迁移或因系统维护重启了某一实例等,然后及时响应和...

快速使用专属集群MyBase

背景信息 关于 专属集群MyBase 更多信息,详情请参见 什么是云数据库专属集群MyBase。操作步骤 步骤一:创建专属集群 登录 云数据库专属集群控制台。在页面左上角,选择目标地域。在 概览 页面,然后单击 创建集群。在 创建专属集群 面板,...

灾备规划

云上容灾 为减少因应用故障导致的业务损失,当数据中心出现严重故障无法快速恢复时,混合云容灾服务可以高效地在ECS上快速恢复您的应用。RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,...

消息发送重试和流控机制

消息发送重试机制 重试基本概念 云消息队列 RocketMQ 版 客户端连接服务端发起消息发送请求时,可能因为网络故障、服务异常等原因导致调用失败。为保证消息的可靠性,云消息队列 RocketMQ 版 在客户端SDK中内置请求重试逻辑,尝试通过重...

【通知】Lettuce客户端升级建议

修复与优化 Lettuce 6.3.0.RELEASE版本已修复客户端在多次请求超时后不再自动重连的问题,更多关于该问题的背景、复现方法与解决方案等信息,请参见 为什么Lettuce带来更长的故障时间?版本建议 若依赖为Lettuce:请直接升级到6.3.0....
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用