主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

回切至本地物理机

如果扩充的是包含系统分区的磁盘,那么扩充的这部分空间会被ECS自动填充给系统分区,这样在恢复到本地的物理机时可能会出现分区越界的问题。如果系统分区相对源端机器被扩容,将会收缩相应的空间,确保和源端机器保持一致。反向注册。确认...

跨地域容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。按如下步骤进行故障切换:在 受保护服务器 页签,在要启动故障...

灾备规划

云上容灾 为减少因应用故障导致的业务损失,当数据中心出现严重故障无法快速恢复时,混合云容灾服务可以高效地在ECS上快速恢复您的应用。RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,...

使用慢日志排查超时问题

慢请求引起的连接超时等问题是影响Redis服务质量的常见问题,云数据库Redis的慢日志系统能够帮助您快速找到慢请求问题发生的位置,定位发出请求的客户端IP,为彻底解决超时问题提供可靠的依据。背景信息 Tair 的慢日志记录执行时间超过...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

使用慢日志排查超时问题

慢请求引起的连接超时等问题是影响Redis服务质量的常见问题,云数据库Redis的慢日志系统能够帮助您快速找到慢请求问题发生的位置,定位发出请求的客户端IP,为彻底解决超时问题提供可靠的依据。功能简介 Redis 的慢日志记录执行时间超过...

运行失败

对于当前版本Proxima CE,对索引的分区是依赖输入的doc表名和分区名的,因此同时跑多个任务时,如果doc表相同,会出现多个任务对同一个Volume下的索引文件有覆盖甚至删除的错误,导致读取MaxCompute Volume失败,类似的也会导致 索引加载...

数据库代理常见问题

如果您在使用RDS PostgreSQL数据库代理过程中存在疑问或遇到问题,可以参考本文查看解决方案。什么是数据库代理?数据库代理是位于数据库服务端和应用服务端之间的网络代理服务,用于转发应用服务端访问数据库时的所有请求,提供读写分离、...

解析不生效类问题FAQ

10.为什么某些地区会出现解析不生效?答:一般是如下两种情况 本地DNS服务器缓存导致:当修改完解析后,解析生效时间是取决于本地DNS服务器的缓存刷新时间。如果某些地区的 DNS 缓存刷新得快,那么就生效快;如果某些地区本地DNS缓存刷新...

常见问题

本文介绍在使用图数据库GDB过程中的常见问题。产品介绍 问:什么是图数据库GDB?答:GDB是Graph Database的简写。GDB是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache ...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...

使用热修复

热修复是指通过代码变动在不发版本的情况下直接修复线上的问题。热修复管理是客户端修复紧急问题的配置后台,您可以在该配置后台创建发布任务以及进行多维度的热修复配置。关于此任务 在 热修复管理 页面,通常您需要完成以下操作:添加热...

网络管理FAQ

什么会报no IP addresses available in range set?Service FAQ SLB相关 ACK集群中SLB实例的具体用途 创建Service时,Local和Cluster两种外部流量策略如何选择?为什么看不到Service与LoadBalancer同步过程的事件Event信息?SLB创建一直...

使用负载均衡SLB后出现500、502和504状态码

客户端IP地址被运营商拦截 测试其他ISP运营商的客户端是否有此问题,如果仅仅是某个固定运营商网络的客户端访问有问题一般是该运营商拦截导致。可以抓包查看是否被运营商拦截或提交工单联系阿里云技术支持排查。如果被运营商拦截,则需要...

ARMS告警精细管理最佳实践

背景知识 在告警管理中有一个非常重要的指标Mean Time To Contain(MTTC),MTTC描述了从检测到故障事件到控制和解决该事件所需的平均时间。它是一个关键指标,因为它衡量了一个组织对事件的响应能力和效率。较短的MTTC意味着组织能够快速...

EasyCkpt:AI大模型高性能状态保存恢复

在节点上,通常很难出现所有网卡都损坏的情况,即使节点出现故障,它通常仍然具备通信能力。特点3:模型的失败是部分的。在大规模模型训练中通常采用3D并行或ZeRO系列优化,大多数任务的数据并行副本数大于1,这使得模型训练参数在多个副本...

快速使用专属集群MyBase

背景信息 关于 专属集群MyBase 更多信息,详情请参见 什么是云数据库专属集群MyBase。操作步骤 步骤一:创建专属集群 登录 云数据库专属集群控制台。在页面左上角,选择目标地域。在 概览 页面,然后单击 创建集群。在 创建专属集群 面板,...

业产技融合分层协作方案

第二个问题如果回答的不好,就会出现产品技术团队每天在不断的接需求、做需求,功能在不断增加和堆叠,但是产品的竞争力却没有提高,时间长了对产品的演进危害很大。如果您的公司已经发展出独立的业务、产品、技术的独立部门,技术部门一般...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

常见问题

无法访问/访问异常 CDN回源时网站出现5xx报错的排查方法 使用CDN加速后网站无法访问 地域节点获取CDN节点文件异常或访问域名失败 使用CDN加速后访问URL时出现空白页面 定位访问异常是CDN节点问题还是源站问题 开通海外节点后没有提高海外...

什么页面出现滚动条?

问题描述 为什么页面出现滚动条?解决方案 一般是因为父级容器设置了滚动条,导致子级容器宽或高超出了父级容器的宽或高,可通过将父级容器的宽或高设置为100%解决。

CDN回源时网站出现5xx报错的排查方法

问题描述 当您使用阿里云CDN加速站点访问资源后,客户端的请求将首先发送到CDN的L1节点(一级节点),再回源到L2节点(二级节点),然后再回源到源站。因此如果访问过程中出现问题,可能涉及到多级网络链路的问题。当CDN回源源站异常失败时...

高可用和容灾设计

具体请参见各引擎的迁移可用区文档:RDS MySQL迁移可用区 RDS PostgreSQL迁移可用区 RDS SQL Server迁移可用区 当备实例出现故障不可用时,主实例进行实时备份,主实例备份临近完成时产生全局锁(FTWRL),导致主实例只读,一般不会...

错误码

说明:PolarDB-X 向后端数据节点异步创建连接时,如果在短时间创建大量连接,或者数据节点建立连接速度太慢,会出现等待超时。该问题通常是由于后端数据节点压力过大或异常导致的,建议使用 PolarDB-X 读写分离,或者升级更高规格,减轻后...

事件中心

该视图可以帮助您在应用出现故障时,快速排查关联的资源各自发生了什么问题。例如在大型企业中,由于某个员工的误操作,重启了生产环境的RDS,导致线上业务故障,利用该视图,可以快速的发现应用访问的RDS出现了重启操作。订阅规则 订阅...

CLB健康检查FAQ

如上所述,由于健康检查成功后,负载均衡服务器直接发送TCP RST包中断了连接,并没有做进一步的业务数据交互,导致上层业务(例如Java连接池等)认为相应的连接是异常的,所以会出现 Connection reset by peer 等错误信息。解决方案 更换...

实例容灾

多可用区将物理服务器部署在不同的可用区,当一个可用区出现故障时,可以将业务在短时间内切换到另一个可用区。整个切换过程中应用代码无需变更。说明 主备切换期间产生1次30秒内的连接闪断,建议您在业务低峰期操作,并确保应用具备自动...

故障注入

您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格>服务治理,然后单击 故障注入 页签。单击 添加注入 ...

常见问题

本文汇总了使用冷热分离功能时的常见问题。Q:数据什么时候进入冷存储?A:Lindorm通过 compaction 机制异步将冷数据从热存储归档至冷存储,系统触发时间默认为冷热分界线的一半,最小为1天,最大为 major compaction 周期的一半,major ...

常见问题

一般使用常见问题 数据源类 配置和接入类 告警类 数据源类 日志支持哪些时间格式?支持如下时间格式:normal:最常见的时间格式 2016-12-13 10:00:14 apache:apache 时间格式 08/May/2017 01:13:52_long:完整时间戳,精确到毫秒,格式 ...

远程连接FAQ

检查是否为海外服务器 中国内地访问其他国家和地区地域下的轻量应用服务器,可能会出现较大延迟和丢包,造成无法访问服务器的问题。该问题受国际运营商的影响,无法在服务器中修复。更多信息,请参见 远程连接非中国内地服务器时,提示连接...

Ingress FAQ

本文汇总了使用Nginx Ingress、ALB Ingress和MSE Ingress时出现的常见问题。Nginx Ingress Ingress支持哪些SSL/TLS版本?Ingress L7请求头默认是透传的吗?后端服务为HTTPS服务访问时是否可以通过Ingress-Nginx转发?Ingress L7透传客户端...

常见问题

code=exited”错误 启动SSH服务时出现“error while loading shared libraries”错误 ECS网络问题 Windows实例ping外地址提示“一般故障”Linux系统的ECS中没有禁ping却ping不通的解决方法 使用ping命令测试ECS实例时ping不通的排查方法 ...

Linux系统常用内核网络参数介绍与常见问题处理

什么/var/log/messages日志中会出现“Time wait bucket table overflow”错误信息?为什么Linux系统的ECS实例中,出现大量的处于FIN_WAIT2状态的TCP连接?为什么Linux系统的ECS实例中,出现大量的处于CLOSE_WAIT状态的TCP连接?为什么...

跨地域负载均衡

场景说明 企业应用服务一般会有多个IP,且多个IP地址可能分布于不同地区、不同运营商、不同厂商的数据中心中。在这种情况下,单个IP地址不足以承担用户的访问压力,针对应用服务的负载均衡架构设计也会变得非常困难。而通过DNS,则能够简单...

带宽计费

运营商 地区 单线日峰值带宽(元/Mbps/日)单线月第四峰值(元/Mbps/月)单线月95峰值(元/Mbps/月)电信、联通 北上广 2.00 50 50 地区中心 1.00 25 25 一般城市 0.80 20 20 移动 北上广 1.20 30 30 地区中心 0.60 15 15 一般城市 0.48 12...

同城高可用

当使用跨可用区CU类型的项目空间时,当主可用区出现故障时,作业将在您选择的备可用区恢复,从而有效避免因单个可用区故障导致服务中断,确保作业的持续性和高可用性。使用限制 仅Intel X86架构处理器的包年包月工作空间支持。仅北京、杭州...

自动SQL限流

除了上述的问题,在现实生活中可能还会出现各种特殊情况,比如值班人员联系不上、工作人员身边没有电脑、信息太多分析难度大、压力大紧张操作失误等。因此需要尽可能的把异常发现、异常SQL定位、SQL限流、跟踪/回滚的整体流程自动化处理。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云企业网 共享流量包 弹性公网IP 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用