通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

回切至本地物理机

如果扩充的是包含系统分区的磁盘,那么扩充的这部分空间会被ECS自动填充给系统分区,这样在恢复到本地的物理机时可能会出现分区越界的问题。如果系统分区相对源端机器被扩容,将会收缩相应的空间,确保和源端机器保持一致。反向注册。确认...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

远程连接FAQ

检查是否为运营商网络问题 使用其他网络环境中的本地主机连接轻量应用服务器,或更换其他无线网络(例如手机热点)访问测试,判断是否是由于本地网络故障导致的无法连接。排除本地网络故障后再进行后续的排查。如果是本地运营商网络问题,...

资源组操作及网络连通

数据同步网络连通问题 在做离线同步时,我们需要先了解哪些DataWorks及其网络能力?同步ECS自建的数据库的数据时,如何保障数据库与DataWorks的网络连通?数据库和DataWorks不在同一个地域(Region)下,进行数据同步时如何保障数据库与...

实例容灾

多可用区将物理服务器部署在不同的可用区,当一个可用区出现故障时,可以将业务在短时间内切换到另一个可用区。整个切换过程中应用代码无需变更。说明 主备切换期间产生1次30秒内的连接闪断,建议您在业务低峰期操作,并确保应用具备自动...

运行失败

对于当前版本Proxima CE,对索引的分区是依赖输入的doc表名和分区名的,因此同时跑多个任务时,如果doc表相同,会出现多个任务对同一个Volume下的索引文件有覆盖甚至删除的错误,导致读取MaxCompute Volume失败,类似的也会导致 索引加载...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

数据库代理常见问题

如果您在使用RDS PostgreSQL数据库代理过程中存在疑问或遇到问题,可以参考本文查看解决方案。什么是数据库代理?数据库代理是位于数据库服务端和应用服务端之间的网络代理服务,用于转发应用服务端访问数据库时的所有请求,提供读写分离、...

通过Mongo Shell连接MongoDB副本集实例

如果您需要使用专有网络,但ECS实例的网络类型为 经典网络,您可以将ECS实例网络类型转换为专有网络,具体请参见 ECS实例从经典网络迁移到专有网络。将客户端IP地址添加至云数据库MongoDB实例的白名单中,添加方法请参见 设置白名单。如果...

ECS实例使用的Windows系统激活失败如何解决?

问题原因 出现这个报错一般都是由于服务器到KMS之间的网络存在问题,导致服务器无法跟KMS进行通讯。网络存在问题可能是由于Windows系统的ECS实例中系统防火墙、IP安全策略或者其他网络安全管理软件阻断了服务器与ECS激活服务器之间的通信...

CLB健康检查FAQ

如上所述,由于健康检查成功后,负载均衡服务器直接发送TCP RST包中断了连接,并没有做进一步的业务数据交互,导致上层业务(例如Java连接池等)认为相应的连接是异常的,所以会出现 Connection reset by peer 等错误信息。解决方案 更换...

弹性加速计算实例EAIS安全性说明

弹性加速计算实例EAIS的云上安全性,是阿里云在面对当前的网络安全形势和挑战时所采取的措施,以及提高用户在资源和网络访问控制、EAIS资源操作、故障隔离和风险检测等方面的安全性所具备的能力。说明 通过在ECS实例(非GPU实例)上绑定...

ACVIP 问题排查

如果没有通讯,则说明网络出现故障,建议检查网络问题。使用问题 获取不到域名信息如何处理?使用 curl 命令尝试获取域名信息,获取命令如下:curl-i-XPOST {acvip地址}:9003/antcloud/antvip/instances/get-d '{"vipDomainName2...

使用负载均衡SLB后出现500、502和504状态码

客户端IP地址被运营商拦截 测试其他ISP运营商的客户端是否有此问题,如果仅仅是某个固定运营商网络的客户端访问有问题一般是该运营商拦截导致。可以抓包查看是否被运营商拦截或提交工单联系阿里云技术支持排查。如果被运营商拦截,则需要...

Windows系统ECS实例激活失败

问题分析 出现这个报错一般都是由于服务器到KMS之间的网络存在问题,导致服务器无法跟KMS进行通讯。网络存在问题可能是由于Windows系统的ECS实例中系统防火墙、IP安全策略,或其它网络安全管理软件阻断了服务器与ECS激活服务器之间的通信...

Android端

背景音乐播放超时回调onDownloadTimeout,多出现于播放网络URL的背景音乐,提示主播检查当前网络状态,可调用startBGMAsync重新播放。当网络中断时 短时间断网和网络切换:即短时间的网络波动或者网络切换。一般情况下,中途断网时长在...

企业单AZ架构升级到多AZ

准备阶段:由于基础版只有一个数据库节点,变更配置时会出现较长时间中断,请选择非高峰期内进行操作以减少对业务的影响。执行升级:参考文档 基础系列升级为高可用系列 进行操作。注意事项:变配过程中会有约30秒的闪断。在提交变配订单至...

网络不通畅导致网站无法正常访问

问题原因 如果从您本地到网站所在服务器中间的网络不通畅,导致访问网站较慢或者无法访问。解决方案 您可以通过 tracert 命令进行路由测试,检测网站访问路径上哪些节点上的网络存在问题。说明 Tracert(跟踪路由)是路由跟踪实用程序,...

跨地域容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。故障切换步骤如下:登录 混合云容灾管理控制台。单击 切换到...

常见问题

本文介绍在使用图数据库GDB过程中的常见问题。产品介绍 问:什么是图数据库GDB?答:GDB是Graph Database的简写。GDB是一种支持Property Graph图模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache ...

网络域是什么

什么情况下需要创建网络域 通常情况下,用户本地IDC的数据库,使用DBGateway 通过公网方式接入DAS,DAS自动生成 默认 的网络域。以下情况只有在使用 集中模式DBGateway 才需要考虑创建新的网络域。新接入的网络环境和已经接入的网络环境...

监控、诊断和故障排除

网络故障引起丢包重试。例如客户端发起一个删除操作删除某个Object,此时请求达到服务端,执行删除成功,但是响应在网络环境中丢包,然后客户端发起重试,第二次的删除操作可能就遇到404错误。这种由于网络问题引起的404错误可以通过客户...

跨可用区容灾

警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。故障切换步骤如下:登录 混合云容灾管理控制台。单击 切换到...

常见问题

无法访问/访问异常 CDN回源时网站出现5xx报错的排查方法 使用CDN加速后网站无法访问 地域节点获取CDN节点文件异常或访问域名失败 使用CDN加速后访问URL时出现空白页面 定位访问异常是CDN节点问题还是源站问题 开通海外节点后没有提高海外...

节点诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

Pod诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

同城高可用

当使用跨可用区CU类型的项目空间时,当主可用区出现故障时,作业将在您选择的备可用区恢复,从而有效避免因单个可用区故障导致服务中断,确保作业的持续性和高可用性。使用限制 仅Intel X86架构处理器的包年包月工作空间支持。仅北京、杭州...

新手指引

步骤一:创建企业无线网络实例 在 SASE 上创建企业无线网络实例,通过EAP-TLS认证(证书认证)技术接入企业办公网。步骤二:获取SASE网络准入服务器信息 接入企业办公网络之前,您需要在企业NAC(即网络接入控制器)上配置 SASE Radius...

ECS实例从经典网络迁移到专有网络

相比经典网络,专有网络(VPC)中的ECS实例更加安全并且支持更丰富的功能,例如支持绑定弹性公网IP(EIP)。本文介绍如何使用实例迁移计划功能将一台或多台ECS实例从经典网络迁移到专有网络。前提条件 迁移前,请确保经典网络中的源ECS实例...

如何处理备份失败问题

在使用 云备份 服务备份ECS、文件存储NAS、对象存储OSS或自建机房内的文件、数据库、虚拟机、或NAS等数据源时,可能会出现备份失败的问题。本文介绍备份失败处理操作指导。步骤一:判断是否有安装客户端 无需安装客户端的数据源 对于阿里云...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

源为PolarDB-X的功能规范和约束说明

出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

高可用和容灾设计

具体请参见各引擎的迁移可用区文档:RDS MySQL迁移可用区 RDS PostgreSQL迁移可用区 RDS SQL Server迁移可用区 当备实例出现故障不可用时,主实例进行实时备份,主实例备份临近完成时产生全局锁(FTWRL),导致主实例只读,一般不会...

网络架构容灾

网络是数字世界的基础设施,没有网络的联通,所有信息都无法交互,因此网络架构的设计在应用系统中至关重要,特别是针对网络架构的高可用及容灾能力的设计,是业务在异常发生时,实现快速恢复、降低业务损失的关键。云上网络规划设计 为...

配置网络

交换机所在的子网故障或子网中的IP地址已用尽,您可以在配置VPC时提供两个或者多个交换机ID,如果一个可用区出现故障,您的函数可以在其他可用区运行,提高容错能力。安全组配置错误,请您按照以下要求配置安全组。需要设置VPC中的安全组的...

iOS端

网络出现相关错误时:回调onConnectFail时,表示推流失败,建议检查推流地址是否非法、是否存在非法字符、鉴权是否有问题、是否超过最大推流并发限制、是否在禁推黑名单中等,确定推流地址合法且可用后再尝试推流。回调onReconnectError时...

常见问题

本文列举了DDoS基础防护产品相关的常见问题。我的ECS服务器被20 Mbps的流量攻击了,DDoS基础防护怎么不防护?DDoS基础防护是公共的DDoS防护服务,不对很小的流量攻击(小于100 MB)进行防护。如果云服务带宽低于系统可设置的最低清洗阈值,...

查看设备网络状态

物联网平台支持设备网络状态检测能力。通过Wi-Fi接入网络的设备可以将网络状态信息通过指定Topic上报至云端。本文介绍如何在控制台查看设备的网络信号情况。背景信息 设备上报网络状态数据的Topic、Alink数据格式和上报的错误信息,请参见 ...

容器网络FAQ

ACK容器网络数据链路 ACK容器网络数据链路(Flannel)ACK容器网络数据链路(Terway ENI)ACK容器网络数据链路(Terway ENIIP)ACK容器网络数据链路(Terway IPVLAN+Terway)ACK容器网络数据链路(Terway ENI-Trunking)ACK容器网络数据链路...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享流量包 物联网无线连接服务 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用