常见问题

无法访问/访问异常 CDN回源时网站出现5xx报错的排查方法 使用CDN加速后网站无法访问 地域节点获取CDN节点文件异常或访问域名失败 使用CDN加速后访问URL时出现空白页面 定位访问异常是CDN节点问题还是源站问题 开通海外节点后没有提高海外...

单实例快速恢复

出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

ES节点连接报错|ES集群状态异常

问题描述 同VPC下的客户端连接ES服务报错No alive nodes found in your cluster 问题原因 1、集群读写QPS较大,各个节点负载较高,load的指标已经超过了当前集群规格的负载能力,导致集群异常无法连接。2、集群可以正常连接,但是查询或者...

托管节点池节点自动恢复

当恢复任务完成后,故障状态依然存在,节点被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池之间的节点自动恢复可以并行执行。如果一个节点池存在多个异常节点,自动恢复以串行的方式逐个恢复。一旦某个节点恢复失败,ACK将...

高级配置

使用Supervisor启动ossfs Supervisor是用Python开发的一套通用的进程管理程序,能将一个普通的命令行进程变为后台daemon,并监控进程状态。异常退出时能自动重启。使用Supervisor启动ossfs的步骤如下:重要 以下操作步骤中的文件安装路径以...

WAF连接源站服务器超时

原因四:公网链路质量问题 测试其他ISP运营商的客户端是否有相同问题,如果仅仅是某个固定运营商网络的客户端访问有问题一般是运营商封堵导致。解决方案:抓包确认是否有封堵行为,如果有,请联系运营商解决该问题。适用范围 Web应用防火...

断路器插件(仅专享实例)

1.断路器概述 断路器是API网关在后端出现性能问题时保护系统的内置机制,默认配置下,当某个API的后端在30秒钟内出现1000次超时,系统触发断路器保护,断路器进入打开状态,断路时间为90秒,90秒内所有的请求均快速返回Status=503,X-Ca-...

进程监控

云监控采集CPU消耗Top5进程的CPU使用率,可能存在以下问题:如果您的进程占用多个CPU,则会出现CPU使用率超过100%的情况,因为采集结果为多核CPU的总使用率。如果您查询的时间范围内,CPU消耗Top5的进程不固定,进程列表会显示该时间范围内...

连接数管理

\N:状态为空,表示非用户连接的进程一般属于系统后台的维护进程,可以忽略。backend_xid Hologres后端的顶层事务标识符。backend_xmin 当前后端的xmin范围。query 后端最近执行的查询。如果 state 为 active,将显示当前正在执行的查询...

在使用阿里云服务的过程中我应该避免哪些操作?

否则,阿里云可能无法解决由以下违规操作引起的问题:1)Windows系统中的PV Drivers 程序不可删除 PV Drivers程序为服务器虚拟化驱动程序,请不要针对该程序进行任何操作,如果删除导致服务器出现异常。2)云服务器禁止更改网卡的MAC地址 ...

实例的节点故障处理机制

本文档介绍云数据库MongoDB版实例的节点故障处理机制。...当使用Connection String URI进行连接时,如果某个Mongos节点出现故障,客户端能自动进行故障切换,将请求分散到状态正常的Mongos节点上,详情请参见 分片集群实例连接说明。

应用视图

应用视图页面是通过采集主机进程与网络数据,来展示主机部署应用的拓扑架构。您可以通过筛选进程类型,查看进程的拓扑图和详细信息。本文介绍如何在应用视图中查看进程。操作步骤 登录 AHAS控制台,在左侧导航栏选择 故障演练>架构感知。在...

Windows系统内存分析工具介绍

如果已提交虚拟内存非常接近上限,那么系统会出现性能问题。Windows 2008 R2 打开任务管理器,单击 性能,通过任务管理器查看内存使用情况。还可以添加各类内存指标进行检查,打开任务管理器,依次选择 查看>选择列,添加各类内存指标,请...

问题汇总

等待资源 为什么会出现等待资源?为什么任务一直在等待gateway调度资源?为什么数据集成任务一直显示wait?为什么会空跑 什么是空跑?为什么会空跑?场景一:周月实例空跑周期 场景二:实时生成的过期实例 场景三:设置成功实例 场景四:...

I-V曲线诊断

被遮挡的组件会出现热点效应(HotSpot),成为整个阵列的负载,从而在局部产生高温,导致组件烧毁损坏,进而产生严重安全隐患。会导致阵列的不均匀老化。组件老化过快,会影响整个阵列的性能和寿命。光伏阵列电阻老化 太阳能电池片存在着...

灾备方案

Proxy实时探测只读节点的状态,当出现下述情况时,Proxy执行流量管控动作:只读节点处于异常状态:Proxy降低该节点的服务权重,如果多次无法连接该节点,Proxy停止该节点的服务(即不再将流量转发至该节点),待该异常被修复后重新...

使用负载均衡SLB后出现500、502和504状态

客户端IP地址被运营商拦截 测试其他ISP运营商的客户端是否有此问题,如果仅仅是某个固定运营商网络的客户端访问有问题一般是该运营商拦截导致。可以抓包查看是否被运营商拦截或提交工单联系阿里云技术支持排查。如果被运营商拦截,则需要...

Pod异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod故障诊断 常见问题及解决方案 常见的Pod异常状态及处理方式 Pod OOM异常...

DescribeDBInstanceDiagnosisSummary-查看节点详情

No sync required:无需同步,仅协调节点会出现该模式。Synced NodeCID string 分组 ID。1 MasterStatusInfo object 协调节点状态统计信息。NormalNodeNum integer 正常状态节点数量。2 ExceptionNodeNum integer 异常状态节点数量。0 ...

灾备方案介绍

Proxy实时探测只读节点的状态,当出现下述情况时,Proxy执行流量管控动作:只读节点处于异常状态:Proxy降低该节点的服务权重,如果多次无法连接该节点,Proxy停止该节点的服务(即不再将流量转发至该节点),待该异常被修复后重新...

存储异常问题排查

本文介绍关于存储相关异常问题诊断流程和排查思路。诊断流程 执行以下命令,查看Pod事件,确认Pod无法启动是由存储问题导致。kubectl describe pods若查看Pod处于下图所示的状态,说明Pod使用的存储都已成功挂载到Pod上。此时Pod没启动...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

存储异常问题排查

本文介绍关于存储相关异常问题诊断流程和排查思路。诊断流程 执行以下命令,查看Pod事件,确认Pod无法启动是由存储问题导致。kubectl describe pods若查看Pod处于下图所示的状态,说明Pod使用的存储都已成功挂载到Pod上。此时Pod没启动...

自动或手动主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

查看变更记录

当您在SAE上进行应用部署、启动、扩容/缩容等生命周期操作后,可以跳转到应用详情页查看当前变更状态,也可以通过变更记录页面查看该应用的历史变更记录。操作指南 登录 SAE控制台。在左侧导航栏,选择 应用管理>应用列表,在顶部菜单栏...

工作负载推荐配置

甚至更新应用,发布一个新版本的时候,也会出现这种情况。在Kubernetes里,尽量避免直接使用Pod,尽可能使用Deployment/StatefulSet,并且让应用的Pod在两个以上。相关文档 ACK可实现应用灰度发布、蓝绿发布等,请参见 应用部署。关于应用...

Pod异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod故障诊断 常见问题及解决方案 常见的Pod异常状态及处理方式 Pod OOM异常...

如何制定科学有效的需求流程规范

问题3:需求质量差,经常返工造成延期 需求质量差也是需求流程当中一个经常被提到的问题,质量问题一般包括以下几个方面:需求表述不清 需求遗漏 逻辑存在漏洞或者冲突 在需求进入开发阶段以后,一旦发现需求的质量问题,就造成开发和...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

Windows系统的ECS实例ping外网地址提示“一般故障”...

然后重新ping外网地址,不再出现一般故障”错误时,表示该问题已解决。检查网卡配置信息 执行 ipconfig/all 或 route print 命令检查IP配置,查看路由配置是否存在问题。如果回显中显示了所有网卡信息,如下图所示,说明路由配置没有问题...

主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

管理主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

升级Nginx Ingress Controller组件

升级兼容性说明 在组件的开发和维护过程中,Nginx Ingress Controller组件的新版本可能引入新的功能、改进现有功能或者修复安全问题,但同时也可能因为内部架构的调整、依赖库的变化等原因,导致与之前版本存在兼容性差异。关于Nginx ...

在Linux系统内启动某个服务时提示task:Cannot ...

问题现象 在ECS实例中启动某个服务进程时,系统提示 task:Cannot allocate memory 错误,如下图所示。可能原因 可能是系统进程数超限导致。Linux内核通过内核配置参数 kernel.pid_max 限制进程的数量,当运行的服务的总进程数超出 kernel....

如何解决备份客户端OOM问题

背景信息 使用 云备份 备份数据时,在极端大数据量以及系统资源不足的备份场景,备份客户端会占用较多的系统资源,可能会出现OOM问题,即备份进程触发OOM被系统终止而导致备份失败。重要 当遇到OOM问题时,您可以根据实际情况为备份客户端...

响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

重置ECS实例密码后实例状态显示为停止中

控制台是通过API接口进行操作,系统完全启动后,触发控制台主机状态的变化,控制台显示主机状态从运行中、停止中、启动中,整个状态变化过程一般在10~15分钟。如果状态一直为停止中且时间超过10分钟,您可以 提交工单,联系阿里云技术...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

如何检查云备份客户端运行状态

备份客户端运行状态异常导致备份失败或客户端升级失败。本文介绍如何检查备份客户端运行状态。客户端诊断工具 云备份客户端问题诊断工具 错误处理相关文档 如何处理备份失败问题 排查和处理文件备份客户端状态异常 如何查看云备份客户端...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
负载均衡 商标服务 Web应用防火墙 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用