高可用和容灾设计

具体请参见各引擎的迁移可用区文档:RDS MySQL迁移可用区 RDS PostgreSQL迁移可用区 RDS SQL Server迁移可用区 当备实例出现故障不可用时,主实例进行实时备份,主实例备份临近完成时产生全局锁(FTWRL),导致主实例只读,一般不会...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后自动...

常见问题

本文列举了MaxCompute的用户经常咨询和关注的一些问题,帮助您快速了解MaxCompute。MaxCompute的用户经常咨询和关注的一些问题如下:使用MaxCompute需要具备什么专业技能?如何理解开源与云原生的大数据技术与产品?MaxCompute作为大数据...

错误编码:HSF-0019

报错信息 白名单规则配置出错。[WhiteListRuleParser Component]Invalid rule:${ruleContent}[WhiteListRuleParser Component]Parsing ...如果出现 报错信息,请检查配置的规则格式是否正确,或查看报错信息中的其他信息定位并解决问题

集群管理FAQ

当Kubernetes集群出现问题或者节点异常时,您可通过容器服务ACK提供的一键故障诊断功能,辅助您定位集群中出现问题,详情请参见 使用集群诊断。如果集群诊断功能无法满足需求,您需要分别在Master节点和异常的Worker节点上收集Kubernetes...

Windows系统的ECS实例ping外网地址提示“一般故障”...

然后重新ping外网地址,不再出现一般故障”错误时,表示该问题已解决。检查网卡配置信息 执行 ipconfig/all 或 route print 命令检查IP配置,查看路由配置是否存在问题。如果回显中显示了所有网卡信息,如下图所示,说明路由配置没有问题...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

自动或手动主备切换

A:RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

异地双活切流

选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回 ...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

云解析DNS如何实现故障切换

全局流量管理支持IP地址健康检查功能,并根据健康检查的结果,来判断运营商IP地址是否出现故障,如果出现故障,则将域名解析切换到备份的运营商IP上,并最终帮用户实现自动故障转移的功效。请参阅 GTM实现跨网访问加速与故障切换 操作...

诊断应用卡顿问题

排查、解决网站卡顿、页面加载过慢等问题过程复杂,耗时较长,原因如下:应用链路太长 从前端页面到后台网关,从Web应用服务器到后台数据库,任何一个环节出现故障都有可能导致整体卡顿。采用微服务架构的应用,链路更加复杂,而且不同组件...

故障协同处理(基于钉钉)

本文主要介绍什么故障协同处理。云钉运维故障协同效果 功能概述 移动应用端(目前仅支持“钉钉”,以下功能说明均基于钉钉场景)支持接收故障消息提示和进行故障操作,且支持移动端操作管理故障,操作记录实时同步到 运维事件中心 控制台...

畅捷通

日志服务帮助畅捷通运维开发团队解决了误报频繁、无法快速发现问题站点、无法快速定位异常的问题,实现了运维效率、运维成本、沟通成本等方面的改善。日志服务支撑了畅捷通所有云产品的健康稳定运行,在IT运维开发领域树立了一个标杆。公司...

查询日志

通过阿里云Logstash的日志功能,您可以输入关键字和设置时间范围,锁定需要查询的日志内容,快速定位集群问题,辅助集群运维。本文为您介绍如何查询日志以及常见日志的使用说明。操作步骤 登录 阿里云Elasticsearch控制台。进入目标实例。...

步骤五:应用容灾

故障恢复 本机出现故障后在云上拉起本地业务,待本地环境恢复后再将其恢复到本地。具体步骤如下:在 主站点管理 页签,单击+添加。在 添加计算平台 页面,填写计算平台 名称,选择 类型,填写 IP地址、用户名 和 密码。单击 创建。在连续...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

常见问题

本文汇总了Hive使用时的常见问题。说明 对于Hive作业报错或其他异常问题请参见 Hive作业异常排查及处理。对于Hive Metastore和HiveServer等服务相关的异常请参见 Hive服务异常排查及处理。作业长时间处于等待状态,如何处理?Map端是否读取...

iOS 符号表管理

移动分析支持通过符号表对 iOS App 的闪退日志进行反向解析,以便定位 App 中的问题代码,帮助提高排查、解决线上异常问题的效率,同时提供 iOS 符号表管理功能以便导入、查询符号表并进行符号表反解测试。什么是符号表 符号表是内存地址与...

错误码

说明:PolarDB-X 向后端数据节点异步创建连接时,如果在短时间创建大量连接,或者数据节点建立连接速度太慢,会出现等待超时。该问题通常是由于后端数据节点压力过大或异常导致的,建议使用 PolarDB-X 读写分离,或者升级更高规格,减轻后...

常见问题

本文为您整合了使用Proxima CE过程中的常见问题。Proxima CE用的是哪里的资源?用户所在MaxCompute Project下的资源。输入表中的vector可以直接使用MaxCompute的Binary类型吗?目前不支持,Proxima CE当前版本构建索引的处理方法是将doc表...

等待资源

什么会出现等待资源?为什么任务一直在等待gateway调度资源?为什么数据集成任务一直显示wait?为什么会出现等待资源?问题现象 调度将任务下发到对应执行引擎上,此过程可能会出现以下等待资源问题:等待调度资源组。数据集成任务等待...

常见问题

无法访问/访问异常 CDN回源时网站出现5xx报错的排查方法 使用CDN加速后网站无法访问 地域节点获取CDN节点文件异常或访问域名失败 使用CDN加速后访问URL时出现空白页面 定位访问异常是CDN节点问题还是源站问题 开通海外节点后没有提高海外...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

售后问题排查工具

当您在使用CDN过程中遇到任何问题,您可以尝试使用阿里云提供的智能在线系统,帮您快速定位问题并解决。典型场景 网站无法访问:域名通过CDN产品加速之后出现网站无法访问的情况,导致这一结果的情况有很多,您可以通过智能在线自动识别...

自动或手动主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

概述

说明 主备实例切换耗时约 5 分钟,切换过程中,可能会出现链接闪断。建议在业务低谷期执行主备切换,同时建议使用链接池等技术手段确保业务具备自动重连机制。主备实例操作列表 您可以根据业务需要创建备实例,并可对主备实例分别进行以下...

自动SQL限流

除了上述的问题,在现实生活中可能还会出现各种特殊情况,比如值班人员联系不上、工作人员身边没有电脑、信息太多分析难度大、压力大紧张操作失误等。因此需要尽可能的把异常发现、异常SQL定位、SQL限流、跟踪/回滚的整体流程自动化处理。...

PolarDB MySQL版CPU使用率高

此类问题一般可以通过开启集群的thread_pool特性进行流控缓解,具体请参见 Thread Pool。如果活跃线程有所缓解,同时还要注意应用侧是否已经产生了业务堆积,如果CPU负载较高同时活跃线程依然高居不下,此时则同样要考虑是不是对集群进行扩...

使用SysOM定位容器内存问题

为解决因容器引擎层的不透明性而导致的故障排查困难问题,阿里云 容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)团队推出操作系统内核层的容器监控可观测能力,为您提供更可靠、透明的容器引擎层,助力您更顺利地进行...

Alibaba Cloud Linux 2系统中systemd服务异常问题说明

如果您的Alibaba Cloud Linux 2操作系统中systemd服务运行异常,可参考文本提供的方案解决问题问题现象 在符合以下条件的Alibaba Cloud Linux 2实例中,系统在正常运行时实例内部署的业务有概率启动失败。镜像:Alibaba Cloud Linux 2....

常见问题

本文汇总了Flume使用时的常见问题。Hive日志数量少于实际日志数量?终止Flume进程时出现DeadLock报错,如何处理?如何处理强制退出后,FileChannel偶发性异常?Hive日志数量少于实际日志数量?问题现象:通过Flume将日志写入Hive,发现Hive...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

管理主备切换

背景信息 自动切换:实例默认开启自动切换,当主实例出现故障无法访问时,自动切换到备实例。主备切换的触发时机,请参见 主备切换原因。手动切换:即使自动切换是开启状态,您也可以手动进行主备切换。手动切换可用于容灾演练或多可用区...

主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

常见问题以及改进措施

其它问题 本文只列举了几类常见的查询计划问题,例如全表扫描时出现无过滤条件的大表、可以下推的过滤条件没有下沉到存储等复杂计划和性能问题等,需要 AnalyticDB MySQL版 专家服务小组来协助定位排查。改进执行计划 收集统计信息 ...

远程连接FAQ

检查是否为海外服务器 中国内地访问其他国家和地区地域下的轻量应用服务器,可能会出现较大延迟和丢包,造成无法访问服务器的问题。该问题受国际运营商的影响,无法在服务器中修复。更多信息,请参见 远程连接非中国内地服务器时,提示连接...

Windows系统内存分析工具介绍

如果已提交虚拟内存非常接近上限,那么系统会出现性能问题。Windows 2008 R2 打开任务管理器,单击 性能,通过任务管理器查看内存使用情况。还可以添加各类内存指标进行检查,打开任务管理器,依次选择 查看>选择列,添加各类内存指标,请...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 Web应用防火墙 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用