一键诊断

A:RDS MySQL的计算公式如下:线程使用率=活跃线程数/最大线程数 连接数使用率=当前连接数/实例规格最大连接数 最大线程数=thread_pool_size*(thread_pool_oversubscribe+1)Q:为什么会出现线程使用率超过100%的情况?A:按照线程使用率的...

Pod异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod故障诊断 常见问题及解决方案 常见的Pod异常状态及处理方式 Pod OOM异常...

架构

一旦现有的数据被拷贝完,工作者会进入到同步模式,主应用进程会流式传递在使用标准逻辑复制拷贝初始数据期间发生的任意改变,这会确保表被带到一种已同步的状态。一旦同步完成,该表的复制的控制权会被交回给主应用进程,其中复制会照常...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

Linux系统网络进程不存在

问题描述 Linux系统内对应的网络进程不存在,且网络配置为DHCP,则在IP地址的租约到期之后,出现无法续租导致网络中断的问题。解决方案 说明 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。...

2023年

无 缺陷修复 修复智能诊断功能统计表大小时可能会出现数字溢出的问题,现已将统计表大小的列由integer数据类型修改为bigint数据类型。修复分区表UPDATE分布键列时出现 tuple already updated by self 错误信息的问题。修复Master节点不回收...

高可用和容灾设计

具体请参见各引擎的迁移可用区文档:RDS MySQL迁移可用区 RDS PostgreSQL迁移可用区 RDS SQL Server迁移可用区 当备实例出现故障不可用时,主实例进行实时备份,主实例备份临近完成时产生全局锁(FTWRL),导致主实例只读,一般不会...

客户端进程说明

安装云安全中心客户端后,客户端在服务器中开启AliYunDun、AliYunDunMonitor等进程,以实现信息采集、威胁检测等能力。您可以通过查看进程状态,判断安全防护能力是否生效。本文提供云安全中心客户端文件和进程的详细说明。进程说明 云...

如何解决Alibaba Cloud Linux 2中polkit内存泄露问题...

问题现象 符合以下版本的Alibaba Cloud Linux 2操作系统,可能会出现polkit内存泄露,使用的内存可能会超过14 GiB。aliyun_2_1903_x64_20G_alibase_20211216.vhd之前的镜像版本。4.19.91-25.1.al7.x86_64之前的内核版本。问题原因 polkit...

技术原理

当计划的并行部分的顶层节点是 Gather Merge 而不是 Gather 时,它表示每个执行计划并行部分的进程会产生有序的元组,并且领导者执行一种保持顺序的合并。相反,Gather 会以任何方便的顺序从工作者读取元组,这会破坏可能已经存在的排序...

数据面常见问题

同城多活单元格流量切零后,企业版RocketMQ的ons.log中为什么会出现日志brokerName=msha_mock_queueBrokerName?异地多活如何查看MSHA-agent是否从HTTP流量中提取出了路由标?MSHA-agent日志在哪里?MSHA-agent日志打印目录(每个进程一个...

Windows系统内存分析工具介绍

如果已提交虚拟内存非常接近上限,那么系统会出现性能问题。Windows 2008 R2 打开任务管理器,单击 性能,通过任务管理器查看内存使用情况。还可以添加各类内存指标进行检查,打开任务管理器,依次选择 查看>选择列,添加各类内存指标,请...

Pod安全

如果攻击者能够利用应用程序中的漏洞并获得正在运行的容器的Shell访问权限,这可能会出现安全问题。您可以通过多种方式缓解此类风险。一种方式是,通过从容器镜像中删除Shell。另一种方式是,将USER指令添加到您的Dockerfile或以非root用户...

管理探针

应用高可用服务AHAS通过探针从您的系统中采集所需的信息。本文介绍了如何安装、升级、停止和卸载探针。什么是探针?应用高可用服务AHAS包括以下两种探针:应用高可用探针(即AHAS探针):这是安装在操作系统上的独立进程,用来采集架构...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后自动...

远程文件系统

警告 如果迁移过程中设备断网或断电,可能会出现迁移数据遗漏的情况,请谨慎操作。创建迁移任务 一、检查是否有迁移进程存在 输入 ps-ef|grep jar。查看是否有master.jar、worker.jar、tracker.jar 三个进程存在,如果有则执行kill-9 进程...

远程文件系统

警告 如果迁移过程中设备断网或断电,可能会出现迁移数据遗漏的情况,请谨慎操作。创建迁移任务 一、检查是否有迁移进程存在 输入 ps-ef|grep jar。查看是否有master.jar、worker.jar、tracker.jar 三个进程存在,如果有则执行kill-9 进程...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后自动...

异地双活切流

选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回 ...

SmartData常见问题

EMR-3.36.1或EMR-5.2.1之前的版本,会出现Bigboot日志占用过大的问题。当您觉得Bigboot占用日志过大时,针对已有的日志文件需要您手动删除,后续您可以参照以下步骤新增配置,将日志级别由INFO修改为WARN,以减少打印过多的日志信息。在EMR...

Pod诊断

节点出现进程Hung问题,请收集节点日志并 提交工单 处理。关于收集节点日志操作,请参见 一键采集节点的诊断日志。存在unregister_netdevice 检查内核是否出现unregister_netdevice。节点存在unregister_netdevice问题,请收集节点日志并 ...

什么应用运行时进程突然消失了?

应用运行的Java虚拟机进程Crash(异常退出)Java虚拟机通常由于异常的JNI调用、C Heap OOM、其他Bug等原因在运行时进程Crash,发生此问题时,在当前JVM进程的工作目录(通过pwdx命令可查)生成一个 hs_err_<jvm_pid>.log。通常,从这个...

Shared Server

SS开启后,后端进程会优先使用Shared模式,同时会在触发兜底机制时转换为Dedicated模式。Dedicated模式(兜底模式):由于各种原因导致后端进程被污染,退化为当前后端进程只能服务当前用户连接,用户连接退出后,后端进程也退出。用户连接...

自动或手动主备切换

A:RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

Shared Server

SS开启后,后端进程会优先使用Shared模式,同时会在触发兜底机制时转换为Dedicated模式。Dedicated模式(兜底模式):由于各种原因导致后端进程被污染,退化为当前后端进程只能服务当前用户连接,用户连接退出后,后端进程也退出。用户连接...

Windows系统的ECS实例ping外网地址提示“一般故障”...

然后重新ping外网地址,不再出现一般故障”错误时,表示该问题已解决。检查网卡配置信息 执行 ipconfig/all 或 route print 命令检查IP配置,查看路由配置是否存在问题。如果回显中显示了所有网卡信息,如下图所示,说明路由配置没有问题...

节点诊断

节点出现进程Hung问题,请收集节点日志并 提交工单 处理。关于收集节点日志操作,请参见 一键采集节点的诊断日志。存在unregister_netdevice 检查内核是否出现unregister_netdevice。节点存在unregister_netdevice问题,请收集节点日志并 ...

HDFS

警告 如果迁移过程中设备断网或断电,可能会出现迁移数据遗漏的情况,请谨慎操作。创建迁移任务 一、检查是否有迁移进程存在 输入 ps-ef|grep jar。查看是否有master.jar、worker.jar、tracker.jar 三个进程存在,如果有则执行kill-9 进程...

HDFS

警告 如果迁移过程中设备断网或断电,可能会出现迁移数据遗漏的情况,请谨慎操作。创建迁移任务 一、检查是否有迁移进程存在 输入 ps-ef|grep jar。查看是否有master.jar、worker.jar、tracker.jar 三个进程存在,如果有则执行kill-9 进程...

概述

分布式链路跟踪具备以下特点:全链追踪:能够深入应用,服务,数据库,消息,捕获性能异常,识别出现故障的组件及服务。易于使用:可以与 SOFAStack 上的应用进行无缝对接,用户的业务代码无需任何修改即可轻松接入,实现性能可视化与问题...

回切至本地VMware

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到云下VMware环境中。前提条件 已部署CDR网关。更多信息,请参见 步骤三:部署CDR网关。已在被保护的Windows服务器上安装阿里云复制...

诊断指标与诊断结果条目说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断指标,并提供了详细的诊断范围及建议操作供您参考。基本...

WAF连接源站服务器超时

原因四:公网链路质量问题 测试其他ISP运营商的客户端是否有相同问题,如果仅仅是某个固定运营商网络的客户端访问有问题一般是运营商封堵导致。解决方案:抓包确认是否有封堵行为,如果有,请联系运营商解决该问题。适用范围 Web应用防火...

云解析DNS如何实现故障切换

全局流量管理支持IP地址健康检查功能,并根据健康检查的结果,来判断运营商IP地址是否出现故障,如果出现故障,则将域名解析切换到备份的运营商IP上,并最终帮用户实现自动故障转移的功效。请参阅 GTM实现跨网访问加速与故障切换 操作...

ossfs异常问题排查

o allow_other 赋予计算机上其他用户访问挂载目录的权限,避免前台挂载ossfs时,出现新的挂载点路径权限问题。o curldbg 打开libcurl的日志信息,用于排查OSS服务端返回的错误。步骤3:分析Debug日志 以前台方式运行ossfs后,日志将输出到...

什么是云拨测

实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,主动发送告警通知,快速响应并处理问题。数据可视化:通过直观的数据展示和报表,您可以轻松了解网络状况、性能以及故障分析。应用场景 网络性能监控:云拨测可以帮助企业和...

Beam使用

Auto Optimize是后台的数据优化进程自动对您的Beam表进行过期数据回收,小文件合并和数据按照排序键聚集操作,从而保障查询性能。一般情况下,该操作都会由后台进程自动完成,您也可以通过 OPTIMIZE beam_example;命令手动触发Optimize...

在ECS实例内访问网站提示“Nginx 502 bad gateway”...

本文介绍在ECS实例上使用浏览器访问网站时,提示“Nginx 502 Bad Gateway”错误的问题原因和解决方案。问题原因“Nginx 502 Bad Gateway”错误表示访问请求的php-cgi进程已经开始执行,但是由于读取资源失败等原因没有执行完毕,导致...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
负载均衡 商标服务 Web应用防火墙 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用