如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

计算层高可用

同时对于interactive模式下本身目标在于延迟敏感的分析场景,目前对于计算节点异常宕机的场景,计算引擎会通过查询级别重算,保证查询稳定性。Batch模式 对于类似ETL等数据清洗任务,这类任务计算时间长,计算资源消耗大,如果依然查询级别...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

服务介绍

升降级能力 边缘一体机处于繁忙状态时,可配置升降级策略来处理算法识别到的事件,降低边缘一体机在高压力情况下出现宕机的风险。任务感知 支持在边缘计算控制台,远程开启边缘一体机中的执行计划任务,开启执行计划任务后,可通过执行记录...

什么是边缘智能一体(执行计划版本)

升降级能力 支持一体机识别到现场AI事件超出硬件可处理的拼接时,一体机会根据用户配置的升降次策略进行处理,降低硬件在高压力情况下出现宕机的风险;任务感知 支持在云端对边缘一体机中的任务进行远程开关,同时可通过执行记录对边缘运行...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

关闭IPVS的estimation功能

IPVS的estimation功能导致网络请求延时或抖动的原因主要有以下:一方面,随着Service数量的增加,需要统计的计算量会增加且呈现线性。同时,内核为了降低计算资源和存储资源开销,将统计数据按照CPU维度来存放,CPU数量越多,每次统计需要...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

步骤三:部署CDR网关

在配置了高可用(HA)vSphere集群上,如果CDR网关所在的Esxi宕机,网关会在同集群其他Esxi服务器上运行起来,宕机时间取决于vSphere集群的HA配置。建议您提高网关虚机重启优先级,以尽量缩短虚机启动时间。对于vSphere 6.5以上版本,您可以...

查看监控信息

内存的增长和业务指标正相关,大部分情况下,导致内存突增的SQL还未运行完成就因OOM(Out of Memory)无法追溯,因此建议:检查业务日志,判断内存突增的原因。升级内存规格,并且开启 SQL洞察和审计,在内存突增时查看SQL的执行时间来判断...

无法释放VPC实例的交换机资源

问题原因 导致无法释放VPC实例交换资源的原因如下:交换内存在未释放的ECS、RDS基础云资源。交换内存在未释放的传统型负载均衡CLB、自建的弹性网卡网络云资源。NAT网关的SNAT条目资源未释放。VPN网关资源未释放。交换下有关联的...

自动化创建Topic相关问题

例如网络抖动、服务端升级、管控平台升级维护、ECS宕机等情况,会大幅度增加创建Topic的耗时,业务的超时是固定的,必然因为超时,导致创建失败。业务冲突:自动创建Topic,容易触发不同业务名称冲突,如果触发,不同业务数据混合,很难...

自动创建Topic

例如网络抖动、服务端升级、管控平台升级维护、ECS宕机等情况,会大幅度增加创建Topic的耗时,业务的超时是固定的,必然因为超时,导致创建失败。业务冲突:自动创建Topic,容易触发不同业务名称冲突,如果触发会导致不同业务数据混合,很...

开源对比

磁盘写满直接宕机。线程池隔离 读冷数据仍可以保证写入基本正常。读冷数据直接导致线程堵塞,数据写入大量失败。分区规模 万级分区仍然可以保证稳定写入。千级分区就会出现大量抖动。巡检系统 针对死锁、宕机等问题进行自动发现和修复。无...

自动创建Topic

例如网络抖动、服务端升级、管控平台升级维护、ECS宕机等情况,会大幅度增加创建Topic的耗时,导致创建失败。业务冲突:自动创建Topic,容易触发不同业务名称冲突,如果触发会导致不同业务数据混合,很难发现问题。发现之后,恢复难度过大...

消息幂等

消息重复的可能原因如下:发送时消息重复 当一条消息已被成功发送到服务端并完成持久化,此时出现了网络闪断或者客户端宕机,导致服务端对客户端应答失败。如果此时Producer意识到消息发送失败并尝试再次发送消息,Consumer后续会收到两条...

消费幂等

消息重复的场景如下:发送时消息重复 当一条消息已被成功发送到服务端并完成持久化,此时出现了网络闪断或者客户端宕机,导致服务端对客户端应答失败。如果此时生产者意识到消息发送失败并尝试再次发送消息,消费者后续会收到两条内容相同...

消息幂等

当一条消息已被成功发送到服务端并完成持久化,此时出现了网络闪断或者客户端宕机,导致服务端对客户端应答失败。如果此时生产者意识到消息发送失败并尝试再次发送消息,消费者后续会收到两条内容相同并且 Message ID 也相同的消息。投递时...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

节点伸缩概述

Pod Disruption Budgets:可限制在同一时间因自愿干扰导致的多副本应用中发生宕机的Pod数量。节点即时弹性 支持根据Pod选择最优 装箱策略(Bin Packing)和 预绑定(PreBind)策略(自定义特性),可将调度碎片率优化30%。节点即时弹性 的...

DescribeDedicatedHosts-查询专有宿主机详细信息

ddh.g5 LockReason string 否 专有宿主机被锁定的原因。取值范围:financial:因欠费被锁定。security:因安全原因被锁定。financial PageNumber integer 否 响应信息的页码数。默认值:1。1 PageSize integer 否 响应信息的每页行数。最大...

误删除云虚拟主机的MySQL数据库

本文介绍这种情况的可能原因和解决方案。问题现象 通过数据管理DMS登录云虚拟主机的MySQL数据库,无法看到数据库的任何信息。可能原因 在本地主机的数据库客户端误删除云虚拟主机的MySQL数据库。解决方案 选择恢复云虚拟主机MySQL数据库的...

常见问题

提示“errorCode:500”错误 如果在运行 Java SDK 时提示 errorCode:500 错误,则表示由于服务发布或网络抖动原因导致的服务暂时不可用,可稍等片刻后继续请求服务。提示“errorCode:400”错误 如果在运行 Java SDK 时提示 errorCode:400 ...

请问更换打包有什么问题?

问题原因 不同的打包因为打包环境的差异,打出来的apk包中资源id、汇编指令可能会存在差异,这样生成的补丁文件中的diff项可能会比真正修改的代码文件更多,导致出现改了几处代码生成了几百k补丁的问题出现。解决方案 新旧apk最好使用同...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

常见退信内容分析

是由对方邮件服务商的服务器宕机或网络互联质量不佳造成的。另外,系统对此类投递情况会自动尝试转由负责中继的万网海外邮局进行再投递,以提高投递的成功率。您可以稍后重新尝试此邮件的投递。Error in command/Syntax error 无法识别的...

创建Redis实例或变更网络类型时找不到已有的交换机

问题原因 创建Redis实例时找不到已有交换机的原因如下:您创建的交换机不属于您选择的可用区或VPC。您没有在当前账号下创建过交换机。解决方案 请根据问题原因,选择具体的解决方案:您需要创建与Redis实例在同一地域下VPC的交换机,详情请...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

Alibaba Cloud Linux 2系统的ECS实例...泄漏导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-22.2.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[49.804600]RDX:...

Alibaba Cloud Linux 2系统的ECS实例...泄漏导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-22.2.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[49.804600]RDX:...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

Hologres SQL语句的常见问题

解决方法:提交工单排查Hologres实例宕机原因。报错:value too long for type character varying(256)问题原因:字段长度超过了VARCHAR类型的长度限制。解决方法:处理数据或将VARCHAR的长度设置得更长。报错:internal error:Write is ...

ECS实例宕机并产生“Objects remaining in kmalloc”...

如果您在ECS实例内使用memory cgroup kmem功能时内核存在 Objects remaining in kmalloc 告警日志,且实例出现宕机,则可以参考本文提供的方案解决问题。问题现象 当您在ECS实例内使用memory cgroup kmem功能时,内核有类似于如下所示的告...

堡垒无法连接ECS排查步骤

问题描述 堡垒机调用ECS失败 可能原因【可能原因一】堡垒机到ECS服务器的网路端口通信失败【可能原因二】堡垒机的相关配置影响【可能原因三】ECS 系统自身的相关策略影响 解决方案【可能原因一】堡垒机到ECS服务器的网路端口通信失败【解决...

ECS实例宕机并产生“VFS:Unable to mount root fs on ...

如果您的ECS实例在启动过程中循环宕机,且产生了 VFS:Unable to mount root fs on unknown-block 日志信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在启动过程中出现循环宕机,无法正常进入系统,且产生类似于如下所示的调用...

CentOS7实例随机性宕机问题

问题描述 在使用Linux实例时,如果该实例满足以下三种情况,可能导致系统宕机。使用CentOS7.5或者7.6公共镜像或者自定义镜像创建实例。内核版本为3.10.0-862或3.10.0-957。频繁执行大文件或目录操作。问题原因 CentOS7.5和7.6内核加入支持...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
运维安全中心(堡垒机) 云虚拟主机 短信服务 云数据库 Redis 版 云安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用