如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

运维审批

运维人员在运维页面登录设置过二次审批的主机系统会提示“运维申请已创建,等待批准”。在左侧导航栏选择 运维>运维审批>我申请的,在 我申请的 页面查看到主机的审批情况。说明 对于已批准的运维申请,对应主机会显示 登录 字样,单击...

ECS实例宕机并报错“Out of memory and no killable ...

[]call_usermodehelper_exec_async+0xfb/0x150[28663.777246][]ret_from_fork+0x39/0x50 问题原因 操作系统内核分配内存失败后,尝试通过 kill 进程来释放内存,但系统没有可被 kill 的进程,进而触发了系统的主动宕机。出现该问题的可能...

常见问题

可能原因 您创建选择的交换VSW使用了专有网络VPC的附加网段。CPFS不支持使用附加网段创建的交换。文件系统所在地域当前可用区储备已用尽,建议您更换可用区购买。解决方案 重新创建CPFS文件系统,并在选择交换或可用区,更换可用...

使用实例镜像相关问题

问题现象 CentOS 7.9 ARM系统宕机后,通过 ls/var/crash 查询dump文件,没有生成 vmcore 文件。问题原因 CentOS 7.9 ARM系统带有 CONFIG_ARM64_USER_VA_BITS_52=y 特性的内核,系统中原生自带的makedumpfile软件版本与内核版本不匹配,因此...

Alibaba Cloud Linux 2系统的ECS实例...泄漏导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-22.2.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[49.804600]RDX:...

Alibaba Cloud Linux 2系统的ECS实例...泄漏导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-22.2.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[49.804600]RDX:...

Linux系统实例的宕机问题排查

kdump查看内核日志定位 若您安装并配置了kdump,当系统发生宕机时,会生成 vmcore-dmesg.txt 文件,您可通过查看该文件获取宕机时的内核日志,并根据其中的calltrace信息(通常以"Call Trace:"开头)来定位问题的发生位置,分析宕机原因,...

诊断项与诊断结果说明

检查该实例的系统盘是否存在IO hang的情况(即磁盘内的文件系统因读写IO延迟过高导致系统不稳定或宕机)。如果出现IO hang,磁盘无法进行读写操作,建议您查看磁盘的性能指标。具体操作,请参见 查看磁盘读写指标。如果您使用的是Alibaba ...

存储资源

可能原因包含数据库服务进程异常退出、数据库节点宕机、数据库网络异常等,常见的容错策略如下:自动重启:当数据库实例异常终止或崩溃,可以设置自动重启和恢复机制,自动重新启动数据库服务,并进行必要的数据恢复操作,以确保数据库的...

Alibaba Cloud Linux 2...由于访问空指针导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:4.19.91-21.al7.x86_64及之前的内核版本。系统宕机,且出现如下调用栈信息。[7674143.032169]...

Alibaba Cloud Linux 2...由于访问空指针导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:4.19.91-21.al7.x86_64及之前的内核版本。系统宕机,且出现如下调用栈信息。[7674143.032169]...

虚拟机自定义规范创建

什么是虚拟机自定义规范 克隆虚拟机或从模板部署虚拟机,您可以自定义虚拟机的客户机操作系统。可以更改计算机名称、网络设置和许可证设置。自定义客户机操作系统可以快速设置虚拟机操作系统主机名、IP地址、子网掩码、网关等信息。您...

更新Windows系统时提示错误,如何处理?

本文介绍更新Windows系统时提示错误的原因和解决方案。提示“8024400A"和"80072EE2”错误 问题描述 更新Windows系统时提示以下信息。8024400A 80072EE2 问题原因 在更新遇到错误代码1:8024400A,错误代码2:80072EE2,这两个报错导致不...

使用双机房 ODP 实例(阿里云版)

说明 前 50 片的 leader 所在可用区 A 宕机后,OB 会将该 50 片的 leader 切换至可用区 B 此时,前 50 片的流量会调拨给 A 可用区内的应用,应用连接当前可用区 A 的 ODP(未产生跨机房),ODP 会连接主可用区在可用区 A 的 ...

云虚拟主机无法删除文件

本文介绍使用Windows操作系统的云虚拟主机,无法删除文件的可能原因和解决方案。问题现象 Windows操作系统云虚拟主机无法删除文件。可能原因 文件异常 文件权限异常 解决方案 通过主机管理控制台强制删除文件。登录 云虚拟主机管理页面。...

Alibaba Cloud Linux 2系统的ECS实例...系统宕机如何处理...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-23.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[598398.653602]BUG:...

Alibaba Cloud Linux 2系统的ECS实例...系统宕机如何处理...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-23.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[598398.653602]BUG:...

VMware虚拟机无代理迁移

0 x86_64 1 i386 2 arm64-Please choose the architecture:0 确认系统给出的操作系统类型是否是当前虚拟机的操作系统,若否输入 n,在给出的操作系统列表中输入操作系统对应的序号,例如:10。说明 VMware vCenter中创建虚拟机预设的操作...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

SAP HANA Scale-Out 部署指南

当您的 ECS 实例所宿的物理机由于底层性能出现异常,或者其他原因导致物理机宕机时宕机迁移功能通过技术检测确认机器无法恢复之后,会立刻发送短信通知 ECS 实例拥有者。迁移完成后,阿里云会再次发送迁移完成的短信,且 ECS 实例的...

使用mount命令挂载ext4文件系统

优点:数据安全性高,可以确保系统宕机后文件系统的数据不丢失。缺点:文件系统性能下降。性能要求较高 如果您非常重视性能,建议您使用 defaults、noatime、nodiratime、nobarrier、nodelalloc、data=writeback 参数挂载文件系统。sudo ...

CentOS7实例随机性宕机问题

问题描述 在使用Linux实例,如果该实例满足以下三种情况,可能导致系统宕机。使用CentOS7.5或者7.6公共镜像或者自定义镜像创建实例。内核版本为3.10.0-862或3.10.0-957。频繁执行大文件或目录操作。问题原因 CentOS7.5和7.6内核加入支持...

Alibaba Cloud Linux 2系统的ECS实例...异常导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-23.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[4017090.993301]...

Alibaba Cloud Linux 2系统的ECS实例...异常导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-23.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[4017090.993301]...

通过堡垒访问主机(Windows)

本文介绍通过堡垒访问Windows操作系统主机的具体操作步骤。前提条件 专属集群MyBase 引擎为SQL Server。专属集群MyBase 已开放OS权限,详情请参见 创建集群。已创建主机账号,详情请参见 创建主机账号。说明 如果要通过堡垒访问Linux...

云手机常见问题

云手机和真实手机有什么区别 云手机是基于阿里云ARM虚拟化技术、自研的音视频编解码以及串流技术实现的在云端运行的虚拟手机。无法像真实手机一样拨打电话,但是可以有效应用在移动测试、直播以及移动办公等场景,对传统物理手机起到了...

创建和管理交换机

当您添加IPv4类型的预留网段,该交换机的第1个和最后3个IP地址为系统保留地址。这4个保留地址不会被分配出去。例如交换机网段为192.168.1.0/24,则系统保留地址为192.168.1.0、192.168.1.253、192.168.1.254和192.168.1.255,分配的预留...

Alibaba Cloud Linux 2系统的ECS实例...异常导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:kernel-4.19.91-23.al7及之前的内核版本。系统宕机,且出现如下调用栈信息。[332.057218]watchdog...

集群容量规划

存储容量评估 存储容量评估主要考虑以下几点:副本数量:默认建议副本为0,搜索引擎基于分布式共享存储,节点宕机后,数据可以自动迁移到其它节点上提供服务,对于部分可靠性要求高的场景,可考虑设置副本数量为1。索引数据膨胀:数据一般...

用户管理

或先下载模板文件,根据文件格式填写完成后再上传到本系统。操作步骤 参照以下步骤创建用户:登录云盾堡垒Web管理页。在左侧导航栏选择 用户>用户管理。可选:(可选)手动创建用户。单击 新建用户,进入配置页。输入 用户名、密码、姓名...

压测Spring Cloud服务

背景信息 在大促活动中,应该准备多少实例资源才能满足大促吞吐量的要求,降低因大促活动带来的访问量暴增进而引发系统宕机的风险。此时需要合理地评估服务性能,避免流量冲击引发的故障,并降低运营使用成本。创建压测场景 登录 EDAS控制...

Windows操作系统云虚拟主机上的网站访问缓慢

本文主要介绍访问Windows操作系统云虚拟主机上的网站,出现网站访问缓慢问题的可能原因和解决方案。问题描述 使用Windows操作系统云虚拟主机过程中,访问该主机上的网站,出现网站访问缓慢的问题。问题原因 出现上述问题的可能原因如下...

ECS系统事件概述

如果用户未提前响应计划类运维事件,故障风险发生会导致ECS实例出现宕机或重启。是 说明 当发生计划内运维事件的实例为大数据型或本地SSD型(不包含i4p、d3c),该事件将在 本地盘实例事件 下展示。关于更多本地盘事件信息,请参见 本地...

告警规则指标说明

JVM实例数 无 是 当前实时运行的Java虚拟机实例数量,常用于服务宕机告警配置。节点机发送的字节数 无 不是 节点机通过网络连接发送的数据量,其中包括应用程序发送的数据、系统消息和错误信息等。节点机发送的报文数 无 不是 节点机通过...

什么是边缘智能一体(执行计划版本)

升降级能力 支持一体机识别到现场AI事件超出硬件可处理的拼接,一体机会根据用户配置的升降次策略进行处理,降低硬件在高压力情况下出现宕机的风险;任务感知 支持在云端对边缘一体机中的任务进行远程开关,同时可通过执行记录对边缘运行...

云上整机恢复VMware虚拟机

但如果VMware虚拟机的基础设施出现了问题,比如ESXi出现宕机,或者数据中心遭遇故障,您可以通过云备份管理控制台把已备份的VMware虚拟机整机恢复到阿里云ECS上,以保持业务的连续性及稳定性。操作步骤 按如下步骤把已备份的VMware虚拟机...

网络最大传输单元MTU

TCP-固定MSS 在TCP建立连接期间,两个主机会为连接通告自己的 最大段大小(MSS),MSS表示系统在TCP段(不包括TCP和IP标头)中接受的最大数据包长度。MSS与MTU的关系为:MSS=MTU-(IP标头+TCP标头)。因此,为了保证数据包正常通信,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云虚拟主机 云数据库 Redis 版 运维安全中心(堡垒机) 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用