如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Alibaba Cloud Linux 2系统的ECS实例...异常导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:kernel-4.19.91-23.al7及之前的内核版本。系统宕机,且出现如下调用栈信息。[332.057218]watchdog...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

ECS实例宕机并报错“Out of memory and no killable ...

[]call_usermodehelper_exec_async+0xfb/0x150[28663.777246][]ret_from_fork+0x39/0x50 问题原因 操作系统内核分配内存失败后,尝试通过 kill 进程来释放内存,但系统没有可被 kill 的进程,进而触发了系统的主动宕机。出现该问题的可能...

压测Spring Cloud服务

背景信息 在大促活动中,应该准备多少实例资源才能满足大促吞吐量的要求,降低因大促活动带来的访问量暴增进而引发系统宕机的风险。此时需要合理地评估服务性能,避免流量冲击引发的故障,并降低运营使用成本。创建压测场景 登录 EDAS控制...

压测Dubbo服务

背景信息 在大促活动中,应该准备多少实例资源才能满足大促吞吐量的要求,降低因大促活动带来的访问量暴增进而引发系统宕机的风险。此时需要合理地评估服务性能,避免流量冲击引发的故障,并降低运营使用成本。创建压测场景 登录 EDAS控制...

【组件升级】NPD升级公告

背景信息 低于v1.2.8版本的ack-node-problem-detector组件会默认开启文件系统句柄巡检项(check_fd),check_fd的进程在读取大内核数据时,会触发部分操作系统内核版本缺陷,可能会造成僵尸进程堆积、甚至宕机的风险。升级组件 为避免低...

使用实例时镜像相关问题

解决方案 重要 该方案仅适用于已正确 开启kdump服务 的系统。如果您没有开启kdump服务且按照本文操作修复问题,请在 proc/cmdline 文件中手动配置 crashkernel 参数。运行以下命令,下载相应的kexec-tools包。wget ...

常见退信内容分析

是由对方邮件服务商的服务器宕机或网络互联质量不佳造成的。另外,系统对此类投递情况会自动尝试转由负责中继的万网海外邮局进行再投递,以提高投递的成功率。您可以稍后重新尝试此邮件的投递。Error in command/Syntax error 无法识别的...

网络配置

建议您选择与所需接入堡垒机系统进行运维的ECS服务器相同的网络类型:如果ECS服务器都处于专有网络环境,堡垒实例的网络应选择 专有网络(VPC)。如果ECS服务器都处于经典网络环境,堡垒实例的网络应选择 经典网络。如果需要接入ECS...

ECS实例的服务进程自动关闭,如何排查?

问题原因 服务进程关闭一般有如下几种原因系统原因。程序本身异常退出。系统中毒。操作步骤 您可以参考以下操作步骤排查问题。检查以下可能导致服务进程关闭的系统原因。ECS的云盘空间被占满。解决方法请参见 解决Linux实例磁盘空间满...

存储资源

可能原因包含数据库服务进程异常退出、数据库节点宕机、数据库网络异常等,常见的容错策略如下:自动重启:当数据库实例异常终止或崩溃时,可以设置自动重启和恢复机制,自动重新启动数据库服务,并进行必要的数据恢复操作,以确保数据库的...

SAP HANA Scale-Out 部署指南

SAP HANA Scale-Out 部署指南 概述 架构总览 资源规划 前期准备 阿里云账号 VPC ECS实例 ECS Metrics Collector的安装 文件存储NAS ECS宕机迁移 HANA安装 维护主机名 创建文件系统 准备OS以及安装包 安装SAP HANA 验证集群安装 版本管理 ...

修改主机的服务端口

批量修改主机的服务端口 如果多个主机的同一协议使用的是相同的端口号,您可以通过以下步骤批量修改主机的服务端口:登录堡垒机系统,具体操作请参见 登录堡垒机系统。在左侧导航栏单击 资产管理>主机。在 主机 页面,选中需要批量修改服务...

主机管理

选择要导入堡垒机的ECS实例,并单击 导入。同步阿里云ECS,操作步骤如下:在主机列表右上方,选择 更多操作>导入主机。在 导入主机 页,单击 下载模板文件,将文件下载至本地并解压缩。编辑并保存主机表格。说明 第一列为主机IP(必填)、...

ECS资源复用版

为避免因作业占满资源导致实例异常甚至宕机,MaxCompute在ECS实例上部署服务时会为操作系统以及组件预留一定资源。使用说明 开通MaxCompute-ECS资源复用版。登录 阿里云MaxCompute按量付费开通页面。商品类型 选择 按量付费,规格类型 选择...

SFTP协议运维

输入堡垒机的运维地址、端口号(60022)和用户名,单击 OK。选择新建的堡垒机,单击 Connect。输入RAM用户名和密码,单击 OK。可选:如果RAM用户开启了MFA二次验证,需要输入从已绑定的MFA设备(即阿里云App)中获取的安全码,单击 OK。...

如何在Alibaba Cloud Linux 2系统中配置Kdump

开启Kdump时会占用一部分操作系统内存空间,对应的用户态系统服务kdump.service可能会影响系统启动速度。鉴于此,在Alibaba Cloud Linux 2系统中,Kdump服务不是默认全部开启的,用户需要根据业务实际需求,进行相应的配置。本文重点介绍在...

开通免费试用

堡垒提供7天免费试用服务。本文介绍如何开通堡垒免费试用。活动对象 免费试用服务仅针对持有阿里云账号的首购用户购买的第一个堡垒实例生效,且阿里云账号需已通过实名认证。说明 首购用户是指首次购买阿里云堡垒机服务的用户。如果...

开通免费试用

堡垒提供7天免费试用服务。本文介绍如何开通堡垒免费试用。活动对象 免费试用服务仅针对持有阿里云账号的首购用户购买的第一个堡垒实例生效,且阿里云账号需已通过实名认证。说明 首购用户是指首次购买阿里云堡垒机服务的用户。如果...

什么是多活容灾

系统服务的紧迫性要求越高,RTO的值越小。RPO针对的是数据丢失,而RTO针对的是服务丢失,RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定。好的容灾系统需要尽量满足用户的需求,但是容灾系统的设计往往受多种...

使用操作系统Alibaba Cloud Linux 3

同时,Alibaba Cloud Linux结合阿里云基础设施进行了深度优化,为您提供企业级的支持和维护,提升操作系统服务的使用体验。在继承Alibaba Cloud Linux 2且兼容 容器服务 Kubernetes 版 的同时,Alibaba Cloud Linux 3还进行了大量优化,...

堡垒管理员角色授权

详细说明如下:管理员权限可以进行堡垒实例、用户及资产管理,以及控制策略设置、系统设置、查看审计信息等操作。重要 如果作为管理员角色的RAM用户需要导入阿里云资产或RAM用户,则至少需要给管理员授予对应资产或访问控制(RAM)的只读...

授权访问云资源

堡垒机服务关联角色介绍 通过堡垒进行运维时,堡垒需要访问云服务器ECS和专有网络VPC等云服务的资源,您可通过系统自动创建的堡垒机服务关联角色AliyunServiceRoleForBastionhost获取访问权限。以下是堡垒机服务关联角色的介绍:角色...

用户管理

或先下载模板文件,根据文件格式填写完成后再上传到本系统。操作步骤 参照以下步骤创建用户:登录云盾堡垒Web管理页。在左侧导航栏选择 用户>用户管理。可选:(可选)手动创建用户。单击 新建用户,进入配置页。输入 用户名、密码、姓名...

功能特性

ACK微服务应用接入MSE治理中心 ECS微服务应用接入MSE治理中心 开源K8s环境中的应用接入MSE治理中心 服务契约 服务查询 查询已接入的Spring Cloud或Dubbo应用的服务。查询服务 服务契约展示 展示某服务服务契约。查询服务契约 应用治理 ...

客户端远程连接工具及版本说明

本文介绍使用Windows或Mac系统中的客户端连接堡垒运维资产时,堡垒兼容的客户端远程连接工具及版本说明。重要 为确保堡垒机系统的稳定性和安全性,请您使用本文推荐的客户端工具连接堡垒,以防连接失败或对系统稳定性造成影响,且...

网络智能服务如何与RAM协同工作

网络智能服务的系统策略,请参见 网络智能服务系统权限策略参考。自定义策略:如果系统策略不能满足您的要求,您可以创建自定义策略实现精细化的权限管理。如何创建自定义策略,请参见 网络智能服务自定义权限策略参考。为RAM主体绑定权限...

告警规则指标说明

JVM实例数 无 是 当前实时运行的Java虚拟机实例数量,常用于服务宕机告警配置。节点机发送的字节数 无 不是 节点机通过网络连接发送的数据量,其中包括应用程序发送的数据、系统消息和错误信息等。节点机发送的报文数 无 不是 节点机通过...

阿里云文件存储NAS挂载使用

VMware服务的主机不但可以提供计算、网络资源,还提供存储资源。通过VMware vSAN统一管理主机的NVME SSD,提供全闪的分布式存储。当VMware服务实例的存储资源不足时,可以通过如下两种方式为SDDC增加存储空间:VMware服务实例增加主机节点...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

堡垒无法连接ECS排查步骤

问题描述 堡垒机调用ECS失败 可能原因【可能原因一】堡垒机到ECS服务器的网路端口通信失败【可能原因二】堡垒机的相关配置影响【可能原因三】ECS 系统自身的相关策略影响 解决方案【可能原因一】堡垒机到ECS服务器的网路端口通信失败【解决...

客户端无法连接堡垒机的常见场景及解决方法

概述 在使用堡垒机的过程中,可能会出现配置完成后,客户端无法正常连接堡垒机的场景。本文主要介绍无法连接堡垒机的常见场景及解决方法。详细信息 以下为无法连接堡垒机的常见场景及解决方法,请根据现场情况选择以下对应的步骤。问题现象...

诊断项与诊断结果说明

检查该实例的系统盘是否存在IO hang的情况(即磁盘内的文件系统因读写IO延迟过高导致系统不稳定或宕机)。如果出现IO hang,磁盘无法进行读写操作,建议您查看磁盘的性能指标。具体操作,请参见 查看磁盘读写指标。如果您使用的是Alibaba ...

诊断项与诊断结果说明

检查该实例的系统盘是否存在IO hang的情况(即磁盘内的文件系统因读写IO延迟过高导致系统不稳定或宕机)。如果出现IO hang,云盘无法进行读写操作。建议您查看云盘的性能指标,具体操作,请参见 查看云盘监控信息。如果您使用的是Alibaba ...

常见问题

可能原因 您创建时选择的交换VSW使用了专有网络VPC的附加网段。CPFS不支持使用附加网段创建的交换。文件系统所在地域当前可用区储备已用尽,建议您更换可用区购买。解决方案 重新创建CPFS文件系统,并在选择交换或可用区时,更换可用...

可观测监控 Prometheus 版服务专家版协议

此外,您自行升级操作系统可能会造成宕机等不良影响,请自行把握风险并谨慎操作。您了解阿里云无法保证其所提供的服务毫无瑕疵(如阿里云安全产品并不能保证您的硬件或软件的绝对安全),但阿里云承诺不断提升服务质量及服务水平。所以您...

可观测监控 Prometheus 版服务试用条款

此外,您自行升级操作系统可能会造成宕机等不良影响,请把握风险并谨慎操作。您了解阿里云无法保证其所提供的服务毫无瑕疵(如阿里云安全产品并不能保证您的硬件或软件的绝对安全),但阿里云承诺不断提升服务质量及服务水平。所以您同意:...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 物联网无线连接服务 商标服务 云服务器 ECS 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用