如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

计算层高可用

同时对于interactive模式下本身目标在于延迟敏感的分析场景,目前对于计算节点异常宕机的场景,计算引擎会通过查询级别重算,保证查询稳定性。Batch模式 对于类似ETL等数据清洗任务,这类任务计算时间长,计算资源消耗大,如果依然查询级别...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

服务介绍

升降级能力 边缘一体机处于繁忙状态时,可配置升降级策略来处理算法识别到的事件,降低边缘一体机在高压力情况下出现宕机的风险。任务感知 支持在边缘计算控制台,远程开启边缘一体机中的执行计划任务,开启执行计划任务后,可通过执行记录...

什么是边缘智能一体(执行计划版本)

升降级能力 支持一体机识别到现场AI事件超出硬件可处理的拼接时,一体机会根据用户配置的升降次策略进行处理,降低硬件在高压力情况下出现宕机的风险;任务感知 支持在云端对边缘一体机中的任务进行远程开关,同时可通过执行记录对边缘运行...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

应用场景

安全事件人工识别发现率低且不及时 解决方案:基于枢纽机场云控平台能力开发一体,实现数字化坪一体方案快速落地部署。案例效果:保障节点智能识别16+个,准确率95%。全天候飞机动线全轨迹还原,准确率95%。安全事件识别适配场景10+个...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

无法释放VPC实例的交换机资源

问题原因 导致无法释放VPC实例交换资源的原因如下:交换内存在未释放的ECS、RDS基础云资源。交换内存在未释放的传统型负载均衡CLB、自建的弹性网卡网络云资源。NAT网关的SNAT条目资源未释放。VPN网关资源未释放。交换下有关联的...

RDS SQL Server CPU使用率高问题

同时段 Sqlcompliations 的值也无明显升高,并且其绝对值也很低,因此查询编译开销也不是导致CPU升高的原因。Page_Lookups/sec 的值增高与CPU使用率的增高时间基本一致,因此较大的可能性是9:10~9:20和9:30~9:40这两个时段内有某些执行开销...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

常见问题

否则说明事务云服务已宕机或者网络已中断。分布式事务 SDK 与事务云服务网络连接正常,但是通信失败,是什么原因?TCP 连接正常,说明事务云服务启动正常。分布式事务 SDK 与事务云服务通信返回失败消息,说明 SDK 发送给事务云服务的消息...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

诊断项与诊断结果说明

检查该实例的操作系统(Guest OS)内部是否存在内核Panic、OOM异常或内部宕机等故障。此类故障可能是由于实例配置不当或用户空间的程序配置不当导致的,您可以尝试通过重启实例进行恢复。实例虚拟化异常 实例在运行中出现崩溃或出现异常...

网络带宽

带宽峰值达到10 Gbps,ecs.g8i.large实例规格提供了15 Gbps的突发带宽,可以满足带宽要求,不需要选择比ecs.g8i.large更高的规格(例如ecs.g8i.xlarge)。在突发过程中,第1分钟开始突发到10.0 Gbps,持续消耗积分,直到第21分钟时积分耗尽...

实例规格族

小规格实例网络带宽具备突发能力 实例网络性能与计算规格对应(规格越高网络性能越强)安全 支持vTPM特性,依托TPM/TCM芯片,实现从物理服务器到实例的启动链可信度量,提供超高安全能力 支持基于AMD安全加密虚拟化(Secure Encrypted ...

节点诊断

根因分析:根据采集的数据和检查项,部分问题可自动分析导致问题的原因。诊断结果 诊断结果包括根因结果与检查项。根因诊断结果部分包括 识别到的异常、异常根因 和 修复建议。检查项则按不同的类别对可能引起异常的点进行检查,覆盖根因未...

创建伸缩配置(ECS实例)

选择对应实例规格后,您可以根据实际业务需要,选择如下两项功能:打开突发性能实例无性能约束模式:仅当您选择了突发性能实例后,您可以选择使用无性能约束模式,使用该模式将允许您的应用在任何时候都可突破基线。更多信息,请参见 性能...

Pod诊断

根因分析:根据采集的数据和检查项,部分问题可自动分析导致问题的原因。诊断结果 诊断结果包括根因结果与检查项。根因诊断结果部分包括 识别到的异常、异常根因 和 修复建议。检查项则按不同的类别对可能引起异常的点进行检查,覆盖根因未...

使用限制

限制项 说明 突发带宽/QPS限流规则 根据您与阿里云签订的《CDN服务协议》,如果您对CDN服务有突发带宽/QPS使用需求(包括但不限于带宽容量压测、QPS性能压测、促销活动、重大发布等),您需要至少提前3个工作日(重大节日的突发,包括但不...

使用邮件客户端收信时出现重复收取邮件的情况

网络线路质量差或者网络信号突发异常。发信方(或收信方)的客户端软件重复发送(或接收)邮件,若是发送方使用了某些邮件监控软件(或杀毒软件)时,它们会检测到你本地配置的邮箱账号,然后会将邮箱对应的收发信服务地址拿来自己用,相当...

DescribeDedicatedHosts-查询专有宿主机详细信息

ddh.g5 LockReason string 否 专有宿主机被锁定的原因。取值范围:financial:因欠费被锁定。security:因安全原因被锁定。financial PageNumber integer 否 响应信息的页码数。默认值:1。1 PageSize integer 否 响应信息的每页行数。最大...

请问更换打包有什么问题?

问题原因 不同的打包因为打包环境的差异,打出来的apk包中资源id、汇编指令可能会存在差异,这样生成的补丁文件中的diff项可能会比真正修改的代码文件更多,导致出现改了几处代码生成了几百k补丁的问题出现。解决方案 新旧apk最好使用同...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

常见退信内容分析

是由对方邮件服务商的服务器宕机或网络互联质量不佳造成的。另外,系统对此类投递情况会自动尝试转由负责中继的万网海外邮局进行再投递,以提高投递的成功率。您可以稍后重新尝试此邮件的投递。Error in command/Syntax error 无法识别的...

创建Redis实例或变更网络类型时找不到已有的交换机

问题原因 创建Redis实例时找不到已有交换机的原因如下:您创建的交换机不属于您选择的可用区或VPC。您没有在当前账号下创建过交换机。解决方案 请根据问题原因,选择具体的解决方案:您需要创建与Redis实例在同一地域下VPC的交换机,详情请...

ECS系统事件概述

非预期运维事件 当底层宿主机出现突发软硬件故障,或者实例发生OOM、内核错误(kernel panic)等情况时,导致实例突发重启、宕机等异常。阿里云会及时发送非预期运维事件,并尽快恢复ECS资源可用性,同时通知您相应系统运维任务的执行情况...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

应用场景

​ 高可靠:在宕机、网络故障等情况下,严格保证数据一致性。节约成本:节省运维成本,避免了分布式场景下产生的数据异常。节省开发成本,像使用单机事务一样使用分布式事务。推荐搭配 ECS 和 MQ 使用。通用分布式事务管理 提供通用的分布...

Hologres SQL语句的常见问题

解决方法:提交工单排查Hologres实例宕机原因。报错:value too long for type character varying(256)问题原因:字段长度超过了VARCHAR类型的长度限制。解决方法:处理数据或将VARCHAR的长度设置得更长。报错:internal error:Write is ...

ECS实例宕机并产生“Objects remaining in kmalloc”...

如果您在ECS实例内使用memory cgroup kmem功能时内核存在 Objects remaining in kmalloc 告警日志,且实例出现宕机,则可以参考本文提供的方案解决问题。问题现象 当您在ECS实例内使用memory cgroup kmem功能时,内核有类似于如下所示的告...

语音服务使用FAQ

如果您在使用语音服务时遇到疑问,可以参考以下常见问题及处理建议。...这种情况一般是:主叫已正常呼叫被叫,如果被叫的手机端没有响应,可能是大网拦截或者运营商侧拦截、网络、信号原因导致,建议您在运营商侧核实。

堡垒无法连接ECS排查步骤

问题描述 堡垒机调用ECS失败 可能原因【可能原因一】堡垒机到ECS服务器的网路端口通信失败【可能原因二】堡垒机的相关配置影响【可能原因三】ECS 系统自身的相关策略影响 解决方案【可能原因一】堡垒机到ECS服务器的网路端口通信失败【解决...

如何解决Redis内存使用率突然升高

解决方案 请依次排查内存使用率突然升高的原因,并参考对应的解决方案解决问题。排查是否写入大量新数据 排查方法:查看 Redis 性能监控的 入流量 与 写QPS。如果入流量与写QPS的趋势与内存使用率的趋势一致,说明大量的数据写入导致内存...

ECS实例宕机并产生“VFS:Unable to mount root fs on ...

如果您的ECS实例在启动过程中循环宕机,且产生了 VFS:Unable to mount root fs on unknown-block 日志信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在启动过程中出现循环宕机,无法正常进入系统,且产生类似于如下所示的调用...

CentOS7实例随机性宕机问题

问题描述 在使用Linux实例时,如果该实例满足以下三种情况,可能导致系统宕机。使用CentOS7.5或者7.6公共镜像或者自定义镜像创建实例。内核版本为3.10.0-862或3.10.0-957。频繁执行大文件或目录操作。问题原因 CentOS7.5和7.6内核加入支持...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
运维安全中心(堡垒机) 云虚拟主机 短信服务 云数据库 Redis 版 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用