如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

计算层高可用

同时对于interactive模式下本身目标在于延迟敏感的分析场景,目前对于计算节点异常宕机的场景,计算引擎会通过查询级别重算,保证查询稳定性。Batch模式 对于类似ETL等数据清洗任务,这类任务计算时间长,计算资源消耗大,如果依然查询级别...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

服务介绍

升降级能力 边缘一体机处于繁忙状态时,可配置升降级策略来处理算法识别到的事件,降低边缘一体机在高压力情况下出现宕机的风险。任务感知 支持在边缘计算控制台,远程开启边缘一体机中的执行计划任务,开启执行计划任务后,可通过执行记录...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

内网监控

说明 需要监控VPC内ECS本地进程是否响应正常时,可在探测源中选中所有需要监控的ECS,在探测目标中填写 localhost:port/path 格式的地址,进行本地探测。当您需要监控VPC内SLB是否正常响应时,可选择与SLB在同一VPC网络内的ECS实例作为探测...

接入阿里云ECS自建数据库实例

无法连接:可能是网络不通、实例宕机原因。认证失败:用户名或者密码错误。权限不足:可以正常连接实例,但是权限不足,请查看 权限说明。单击 完成。集中模式接入 登录 DAS控制台。在控制台首页的 热荐功能 区域单击 快速实例接入。单击...

可用性与可靠性

异常自动节点切换与宕机自恢复 AnalyticDB PostgreSQL版 会实时不断地探测实例节点的健康状态,如果出现主计算节点异常,则会使用热备节点替换异常节点,保证实例的可用性。并且对于异常节点,AnalyticDB PostgreSQL版 会根据不同的异常...

无法释放VPC实例的交换机资源

问题原因 导致无法释放VPC实例交换资源的原因如下:交换内存在未释放的ECS、RDS基础云资源。交换内存在未释放的传统型负载均衡CLB、自建的弹性网卡网络云资源。NAT网关的SNAT条目资源未释放。VPN网关资源未释放。交换下有关联的...

接入其他自建或其他云厂商数据库实例

无法连接:可能是网络不通、实例宕机原因。认证失败:用户名或者密码错误。权限不足:可以正常连接实例,但是权限不足,请查看 权限说明。单击 完成。主机模式接入 登录 DAS控制台。DAS控制台首页的 热荐功能 区域单击 快速实例接入。...

日志信息

可以判断当前异常具体的错误原因,常见错误码信息:协议 状态码 含义 HTTP 610 超时(连接超时、SSL证书交换超时,超时时间为30s)HTTP 613 DNS解析错误 HTTP 615 内容不匹配 HTTP 616 认证失败 HTTP 611 其他原因导致的探测失败 ...

告警日志

常见错误码信息:协议 状态码 含义 HTTP 610 超时(连接超时、SSL证书交换超时,超时时间为30s)613 DNS解析错误 615 内容不匹配,请求返回内容与用户定义内容不一致 616 认证失败 611 其他原因导致的探测失败 Ping 550 网络不通 610 网络...

端口探测

例如,一个服务暴露 12200 端口,正常情况下是可以 ping 通,但如果服务宕机了,那么这个端口就不通了。通过端口探测可周期性的判断应用服务的存活状态,以此保证应用可提供对外服务。本文主要介绍应用详情在可视化展示时,如何自定义监测...

捕获内核的内存污染问题(KFENCE)

在内核版本 5.10.134-15 及其之前的版本存在一个已知问题:order 0单页和slab混合监控时,在特定场景下可能造成宕机。您可以运行以下命令,禁用order 0单页监控来预防此问题。sudo grubby-update-kernel=boot/vmlinuz-$(uname-r)-args=...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

硬件终端配置网络打印机

由于网络隔离的原因,直接选择网络连接可能无法正常探测到打印机,此处请选中 确定是否希望在不连接打印机的情况下安装软件。说明 若对应厂家的驱动程序无此选项,请检查是否有 自定义安装 等类似功能,如果没有,可采取Windows的 INF驱动...

本地IDC通过负载冗余专线连接上云

说明 健康检查会以您指定的发包时间间隔发送探测报文,当连续发送的所有探测报文(即您指定的探测报文个数)都丢包时,则判断健康检查失败。如果健康检查失败,请检查您的物理专线连接是否正常。具体操作,请参见 故障排查。重复 步骤 3 至...

IPsec-VPN联合物理专线实现主备链路上云(绑定VPN网关...

创建VPN网关实例后,不支持修改VPN网关实例关联的交换实例,您可以在VPN网关实例的详情页面查看VPN网关实例关联的交换以及交换所属可用区的信息。虚拟交换2:从VPC实例中选择第二个交换实例。IPsec-VPN连接的隧道模式为单隧道时...

IDC通过BGP主备专线链路上云方案

健康检查会以您指定的发包时间间隔发送探测报文,当连续发送的所有探测报文(即您指定的探测报文个数)都丢包时,云企业网会主动将流量切换至另一条物理专线。登录 云企业网管理控制台。在左侧导航栏,单击 健康检查。在 健康检查 页面,...

物理专线联合IPsec-VPN实现主备链路私网访问云电脑

您需要为物理专线配置健康检查,健康检查会以您指定的发包时间间隔发送探测报文,当连续发送的所有探测报文(即您指定的探测报文个数)都丢包时,云企业网会主动将流量切换到VPN链路。需要注意的配置项说明如下表所示。参数 描述 示例 云...

DescribeDedicatedHosts-查询专有宿主机详细信息

ddh.g5 LockReason string 否 专有宿主机被锁定的原因。取值范围:financial:因欠费被锁定。security:因安全原因被锁定。financial PageNumber integer 否 响应信息的页码数。默认值:1。1 PageSize integer 否 响应信息的每页行数。最大...

应用监控概述

例如,某一服务暴露 12200 端口,正常情况下通过运行 ping 命令即可连通,但如果服务出现宕机,则该端口无法连通。通过端口探测,可周期性判断应用服务的存活状态,从而保证应用可提供对外服务。为了保证应用高可用,一般是多实例部署或是...

请问更换打包有什么问题?

问题原因 不同的打包因为打包环境的差异,打出来的apk包中资源id、汇编指令可能会存在差异,这样生成的补丁文件中的diff项可能会比真正修改的代码文件更多,导致出现改了几处代码生成了几百k补丁的问题出现。解决方案 新旧apk最好使用同...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

创建Redis实例或变更网络类型时找不到已有的交换机

问题原因 创建Redis实例时找不到已有交换机的原因如下:您创建的交换机不属于您选择的可用区或VPC。您没有在当前账号下创建过交换机。解决方案 请根据问题原因,选择具体的解决方案:您需要创建与Redis实例在同一地域下VPC的交换机,详情请...

错误码和状态码说明

618 探测结果断言失败,可通过失败的探测详情查看具体失败原因。703 禁止对服务器进行内网探测。内网探测可以使用 创建可用性监控任务。PING 550 网络不通。610 网络稳定,但发出的所有包在2秒内均无响应,丢包率100%。613 无法通过主机...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

Hologres SQL语句的常见问题

解决方法:提交工单排查Hologres实例宕机原因。报错:value too long for type character varying(256)问题原因:字段长度超过了VARCHAR类型的长度限制。解决方法:处理数据或将VARCHAR的长度设置得更长。报错:internal error:Write is ...

ECS实例宕机并产生“Objects remaining in kmalloc”...

如果您在ECS实例内使用memory cgroup kmem功能时内核存在 Objects remaining in kmalloc 告警日志,且实例出现宕机,则可以参考本文提供的方案解决问题。问题现象 当您在ECS实例内使用memory cgroup kmem功能时,内核有类似于如下所示的告...

互联网访问性能观测

由于探测集群内的测试与租户完全独立,因此不会影响或消耗您的任何资源。性能观测数据与您在阿里云上实际部署的资源情况无关。互联网访问性能支持的地域 区域 支持互联网访问性能观测的地域 中国 华北1(青岛)、华北2(北京)、华北3...

云网络互访性能观测

由于探测集群内的测试与租户完全独立,因此不会影响或消耗您的任何资源。性能观测数据与您在阿里云上实际部署的资源情况无关。云网络互访性能支持的地域 区域 支持云网络互访性能观测的地域 中国 华北1(青岛)、华北2(北京)、华北3...

堡垒无法连接ECS排查步骤

问题描述 堡垒机调用ECS失败 可能原因【可能原因一】堡垒机到ECS服务器的网路端口通信失败【可能原因二】堡垒机的相关配置影响【可能原因三】ECS 系统自身的相关策略影响 解决方案【可能原因一】堡垒机到ECS服务器的网路端口通信失败【解决...

ECS实例宕机并产生“VFS:Unable to mount root fs on ...

如果您的ECS实例在启动过程中循环宕机,且产生了 VFS:Unable to mount root fs on unknown-block 日志信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在启动过程中出现循环宕机,无法正常进入系统,且产生类似于如下所示的调用...

通过脚本录制断言特定业务逻辑的执行结果

您可以通过创建浏览器探测任务,模拟用户在不同地域、不同网络环境下通过浏览器访问探测目标,观测探测目标在浏览器访问时的稳定性和性能。新创建的浏览器探测任务的状态默认为 运行中,达到探测频率后,该任务自动执行。本文以淘宝网站的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云虚拟主机 运维安全中心(堡垒机) 云数据库 Redis 版 短信服务 云安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用