如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

计算层高可用

同时对于interactive模式下本身目标在于延迟敏感的分析场景,目前对于计算节点异常宕机的场景,计算引擎会通过查询级别重算,保证查询稳定性。Batch模式 对于类似ETL等数据清洗任务,这类任务计算时间长,计算资源消耗大,如果依然查询级别...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

服务介绍

升降级能力 边缘一体机处于繁忙状态时,可配置升降级策略来处理算法识别到的事件,降低边缘一体机在高压力情况下出现宕机的风险。任务感知 支持在边缘计算控制台,远程开启边缘一体机中的执行计划任务,开启执行计划任务后,可通过执行记录...

什么是边缘智能一体(执行计划版本)

升降级能力 支持一体机识别到现场AI事件超出硬件可处理的拼接时,一体机会根据用户配置的升降次策略进行处理,降低硬件在高压力情况下出现宕机的风险;任务感知 支持在云端对边缘一体机中的任务进行远程开关,同时可通过执行记录对边缘运行...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

步骤三:部署CDR网关

在配置了高可用(HA)vSphere集群上,如果CDR网关所在的Esxi宕机,网关会在同集群其他Esxi服务器上运行起来,宕机时间取决于vSphere集群的HA配置。建议您提高网关虚机重启优先级,以尽量缩短虚机启动时间。对于vSphere 6.5以上版本,您可以...

分布式工作流Argo集群概述

规划交换机的网段,保证可用IP数量以满足Argo workflow的运行要求。因为Argo Workflows工作流在运行过程中可能会创建大量的Kubernetes Pod,每个Pod运行过程中都会消耗一个交换机的IP。在所选地域的每个可用区创建一个交换机,并使用多个...

SAP HANA Scale-Out 部署指南

当您的 ECS 实例所宿的物理机由于底层性能出现异常,或者其他原因导致物理机宕机时,宕机迁移功能通过技术检测确认机器无法恢复之后,会立刻发送短信通知 ECS 实例拥有者。迁移完成后,阿里云会再次发送迁移完成的短信,且 ECS 实例的...

Alibaba Cloud Linux 2系统的ECS实例中...系统宕机如何处理...

pci ehci_hcd cirrus[598398.683106]CR2:0000000000000000[598398.683580]-[end trace c60ddcb70b40a540]-问题原因 EXT4文件系统删除日志数据的inode过程中,与JBD2事务提交流程之间存在一个竞态条件,可能导致use-after-free的问题,引起...

Alibaba Cloud Linux 2系统的ECS实例中...系统宕机如何处理...

pci ehci_hcd cirrus[598398.683106]CR2:0000000000000000[598398.683580]-[end trace c60ddcb70b40a540]-问题原因 EXT4文件系统删除日志数据的inode过程中,与JBD2事务提交流程之间存在一个竞态条件,可能导致use-after-free的问题,引起...

通过Terraform创建弹性伸缩资源

} resource"alicloud_vswitch""vsw"{ vpc_id=alicloud_vpc.vpc.id cidr_block="172.16.0.0/21"/规划交换机的私网网段。availability_zone="cn-hangzhou-b" //选择交换机的可用区。} 运行 terraform apply 命令,开始创建专有网络和交换机。...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

无法释放VPC实例的交换机资源

问题原因 导致无法释放VPC实例交换资源的原因如下:交换内存在未释放的ECS、RDS基础云资源。交换内存在未释放的传统型负载均衡CLB、自建的弹性网卡网络云资源。NAT网关的SNAT条目资源未释放。VPN网关资源未释放。交换下有关联的...

企业单AZ架构升级到多AZ

VPC_HZ 可用区和交换 选择之前规划的交换。杭州可用区 J vsw_001 杭州可用区 G vsw_002 IP模式 每个可用区至少有一个IP,随着业务请求的增加,应用型负载均衡会自动扩展IP数量,此模式下应用型负载均衡具备超强弹性能力。动态 协议版本...

使用实例时镜像相关问题

cd/root/rpmbuild/RPMS/aarch64 rpm-ivh kexec-tools-2.0.15-51.el7.aarch64.rpm 如果再次发生宕机,通过 ls-lh/var/crash 查询dump文件,可以正常生成 vmcore 文件,表示问题已解决。CentOS/RedHat 7.x升级Systemd重启进入救援模式如何...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

使用限制

受保护服务器不支持断电重启(包括但不限于ECS强制关机、ECS宕机等),断电重启会导致容灾复制失败。受保护服务器不支持磁盘缩容和减盘操作,这些操作会导致容灾复制失败。Windows系统不支持磁盘扩容或加盘操作,这些操作会导致容灾复制...

DescribeDedicatedHosts-查询专有宿主机详细信息

ddh.g5 LockReason string 否 专有宿主机被锁定的原因。取值范围:financial:因欠费被锁定。security:因安全原因被锁定。financial PageNumber integer 否 响应信息的页码数。默认值:1。1 PageSize integer 否 响应信息的每页行数。最大...

误删除云虚拟主机的MySQL数据库

本文介绍这种情况的可能原因和解决方案。问题现象 通过数据管理DMS登录云虚拟主机的MySQL数据库,无法看到数据库的任何信息。可能原因 在本地主机的数据库客户端误删除云虚拟主机的MySQL数据库。解决方案 选择恢复云虚拟主机MySQL数据库的...

IPv4网关概述

已绑定交换机的路由表不能与IPv4网关绑定。网关路由表不支持配置自定义路由条目,但可以修改网关路由表中路由条目的下一跳类型。路由条目的下一跳类型支持修改为Local、弹性网卡或ECS实例。当路由条目的下一跳类型为弹性网卡或ECS实例时,...

请问更换打包有什么问题?

问题原因 不同的打包因为打包环境的差异,打出来的apk包中资源id、汇编指令可能会存在差异,这样生成的补丁文件中的diff项可能会比真正修改的代码文件更多,导致出现改了几处代码生成了几百k补丁的问题出现。解决方案 新旧apk最好使用同...

资源规划

构建容器集群时选择合适的ECS类型 专有容器集群需要做好集群宿主机的规格的规划,建议使用大规格ECS:使用大规格ECS的优势:网络带宽大,对于大带宽类的应用,资源利用率高。容器在一台ECS内建立通信的比例增大,减少网络传输。拉取镜像的...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

常见退信内容分析

是由对方邮件服务商的服务器宕机或网络互联质量不佳造成的。另外,系统对此类投递情况会自动尝试转由负责中继的万网海外邮局进行再投递,以提高投递的成功率。您可以稍后重新尝试此邮件的投递。Error in command/Syntax error 无法识别的...

创建Redis实例或变更网络类型时找不到已有的交换机

问题原因 创建Redis实例时找不到已有交换机的原因如下:您创建的交换机不属于您选择的可用区或VPC。您没有在当前账号下创建过交换机。解决方案 请根据问题原因,选择具体的解决方案:您需要创建与Redis实例在同一地域下VPC的交换机,详情请...

概述

通常会基于系统对峰值负载表现出来的性能承载能力来给系统选择合适的节点数量规划,在双活系统中考虑到 failover 会需要给单节点设计更大的冗余,对于过载的场景也需要有过载控制相关功能模块来避免整体宕机。这个设计的环节是相对固定和长...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

Alibaba Cloud Linux 2系统的ECS实例...泄漏导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-22.2.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[49.804600]RDX:...

Alibaba Cloud Linux 2系统的ECS实例...泄漏导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-22.2.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[49.804600]RDX:...

集群容量规划

存储容量评估 存储容量评估主要考虑以下几点:副本数量:默认建议副本为0,搜索引擎基于分布式共享存储,节点宕机后,数据可以自动迁移到其它节点上提供服务,对于部分可靠性要求高的场景,可考虑设置副本数量为1。索引数据膨胀:数据一般...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

Hologres SQL语句的常见问题

解决方法:提交工单排查Hologres实例宕机原因。报错:value too long for type character varying(256)问题原因:字段长度超过了VARCHAR类型的长度限制。解决方法:处理数据或将VARCHAR的长度设置得更长。报错:internal error:Write is ...

ECS实例宕机并产生“Objects remaining in kmalloc”...

如果您在ECS实例内使用memory cgroup kmem功能时内核存在 Objects remaining in kmalloc 告警日志,且实例出现宕机,则可以参考本文提供的方案解决问题。问题现象 当您在ECS实例内使用memory cgroup kmem功能时,内核有类似于如下所示的告...

网络规划

当您需要使用专有网络 VPC 和交换机来部署您的云上网络时,您可以结合具体的业务来规划 VPC、交换机的数量及IP地址的分配。同时还需要注意 VPC 与 VPC 或本地数据中心互通的要求。应该使用几个VPC?一个VPC 如果您没有多地域部署系统的要求...

托管密码概述

通过将密钥托管在这些高安全等级的硬件设备中,可以保护您在阿里云上最敏感的计算任务和资产。...更多信息,请参见 上云须知。华东1(杭州金融云)、华东2(上海金融云)和华南1(深圳金融云)仅供金融云客户使用。...根据各地区监管机构要求,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
运维安全中心(堡垒机) 云数据库 Redis 版 短信服务 云安全中心 云虚拟主机 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用