如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

创建Redis实例或变更网络类型时找不到已有的交换机

问题原因 创建Redis实例时找不到已有交换机的原因如下:您创建的交换机不属于您选择的可用区或VPC。您没有在当前账号下创建过交换机。解决方案 请根据问题原因,选择具体的解决方案:您需要创建与Redis实例在同一地域下VPC的交换机,详情请...

清除主机指纹

当原主机指纹不适用时,比如经过系统重装操作导致主机指纹发生变化,您需要在堡垒中清除主机指纹,否则将无法通过堡垒进行正常运维。本文介绍清除主机指纹的具体操作。背景信息 堡垒通过主机指纹可以唯一识别一台Linux主机。清空主机...

修改主机的服务端口

目前堡垒对于服务器的RDP和SSH协议使用的是默认端口(RDP协议默认使用3389端口,SSH协议默认使用22端口),如果您在主机中自定义了端口,需要在服务端口中做相应修改。本文档介绍如何修改主机的服务端口。前提条件 在您修改服务端口前,...

什么是AI通信加速库Deepnccl

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

按用户授权主机

堡垒提供按用户授权主机的功能。当您新建用户之后,您可以为该用户授权主机。授权后该用户即可使用堡垒运维已授权的主机。本文介绍如何为用户授权主机。授权主机 为用户授权主机,具体操作请参见以下步骤:登录堡垒系统。具体操作,...

步骤3:授权资产及资产账户

授权主机 为用户授权主机,具体操作请参见以下步骤:登录堡垒系统。具体操作,请参见 登录系统。在左侧导航栏,选择 人员管理>用户。在需要授权用户的 操作 列中,单击 授权主机。在 已授权主机 页签下,单击 授权主机。在授权主机面板上...

V3.1迁移至V3.2步骤及差异说明

架构更安全灵活:堡垒机的V3.2版本采用云原生架构,可切换堡垒机网络可用区,避免点故障导致运维业务中断,同时可弹性扩展带宽、存储适应业务扩展需求,并具有双引擎架构,提供更高业务稳定性。迁移须知 迁移前,您需要提前了解V3.1版本...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

查看节点和双向同步实例

本文介绍如何在RDS全球多活数据库集群中查看、管理节点以及双向同步的实例。前提条件 已创建全球多活数据库集群。操作步骤 访问 全球多活数据库集群 页面。在全球多活数据库集群列表页面,单击目标集群ID。在集群 基本信息 页面,查看和...

Hologres SQL语句的常见问题

解决方法:提交工排查Hologres实例宕机原因。报错:value too long for type character varying(256)问题原因:字段长度超过了VARCHAR类型的长度限制。解决方法:处理数据或将VARCHAR的长度设置得更长。报错:internal error:Write is ...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

产品优势

对比项 X86服务器 手机农场 手机板卡 阿里云(ARM服务器虚拟化)性能 需要进行二进制指令翻译,性能损失大 与真机性能一致 性能不会超过真机 底层基于第三代神龙架构,可提供超越真机的性能 稳定性 开源软件实现,稳定性较差 消费级产品,...

共享VPC概述

vpc_quota_sharedvpc_share_user_num_per_vswitch 单个VPC内的单个交换机支持共享的资源使用者的数量 50个 vpc_quota_sharedvpc_accept_shared_vswitch_num 单个资源使用者支持接收的共享交换机的数量 30个 无 单个VPC可用的IP数量 资源...

SAP HANA Scale-Out 部署指南

当您的 ECS 实例所宿的物理机由于底层性能出现异常,或者其他原因导致物理机宕机时,宕机迁移功能通过技术检测确认机器无法恢复之后,会立刻发送短信通知 ECS 实例拥有者。迁移完成后,阿里云会再次发送迁移完成的短信,且 ECS 实例的...

常见退信内容分析

是由对方邮件服务商的服务器宕机或网络互联质量不佳造成的。另外,系统对此类投递情况会自动尝试转由负责中继的万网海外邮局进行再投递,以提高投递的成功率。您可以稍后重新尝试此邮件的投递。Error in command/Syntax error 无法识别的...

MSE Sync迁移方案

在节点宕机之后,正常节点会通过定时任务补偿因节点宕机丢失的数据。在节点宕机到定时任务执行之间的时间,客户端会有短时的实例列表为空的情况,定时任务的时间间隔可以通过以下参数进行配置。此参数为JVM参数,可以通过JAVA_OPT环境变量...

使用实例时镜像相关问题

cd/root/rpmbuild/RPMS/aarch64 rpm-ivh kexec-tools-2.0.15-51.el7.aarch64.rpm 如果再次发生宕机,通过 ls-lh/var/crash 查询dump文件,可以正常生成 vmcore 文件,表示问题已解决。CentOS/RedHat 7.x升级Systemd重启进入救援模式如何...

使用多MPP对海量数据分析提速

本文介绍了多并行执行能力的技术背景、技术原理、适用场景以及使用说明等内容。背景信息 列存索引(IMCI)是PolarDB的HTAP解决方案。随着用户查询数据量、查询复杂度以及对OSS等外部表的查询需求的增加,单个只读列存节点已无法满足海量...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

计算层高可用

同时对于interactive模式下本身目标在于延迟敏感的分析场景,目前对于计算节点异常宕机的场景,计算引擎会通过查询级别重算,保证查询稳定性。Batch模式 对于类似ETL等数据清洗任务,这类任务计算时间长,计算资源消耗大,如果依然查询级别...

蓝绿发布

蓝绿发布是迭代产品在生产环境安全上线的一种重要手段,提供零宕机部署方式。本文介绍如何通过创建蓝绿发布发布应用服务。说明 蓝绿发布在应用服务维度互斥,即不能通过两个发布同时发布一个应用服务,且与普通发布互斥。前提条件 ...

告警规则指标说明

JVM实例数 无 是 当前实时运行的Java虚拟机实例数量,常用于服务宕机告警配置。节点机发送的字节数 无 不是 节点机通过网络连接发送的数据量,其中包括应用程序发送的数据、系统消息和错误信息等。节点机发送的报文数 无 不是 节点机通过...

配置KMS硬件密钥管理实例的密码集群

KMS实例绑定的交换机的网段 如果此时还未购买KMS实例,请在购买并启用KMS实例后,再为集群添加该白名单。重要 集群的白名单优先级高于集群中密码机实例的白名单。例如,您设置的集群中密码机实例的白名单为10.10.10.10,集群的白名单为172....

访问控制策略常见问题

本文介绍使用云防火墙访问控制策略管控业务流量时可能遇到的...入侵防护:在防火墙开关处打开堡垒机的保护,使进入、流出堡垒机的流量都经过云防火墙的保护。具体操作,请参见 云防火墙和运维安全中心(堡垒机)联合部署访问策略的最佳实践。

SIP设备端对接说明

配置EarlyMedia启用 在发起后启动摄像头采集 主动查看门禁视频 用户可以通过猫精端/App主动查看当前楼下门禁机的视频流,应对外卖/快递通过电话呼入的情况,进行二次确认。主动查看门禁视频通过自动接听的方式完成,整体流程如下:门禁设备...

CLB监听服务FAQ

在负载均衡所有后端ECS中创建测试页面,如下图所示页面中能显示本内网IP。内网IP用于判断相应请求被指派到的物理服务器。通过观察该IP的一致性,来判断负载均衡会话保持的有效性。Linux系统内执行curl命令。假设负载均衡服务IP地址是 10....

什么是全球多活数据库集群

产品简介 全球多活数据库集群,通过RDS+DTS构建1中心节点和多个单元节点的星型双向同步架构,用户可以在全球多个地域进行数据读写操作,每个数据库节点的数据通过DTS实时保持同步,构建全球多活数据库集群,实现数据库容灾保护的同时,为...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

开源对比

无法跳过有问题消息的消费处理,无法处理新生产的消息,从而会导致消息大量堆积引起内存问题,导致消息服务宕机。用户名、密码 通过阿里云访问控制(RAM)的AccessKey和AccessKey Secret生成用户名和密码,详情请参见 静态用户名密码管理。...

直播基础服务FAQ

播放的卡顿,很大一部分原因是推流时出现了卡顿。导致推流的卡顿有以下主要因素,当出现推流卡顿时,您可以逐一排查问题。采集设备配置 推流过程中会有一定的CPU损耗,硬件配置较差的低端手机,在推流过程中若整体CPU使用率超过80%,画面会...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

请问更换打包有什么问题?

问题原因 不同的打包因为打包环境的差异,打出来的apk包中资源id、汇编指令可能会存在差异,这样生成的补丁文件中的diff项可能会比真正修改的代码文件更多,导致出现改了几处代码生成了几百k补丁的问题出现。解决方案 新旧apk最好使用同...

单机旁挂动态路由上云

配置交换机的环回口地址及路由通告信息:interface Loopback 0 ip address 192.168.100.3 255.255.255.255#交换机的环回口地址 router ospf 1#配置交换机OSPF路由协议并宣告路由 router-id 192.168.100.3#交换机OSPF协议的Router ID ...

使用限制

没有例外 自动宕机迁移 本地SSD型DDH不支持自动宕机迁移。没有例外 ECS实例使用的镜像限制 在中国内地以外的地域,ddh.c6s、ddh.g6s或ddh.r6s规格的DDH不支持使用Windows镜像创建ECS实例。没有例外 ECS实例数量限制 以下DDH规格台DDH上最...

Alibaba Cloud Linux 2系统的ECS实例...泄漏导致系统宕机

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-22.2.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[49.804600]RDX:...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云虚拟主机 短信服务 运维安全中心(堡垒机) 云数据库 Redis 版 云安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用