如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

计算层高可用

同时对于interactive模式下本身目标在于延迟敏感的分析场景,目前对于计算节点异常宕机的场景,计算引擎会通过查询级别重算,保证查询稳定性。Batch模式 对于类似ETL等数据清洗任务,这类任务计算时间长,计算资源消耗大,如果依然查询级别...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

MongoDB 4.4功能概览

复合哈希分片键(Compound Hashed Shard Keys)在4.4之前的版本中,您只能指定单字段的哈希片键,原因是当时版本的MongoDB不支持复合哈希索引,这样就很容易导致集合数据在分片上分布不均匀。在最新的4.4版本中加入了复合哈希索引,即您...

应用概览

日同比:应用在指定时间段的请求数同比前一日在相对时间段的请求数增减的百分比。错误数 翻牌器 应用在指定时间段的错误数总和。日同比:应用在指定时间段的错误数同比前一日在相对时间段的错误数增减的百分比。平均耗时 翻牌器 应用在指定...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

如何将一棵LSM-Tree塞进NVM

数据一致性 PM到磁盘的合并涉及到数据库状态的改变,可能在系统宕机时出现数据一致性问题。针对该问题,本文通过在磁盘中维护描述日志(manifest log)的方式保证数据库状态改变的数据一致性。由于描述日志不在前端写入的关键路径中,因此...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

Hologres SQL语句的常见问题

解决方法:提交工单排查Hologres实例宕机原因。报错:value too long for type character varying(256)问题原因:字段长度超过了VARCHAR类型的长度限制。解决方法:处理数据或将VARCHAR的长度设置得更长。报错:internal error:Write is ...

配置Spark SQL任务参数

适用于虚拟机开销、内部字符串和其他本机开销等的内存。Spark SQL配置使用Livy Spark SQL配置使用Livy时,支持以下任务参数。参数名称 描述 livy.session.driverMemory 驱动程序进程使用的内存量。livy.session.driverCores 用于驱动程序...

无法释放VPC实例的交换机资源

问题原因 导致无法释放VPC实例交换资源的原因如下:交换内存在未释放的ECS、RDS基础云资源。交换内存在未释放的传统型负载均衡CLB、自建的弹性网卡网络云资源。NAT网关的SNAT条目资源未释放。VPN网关资源未释放。交换下有关联的...

使用限制

说明 由于边缘一体计算能力限制,不同一体可接入的视频设备数量不同,具体请参考边缘一体随机附带的使用手册。根据边缘一体型号确定。单个边缘一体最多可接入的通用设备数量。说明 通用设备须通过驱动接入到边缘一体。1500 ...

功能发布记录

企业双擎版 2024-03-27 无 用户登录堡垒机限制 新增 支持限制用户登录堡垒机的时间和来源IP。基础版、企业双擎版 用户配置 API接口 新增 新增开放网络域、控制策略、授权规则、数据库管理API接口。开放用户管理消息通知语言参数配置。...

访问控制常见问题

配置限制访问CDN资源的用户时,如果遇到疑问请参考以下常见问题及处理建议。...远程鉴权服务器发生故障或宕机时,CDN与鉴权服务器之间的数据交互超时后,按照设置的 鉴权超时之后的动作 参数,选择是否放行鉴权超时的用户请求。

发布者最佳实践

默认情况下,云消息队列 Kafka 版 为了提升可用性,并不保证单个分区内绝对有序,在升级或者宕机时,会发生少量消息乱序(某个分区挂掉后把消息Failover到其它分区)。如果业务要求分区保证严格有序,请在创建Topic时选择使用Local存储。

捕获内核的内存污染问题(KFENCE)

在内核版本 5.10.134-15 及其之前的版本存在一个已知问题:order 0单页和slab混合监控时,在特定场景下可能造成宕机。您可以运行以下命令,禁用order 0单页监控来预防此问题。sudo grubby-update-kernel=boot/vmlinuz-$(uname-r)-args=...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

内核功能与接口概述

检测文件系统和块层的IO hang Alibaba Cloud Linux 2所有内核版本 Alibaba Cloud Linux 3所有内核版本 IO hang是指在系统运行过程中,因某些IO耗时过长而引起的系统不稳定甚至宕机。为了准确检测出IO hang,Alibaba Cloud Linux扩展核心...

性能调优

如何定位查询突然变慢的原因?如何定位大内存查询和占用CPU较高的查询?ANALYZE命令为什么会被诊断为慢查询?使用统计信息功能过程中,CPU负载过高的原因?统计信息收集任务导致CPU负载过高,查询响应时间受到影响如何处理?通过SELECT*...

DescribeDedicatedHosts-查询专有宿主机详细信息

ddh.g5 LockReason string 否 专有宿主机被锁定的原因。取值范围:financial:因欠费被锁定。security:因安全原因被锁定。financial PageNumber integer 否 响应信息的页码数。默认值:1。1 PageSize integer 否 响应信息的每页行数。最大...

2021年

使用跨并行查询加速索引创建 支持从三种粒度指定跨并行查询的范围:系统粒度:指定所有session所有查询是否开启跨并行查询。会话粒度:指定当前session是否开启跨并行查询。查询粒度:指定具体查询是否开启跨并行查询。使用跨...

资源使用优化

通过消除每个应用程序都需要运行一个虚拟机的需求,可以减少整体计算开销。这种浪费、重复的操作系统和资源的减少可以转化为巨大的成本节省。过去多年大量的互联网企业经历了应用容器化改造。毋庸置疑,企业应用的容器化改造,不仅可以提升...

Global AWR用户指南

通过AWR工具,可以从数据库的动态视图等统计信息中生成某个时间段的性能报告。概述 PolarDB PostgreSQL版 的Global AWR性能报告功能,在提供数据库资源、Top SQL、Top表及索引的分析基础上,进一步拓展了AWR报告的边界:数据范围上涵盖...

Global AWR用户指南

通过AWR工具,可以从数据库的动态视图等统计信息中生成某个时间段的性能报告。概述 PolarDB PostgreSQL版(兼容Oracle)的Global AWR性能报告功能,在提供数据库资源、Top SQL、Top表及索引的分析基础上,进一步拓展了AWR报告的边界:数据...

Global AWR用户指南

通过AWR工具,可以从数据库的动态视图等统计信息中生成某个时间段的性能报告。概述 PolarDB PostgreSQL版(兼容Oracle)的Global AWR性能报告功能,在提供数据库资源、Top SQL、Top表及索引的分析基础上,进一步拓展了AWR报告的边界:数据...

HTTPS设置

在串联链路每一次循环执行时,会重新初始化SSL状态,即每次串联链路的执行都会重新完成SSL上下文配置,这样可以更准确模拟每次循环代表不同用户的压测场景,但同时需要您注意开启循环重置SSL状态后会导致施压额外的性能开销。使用场景 ...

HTTPS设置

重要 打开此开关后,由于施压有额外的性能开销,建议扩展施压IP数。扩展施压IP数的具体操作,请参见 扩展施压。SSL协议 SSL协议版本为客户端支持的最高SSL版本。PTS目前支持 TLSv1.2 与 TLSv1.3 协议版本,默认为 TLSv1.3。如果您...

2021年

通过AWR工具,可以从数据库的动态视图等统计信息记录中生成一份该时段的统计分析报告,分析数据库在某个时间段的性能。无 2021年3月 优化 WAL 采用流水线技术,优化WAL开销占比,提高整体系统的性能。无 2021年3月 缺陷修复 修复无用SIGHUP...

请问更换打包有什么问题?

问题原因 不同的打包因为打包环境的差异,打出来的apk包中资源id、汇编指令可能会存在差异,这样生成的补丁文件中的diff项可能会比真正修改的代码文件更多,导致出现改了几处代码生成了几百k补丁的问题出现。解决方案 新旧apk最好使用同...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

创建Redis实例或变更网络类型时找不到已有的交换机

问题原因 创建Redis实例时找不到已有交换机的原因如下:您创建的交换机不属于您选择的可用区或VPC。您没有在当前账号下创建过交换机。解决方案 请根据问题原因,选择具体的解决方案:您需要创建与Redis实例在同一地域下VPC的交换机,详情请...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

性能监控指标

同样的P99 分位数(3s),慢请求全部集中在3-5s区间,和全部集中在10s以上区间所反映的问题严重程度,以及问题背后的原因可能是完全不同的。通过对比不同时段的直方图分布,可以精准发现每一个耗时区间的变化情况。如果业务是面向终端用户...

ECS实例宕机并产生“Objects remaining in kmalloc”...

如果您在ECS实例内使用memory cgroup kmem功能时内核存在 Objects remaining in kmalloc 告警日志,且实例出现宕机,则可以参考本文提供的方案解决问题。问题现象 当您在ECS实例内使用memory cgroup kmem功能时,内核有类似于如下所示的告...

堡垒无法连接ECS排查步骤

问题描述 堡垒机调用ECS失败 可能原因【可能原因一】堡垒机到ECS服务器的网路端口通信失败【可能原因二】堡垒机的相关配置影响【可能原因三】ECS 系统自身的相关策略影响 解决方案【可能原因一】堡垒机到ECS服务器的网路端口通信失败【解决...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
运维安全中心(堡垒机) 云数据库 Redis 版 云虚拟主机 短信服务 云安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用