如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

如何将一棵LSM-Tree塞进NVM

数据一致性 PM到磁盘的合并涉及到数据库状态的改变,可能在系统宕机时出现数据一致性问题。针对该问题,本文通过在磁盘中维护描述日志(manifest log)的方式保证数据库状态改变的数据一致性。由于描述日志不在前端写入的关键路径中,因此...

产品优势

不支持 MTTR 深度优化,宕机恢复速度是开源HBase的10倍。不支持 多租户 认证与ACL 支持易用的账号密码认证和ACL管理,请参见 用户和ACL权限管理。较复杂 资源隔离 支持RS Group功能,实现租户间的资源物理隔离。不支持 运维诊断 运维工具 ...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

节点伸缩概述

Pod Disruption Budgets:可限制在同一时间因自愿干扰导致的多副本应用中发生宕机的Pod数量。节点即时弹性 支持根据Pod选择最优 装箱策略(Bin Packing)和 预绑定(PreBind)策略(自定义特性),可将调度碎片率优化30%。节点即时弹性 的...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

摄像控制器

相机位置 单击 起点对齐场景相机,将当前摄像机的位置对齐场景窗口的起点位置。高度 设置当前摄像机的高度。半径 设置当前摄像机的半径。角度 设置当前摄像机的角度。视场角 设置当前摄像机的视场角。相机位置 单击 终点对齐场景相机,将...

OSS上传或下载文件时速度很慢,怎么办?

本文介绍OSS上传和下载文件速度的原因和解决方法。问题原因 OSS上传和下载速度主要受限于客户端本地的带宽以及运营商的网络链路。解决方法 使用非SDK 上传和下载文件速度慢的排查方法 检查上传和下载文件的方式。如果您是通过OSS控制台、...

共享VPC概述

vpc_quota_sharedvpc_share_user_num_per_vswitch 单个VPC内的单个交换机支持共享的资源使用者的数量 50个 vpc_quota_sharedvpc_accept_shared_vswitch_num 单个资源使用者支持接收的共享交换机的数量 30个 无 单个VPC可用的IP数量 资源...

无法释放VPC实例的交换机资源

问题原因 导致无法释放VPC实例交换资源的原因如下:交换内存在未释放的ECS、RDS基础云资源。交换内存在未释放的传统型负载均衡CLB、自建的弹性网卡网络云资源。NAT网关的SNAT条目资源未释放。VPN网关资源未释放。交换下有关联的...

方案概述

交换机 全部操作权限(包含开启和关闭交换机的IPv6功能)。说明 如果要删除交换机,请确保交换机已取消共享,且该交换机中的资源(包括资源所有者和资源使用者创建的资源)已全部删除。查看共享的交换机。在共享的交换机内创建、修改、删除...

ModifyInstanceDeployment-修改实例部署集

目标实例规格必须与指定专有宿主机的规格匹配,详情请参见 宿主机规格。变更实例规格时,必须指定专有宿主机 ID,即设置参数 DedicatedHostId 的值。使用自动部署功能迁移 ECS 实例时,不能变更实例规格。ecs.c6.large ...

使用FTP客户端传输文件到云虚拟主机速度慢的解决方法

问题原因 FTP传输涉及FTP客户端和FTP服务器,因此传输速度慢可能有以下原因:在中国内地访问其他国家和地区地域下的云虚拟主机,受到国际链路拥塞影响。FTP服务器端资源消耗过多,系统运行慢。FTP服务器端网络收到DDoS攻击,导致网络不稳定...

告警规则指标说明

JVM实例数 无 是 当前实时运行的Java虚拟机实例数量,常用于服务宕机告警配置。节点机发送的字节数 无 不是 节点机通过网络连接发送的数据量,其中包括应用程序发送的数据、系统消息和错误信息等。节点机发送的报文数 无 不是 节点机通过...

使用实例时镜像相关问题

cd/root/rpmbuild/RPMS/aarch64 rpm-ivh kexec-tools-2.0.15-51.el7.aarch64.rpm 如果再次发生宕机,通过 ls-lh/var/crash 查询dump文件,可以正常生成 vmcore 文件,表示问题已解决。CentOS/RedHat 7.x升级Systemd重启进入救援模式如何...

Quick BI为什么数据集查询耗时很短,做...查询速度很慢呢...

概述 本文主要介绍数据集查询耗时很短,做的仪表板查询速度很慢的原因。详细信息 为什么数据集查询耗时很短,做的仪表板查询速度很慢呢?原因如下:数据集刷新预览这里只是做数据展示的,且SQL会加上LIMIT 0,100的限制,只查询100条,所以...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

使用限制

受保护服务器不支持断电重启(包括但不限于ECS强制关机、ECS宕机等),断电重启会导致容灾复制失败。受保护服务器不支持磁盘缩容和减盘操作,这些操作会导致容灾复制失败。Windows系统不支持磁盘扩容或加盘操作,这些操作会导致容灾复制...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

为什么选择安全沙箱?

当节点上某一应用异常和故障,如内存泄露、频繁CoreDump等等导致节点整体负载升高,单容器触发Host Kernel Bug导致系统宕机,单应用的故障延展到了整个节点,甚至进一步导致整个集群的不响应。安全沙箱(runV)容器通过独立的GuestOS ...

读写访问文件类问题

问题原因 Windows上使用NFS协议实例,会存在大小写敏感和大小写不敏感的兼容性问题,在目录里创建文件的性能随着目录规模增大而明显下降,原因是每次创建一个文件都需要对目录进行遍历,当目录规模达到10万级别时,目录遍历一次需要10秒钟...

消费重试

系统异常时处理中的消息状态如何恢复:帮助您了解当系统出现异常(宕机故障)等场景时,处理中的消息状态如何恢复,是否会出现状态不一致。消费重试策略 消费重试策略指消费者在消费某条消息失败后,消息重试的间隔时间和最大重试次数。...

性能监控指标

对于这部分请求来说服务的响应速度可能已经达到了一个无法忍受的程度(例如30秒),对于平均耗时,耗时P99分位数额外反映了3个重要的信息:有1%的服务请求可能正在忍受一个超长的响应速度,而它影响到的用户是远大于1%的比例。...

Spark

如何定位Spark应用运行速度变慢的原因?如何定期删除Spark应用日志信息?如何查看Spark应用信息?您可在 Spark Jar开发 页面,搜索 应用ID,查看Spark应用信息。具体操作,请参见 Spark开发编辑器。如何解决提交Spark应用时,出现User%s do...

DescribeDedicatedHosts-查询专有宿主机详细信息

ddh.g5 LockReason string 否 专有宿主机被锁定的原因。取值范围:financial:因欠费被锁定。security:因安全原因被锁定。financial PageNumber integer 否 响应信息的页码数。默认值:1。1 PageSize integer 否 响应信息的每页行数。最大...

离线同步并发和限流之间的关系

如果您的独享资源组机器台数为1,不建议使用分布式执行模式,因为执行进程仍然分布在一台Worker节点上,无法最大化享受分布式多机的好处。小数据量的同步任务,不建议配置分布式,建议配置单机小并发任务。并发数大于等于8个才能开启分布式...

访问云虚拟主机中的网站速度较慢的排查方法

概述 本文主要介绍访问阿里云云虚拟主机中的网站速度较慢的排查方法。详细信息 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、RDS)等进行配置与...

Join优化

深入了解SelectDB的Join机制,了解其原理,才能深刻分析其性能较慢的原因。利用会话变量来修改Join操作的一些行为,以实现Join操作的优化。查看Query Plan去分析这个调优是否生效。上述4个步骤描述了标准的Join调优流程。如果在完成了上述...

请问更换打包有什么问题?

问题原因 不同的打包因为打包环境的差异,打出来的apk包中资源id、汇编指令可能会存在差异,这样生成的补丁文件中的diff项可能会比真正修改的代码文件更多,导致出现改了几处代码生成了几百k补丁的问题出现。解决方案 新旧apk最好使用同...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

本地SSD盘FAQ

本地是对于普通云盘而言,不同于普通云盘的三份数据副本机制,本地SSD盘采用RAID技术,无法避免单台物理机宕机导致的数据丢失风险。如果您对数据可靠性要求高,则建议在应用层做数据冗余以保证数据的可靠性。本地表示没有像普通云磁盘...

存储层高可用

AnalyticDB的存储层是基于Raft协议构建了一套分布式强一致、高可用、高可靠的存储...三副本的多数派存活是保证数据读写高可用的关键,优势在于可允许1个副本所在节点发生宕机或重启,即少数派failover的情况下,数据库仍然能提供读写服务。

可用性与可靠性

异常时自动切换节点,宕机时自恢复来保证极致的可用性,还可以通过备份恢复来进行数据恢复。主备多副本与云盘三副本 AnalyticDB PostgreSQL版 是基于MPP架构的分布式数据库,对于所有的分布式系统来说,在通过分布式来增强性能的同时,也...

高可用性与容灾

此时如果主节点宕机,副本可能丢失已提交的数据,也就是常说的副本不一致。为了保证副本间的强一致性,现代数据库往往采用以Paxos为代表的多数派复制协议。Paxos通常要求集群中至少存在3个节点,每次写入都要获得超过半数节点的确认,即便...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

Kubernetes监控视图

标签 Name 无 POD-TEMPLATE-HASH 无 容器 该Pod关联的容器,单击容器名称可跳转至容器详情。进程 该Pod关联的进程,单击进程名称可跳转至进程详情。主机 该Pod关联的主机,单击主机名称可跳转至主机详情。Deployment详情说明 容器组...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云虚拟主机 运维安全中心(堡垒机) 短信服务 云数据库 Redis 版 云安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用