如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

计算层高可用

同时对于interactive模式下本身目标在于延迟敏感的分析场景,目前对于计算节点异常宕机的场景,计算引擎会通过查询级别重算,保证查询稳定性。Batch模式 对于类似ETL等数据清洗任务,这类任务计算时间长,计算资源消耗大,如果依然查询级别...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

服务介绍

升降级能力 边缘一体机处于繁忙状态时,可配置升降级策略来处理算法识别到的事件,降低边缘一体机在高压力情况下出现宕机的风险。任务感知 支持在边缘计算控制台,远程开启边缘一体机中的执行计划任务,开启执行计划任务后,可通过执行记录...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

PolarDB-X 2.0和1.0功能对比

高可用切换 存储层宕机切换,依赖MySQL主备的HA探活机制,切换的SLA在分钟级别。存储层宕机切换,依赖Paxos多数派共识协议,切换的SLA≤30秒。计算层感知存储发生切换,依赖于RDS MySQL的连接主动断开,切换的SLA在分钟级别。计算层感知...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

常见问题

无论 SOFARegistry 是否宕机,SOFARPC 框架对服务提供者调用失败的情况,做了两方面的容错处理:调用重试:您可以配置调用重试,当发生非业务错误导致的请求失败时(例如网络超时等),会尝试重试(随机调用一个服务提供者重试)。...

存储资源

可能原因包含数据库服务进程异常退出、数据库节点宕机、数据库网络异常等,常见的容错策略如下:自动重启:当数据库实例异常终止或崩溃时,可以设置自动重启和恢复机制,自动重新启动数据库服务,并进行必要的数据恢复操作,以确保数据库的...

无法释放VPC实例的交换机资源

问题原因 导致无法释放VPC实例交换资源的原因如下:交换内存在未释放的ECS、RDS基础云资源。交换内存在未释放的传统型负载均衡CLB、自建的弹性网卡网络云资源。NAT网关的SNAT条目资源未释放。VPN网关资源未释放。交换下有关联的...

使用实例时镜像相关问题

cd/root/rpmbuild/RPMS/aarch64 rpm-ivh kexec-tools-2.0.15-51.el7.aarch64.rpm 如果再次发生宕机,通过 ls-lh/var/crash 查询dump文件,可以正常生成 vmcore 文件,表示问题已解决。CentOS/RedHat 7.x升级Systemd重启进入救援模式如何...

驱逐及防护

当某节点因宕机或其他原因处于NotReady异常状态时,ACS将启动节点自愈流程,此时节点上的Pod将会被驱逐。节点升级:升级节点内核或其他模块时,可能需要触发节点重启操作,在节点重启前,ACS会先将节点上的所有Pod进行驱逐。资源调度运营:...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

强一致分布式事务

如果事务内写入的数据涉及多个分区,PolarDB-X 的计算节点将会使用两阶段提交(Two-phase Commit Protocol,简称2PC)方式提交事务,即便在事务提交过程中发生节点宕机等问题,基于2PC的事务恢复机制也能确保事务原子性。MVCC多版本 以上面...

使用限制

受保护服务器不支持断电重启(包括但不限于ECS强制关机、ECS宕机等),断电重启会导致容灾复制失败。受保护服务器不支持磁盘缩容和减盘操作,这些操作会导致容灾复制失败。Windows系统不支持磁盘扩容或加盘操作,这些操作会导致容灾复制...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

消费重试

系统异常时处理中的消息状态如何恢复:帮助您了解当系统出现异常(宕机故障)等场景时,处理中的消息状态如何恢复,是否会出现状态不一致。消费重试策略 消费重试策略指消费者在消费某条消息失败后,消息重试的间隔时间和最大重试次数。...

本地SSD盘FAQ

本地是相对于普通云盘而言,不同于普通云盘的三份数据副本机制,本地SSD盘采用RAID技术,无法避免单台物理机宕机导致的数据丢失风险。如果您对数据可靠性要求高,则建议在应用层做数据冗余以保证数据的可靠性。本地表示没有像普通云磁盘...

V2版本RPC风格请求体&签名机制

本文介绍了阿里云 OpenAPI 的 RPC风格接口,包括RPC OpenAPI 请求的组成部分,如何通过这些组成部分构造一个 OpenAPI 请求,如何获取返回结果以及签名机制等。阿里云 RPC OpenAPI 向开发者提供HTTP接口,如果您想要自研阿里云RPC调用风格的...

错误反馈

报错原因:AlgorithmTimeOut 表示检测超时,OCR图文识别比较耗时,使用同步调用接口时,系统默认设置了3秒的超时限制,如果图片中文字比较多,出现超时的概率也会比较大。解决方法:如果您业务场景的图片中文字比较多,建议您调用异步OCR...

DescribeDedicatedHosts-查询专有宿主机详细信息

ddh.g5 LockReason string 否 专有宿主机被锁定的原因。取值范围:financial:因欠费被锁定。security:因安全原因被锁定。financial PageNumber integer 否 响应信息的页码数。默认值:1。1 PageSize integer 否 响应信息的每页行数。最大...

请问更换打包有什么问题?

问题原因 不同的打包因为打包环境的差异,打出来的apk包中资源id、汇编指令可能会存在差异,这样生成的补丁文件中的diff项可能会比真正修改的代码文件更多,导致出现改了几处代码生成了几百k补丁的问题出现。解决方案 新旧apk最好使用同...

开源对比

无法跳过有问题消息的消费处理,无法处理新生产的消息,从而会导致消息大量堆积引起内存问题,导致消息服务宕机。用户名、密码 通过阿里云访问控制(RAM)的AccessKey和AccessKey Secret生成用户名和密码,详情请参见 静态用户名密码管理。...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

产品优势

高可用 采用高可用架构和任务多备份机制,经历阿里集团多年双十一、容灾演练,可以保障机房宕机时调度任务不受影响。安全防护 多层次安全防护:支持HTTPS和VPC访问,基于阿里云的多层安全防护,可有效防止恶意攻击。多租户隔离机制:支持多...

产品优势

高可用 采用高可用架构和任务多备份机制,经历阿里集团多年双十一、容灾演练,可以保障机房宕机时调度任务不受影响。安全防护 多层次安全防护:支持HTTPS和VPC访问,基于阿里云的多层安全防护,可有效防止恶意攻击。多租户隔离机制:支持多...

创建Redis实例或变更网络类型时找不到已有的交换机

问题原因 创建Redis实例时找不到已有交换机的原因如下:您创建的交换机不属于您选择的可用区或VPC。您没有在当前账号下创建过交换机。解决方案 请根据问题原因,选择具体的解决方案:您需要创建与Redis实例在同一地域下VPC的交换机,详情请...

本地盘最佳实践

如果本地盘发生故障、物理服务器发生宕机,或者人为误操作,本地盘会丢失数据。请勿在本地盘上存储需要长期保存的业务数据。但云盘采用分布式三副本机制,能防止意外硬件故障导致的数据不可用。如果应用没有多节点数据冗余架构,强烈建议您...

步骤三:创建资源

集群中出现机器宕机时,仍然保证分区内按照发送顺序存储。但是会出现部分分区发送消息失败,等到分区恢复后即可恢复正常。当 存储引擎 选择 Local 存储 时,默认选择 分区顺序消息。普通消息 日志清理策略 Topic日志的清理策略。当 存储...

存储引擎对比

碎片化存储 否 是 Compact 不支持 支持 幂等 不支持 支持 事务 不支持 支持 消息类型 普通消息 集群重启或者宕机时,会导致极少量乱序。分区顺序消息 集群宕机时,会自动从ISR中选取新Leader。相关文档 如何为专业版实例在创建Topic时选择...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

Hologres SQL语句的常见问题

解决方法:提交工单排查Hologres实例宕机原因。报错:value too long for type character varying(256)问题原因:字段长度超过了VARCHAR类型的长度限制。解决方法:处理数据或将VARCHAR的长度设置得更长。报错:internal error:Write is ...

概述

稳定可靠,保障业务稳定运行 云解析DNS提供100%SLA服务,全球DNS集群互相备份,服务永不宕机。全球节点,提升域名解析效率 节点遍布全球,持续扩展的数据中心让跨域体验更流程 负责均衡,流量均摊降低负载 当辅助DNS与主DNS同时对外提供...

ECS实例宕机并产生“Objects remaining in kmalloc”...

如果您在ECS实例内使用memory cgroup kmem功能时内核存在 Objects remaining in kmalloc 告警日志,且实例出现宕机,则可以参考本文提供的方案解决问题。问题现象 当您在ECS实例内使用memory cgroup kmem功能时,内核有类似于如下所示的告...

如何配置客户端参数?

acks=all:服务端主节点写成功且备节点同步成功才返回Response,性能较差、数据较为安全、主节点和备节点都宕机才会导致数据丢失。batch.size 发往每个分区的消息缓存量。达到设置的数值时,就会触发一次网络请求,然后Producer客户端把...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
运维安全中心(堡垒机) 短信服务 云虚拟主机 云数据库 Redis 版 云安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用