如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

服务介绍

升降级能力 边缘一体机处于繁忙状态时,可配置升降级策略来处理算法识别到的事件,降低边缘一体机在高压力情况下出现宕机的风险。任务感知 支持在边缘计算控制台,远程开启边缘一体机中的执行计划任务,开启执行计划任务后,可通过执行记录...

创建Redis实例或变更网络类型时找不到已有的交换机

问题原因 创建Redis实例时找不到已有交换机的原因如下:您创建的交换机不属于您选择的可用区或VPC。您没有在当前账号下创建过交换机。解决方案 请根据问题原因,选择具体的解决方案:您需要创建与Redis实例在同一地域下VPC的交换机,详情请...

高可用与容灾

Paxos通常要求集群中至少存在3个节点,每次写入都要获得超过半数节点的确认,即便其中1个节点宕机,集群也仍然正常提供服务。Paxos算法能够保证副本间的强一致,彻底解决副本不一致问题。PolarDB-X 在副本复制方面采用了X-Paxos协议。X...

使用mount命令挂载ext4文件系统

优点:数据安全高,可以确保系统宕机后文件系统的数据不丢失。缺点:文件系统性能下降。性能要求较高 如果您非常重视性能,建议您使用 defaults、noatime、nodiratime、nobarrier、nodelalloc、data=writeback 参数挂载文件系统。sudo ...

强一致分布式事务

如果事务内写入的数据涉及多个分区,PolarDB-X 的计算节点将会使用两阶段提交(Two-phase Commit Protocol,简称2PC)方式提交事务,即便在事务提交过程中发生节点宕机等问题,基于2PC的事务恢复机制也确保事务原子。MVCC多版本 以上面...

开源对比

磁盘写满直接宕机。线程池隔离 读冷数据仍可以保证写入基本正常。读冷数据直接导致线程堵塞,数据写入大量失败。分区规模 万级分区仍然可以保证稳定写入。千级分区就会出现大量抖动。巡检系统 针对死锁、宕机等问题进行自动发现和修复。无...

驱逐及防护

当某节点因宕机或其他原因处于NotReady异常状态时,ACS将启动节点自愈流程,此时节点上的Pod将会被驱逐。节点升级:升级节点内核或其他模块时,可能需要触发节点重启操作,在节点重启前,ACS会先将节点上的所有Pod进行驱逐。资源调度运营:...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致和业务可用。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

安全白皮书

法律声明 阿里云提醒您在阅读或使用本文档之前仔细阅读、充分理解本法律声明各条款的内容。如果您阅读或使用本文档,您的阅读或使用行为将被视为对本声明全部内容的...数据库主备服务器位于不同可用区,主服务器宕机,从服务器会自动接管 ​

消费重试

消费失败的原因不会导致连续,即当前消息消费失败是一个小概率事件,不是常态化的失败,后面的消息大概率会消费成功。此时可以对当前消息进行重试,避免进程阻塞。以下场景不建议使用消息重试 消费处理逻辑中使用消费失败来做条件判断的...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

可用与可靠

异常时自动切换节点,宕机时自恢复来保证极致的可用,还可以通过备份恢复来进行数据恢复。主备多副本与云盘三副本 AnalyticDB PostgreSQL版 是基于MPP架构的分布式数据库,对于所有的分布式系统来说,在通过分布式来增强性能的同时,也...

使用实例时镜像相关问题

cd/root/rpmbuild/RPMS/aarch64 rpm-ivh kexec-tools-2.0.15-51.el7.aarch64.rpm 如果再次发生宕机,通过 ls-lh/var/crash 查询dump文件,可以正常生成 vmcore 文件,表示问题已解决。CentOS/RedHat 7.x升级Systemd重启进入救援模式如何...

计算层高可用

同时对于interactive模式下本身目标在于延迟敏感的分析场景,目前对于计算节点异常宕机的场景,计算引擎会通过查询级别重算,保证查询稳定。Batch模式 对于类似ETL等数据清洗任务,这类任务计算时间长,计算资源消耗大,如果依然查询级别...

访问云虚拟主机的网站存在间歇无法访问的情况

问题描述 访问云虚拟主机的网站,存在...然后查看日志文件,分析不访问网站的原因。说明:如果日志显示不访问的时段有其他的正常请求,需要检查本地网络到站点的连通。适用于 云虚拟主机 如果您的问题仍未解决,点击 我要提问 试试。

集群高可用

阿里云Cloudera CDP默认支持集群中组件HDFS NameNode、YARN ResourceManager以及Hive Metastore Server的高可用,此外对于Hive、Hue等组件用于存储元数据的元数据库MariaDB也做了主从备份,最大限度保证服务的可用和数据的可恢复。...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

云盒计算资源配置最佳实践

存储设备:可以 确保在两台存储服务器同时宕机的情况下,数据的安全可靠。计算设备:支持宕机迁移和热迁移能力,在有充足冗余资源的情况下,可以确保业务连续。本文主要介绍如何选择合适的计算SKU以满足业务需求,同时配置一定的冗余资源...

产品优势

双引擎架构 可靠的引擎双节点部署,保障了堡垒机的稳定。正常业务下,均衡业务压力,提升运维效率。连接异常时,自动启用HA模式保障业务及监控不中断。便捷实用、贴心服务 堡垒机简单、易用、高效,即买即开通,可按需求灵活配置,支持...

开源对比

云消息队列 RabbitMQ 版 是一款基于高可用分布式存储架构实现的AMQP 0-9-1协议的消息产品,能够兼容开源RabbitMQ客户端,与开源RabbitMQ相比,能够解决各种稳定痛点(例如消息堆积、脑裂等问题),同时具备高并发、分布式、灵活扩缩容等...

本地盘最佳实践

本地盘的风险 本地盘只挂载在单台物理机上,而不具备分布式的多副本机制,其数据可靠取决于物理机的可靠。如果本地盘发生故障、物理服务器发生宕机,或者人为误操作,本地盘会丢失数据。请勿在本地盘上存储需要长期保存的业务数据。但...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

产品优势

当站点宕机时,增强版云虚拟主机可快速恢复。在云虚拟主机控制台页面,您可以快速完成Nginx配置、实现重定向、实现伪静态等功能。在隔离和DDoS防护能力方面,共享经济增强版的隔离和防护能力更好,可大幅降低耗资源关停站点风险。建站...

应用场景

GTS 可应用在多个领域,包括共享出行、微服务、消息以及混合事务。SOA 和分布式事务 提供跨库、跨服务的分布式事务支持,实现业务链路...强一致:可以在宕机、网络故障等任何情况下保证数据的一致。推荐搭配 ECS、MQ 和 DRDS 5.2.x 使用。

存储资源

可能原因包含数据库服务进程异常退出、数据库节点宕机、数据库网络异常等,常见的容错策略如下:自动重启:当数据库实例异常终止或崩溃时,可以设置自动重启和恢复机制,自动重新启动数据库服务,并进行必要的数据恢复操作,以确保数据库的...

QuerySmsSignList-查询短信签名列表

如果审核未通过,会返回审核失败的原因,请针对具体原因重新修改短信签名。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的...

产品优势

与共享宿主机(多租户环境)相比,DDH为您...高可用 DDH提供自动宕机迁移能力,在物理机故障时自动迁移,您无需准备备机,故障迁移自动完成。同时支持在不停机的情况下将ECS实例在不同宿主机间迁移,在需要时进行负载均衡,保障业务的高可用。

CentOS7实例随机性宕机问题

问题描述 在使用Linux实例时,如果该实例满足以下三种情况,可能导致系统宕机。使用CentOS7.5或者7.6公共镜像或者自定义镜像创建实例。内核版本为3.10.0-862或3.10.0-957。频繁执行大文件或目录操作。问题原因 CentOS7.5和7.6内核加入支持...

Persistent Buffer Pool

因此,在宕机和重启之后需要把Buffer Pool的所有页遍历一遍,剔除掉不被复用的页。另外,Buffer Pool的回收依赖于K8s。使用该优化之后,可以使重启前后的性能更加平稳。重启前后性能对比如图所示:使用指南 打开如下参数即可使用。polar_...

Persistent Buffer Pool

因此,在宕机和重启之后需要把Buffer Pool的所有页遍历一遍,剔除掉不被复用的页。另外,Buffer Pool的回收依赖于K8s。使用该优化之后,可以使重启前后的性能更加平稳。重启前后性能对比如图所示:使用指南 打开如下参数即可使用。polar_...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

共享VPC概述

vpc_quota_sharedvpc_share_user_num_per_vswitch 单个VPC内的单个交换机支持共享的资源使用者的数量 50个 vpc_quota_sharedvpc_accept_shared_vswitch_num 单个资源使用者支持接收的共享交换机的数量 30个 无 单个VPC可用的IP数量 资源...

通过堡垒访问主机(Linux)

背景信息 堡垒机的主要作用是记录用户的所有行为,用户所有的命令都必须经过堡垒机,且不开放数据库主机公网访问,保障数据库主机的安全。您可以通过堡垒机登录和管理数据库实例所在主机。您可以通过一个堡垒机登录多个数据库主机。操作...

云上整机恢复VMware虚拟机

但如果VMware虚拟机的基础设施出现了问题,比如ESXi出现宕机,或者数据中心遭遇故障,您可以通过云备份管理控制台把已备份的VMware虚拟机整机恢复到阿里云ECS上,以保持业务的连续及稳定。操作步骤 按如下步骤把已备份的VMware虚拟机...

方案概述

交换机 全部操作权限(包含开启和关闭交换机的IPv6功能)。说明 如果要删除交换机,请确保交换机已取消共享,且该交换机中的资源(包括资源所有者和资源使用者创建的资源)已全部删除。查看共享的交换机。在共享的交换机内创建、修改、删除...

产品优势

弹性容器实例为您提供免运维、弹性、低成本、高效的容器运行环境。核心优势 弹性容器实例的核心...宕机率 极低。影响单个Pod,对业务基本无影响。极低。影响单台ECS,包括部署在该ECS的Pod。极低。影响单台服务器,包括部署在该服务器的Pod。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 轻量应用服务器 弹性公网IP 云服务器 ECS 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用