如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

为什么选择安全沙箱?

当节点上某一应用异常和故障,如内存泄露、频繁CoreDump等等导致节点整体负载升高,单容器触发Host Kernel Bug导致系统宕机,单应用的故障延展到了整个节点,甚至进一步导致整个集群的不响应。安全沙箱(runV)容器通过独立的GuestOS ...

诊断项与诊断结果说明

检查该实例的系统盘是否存在IO hang的情况(即磁盘内的文件系统因读写IO延迟过高导致系统不稳定或宕机)。如果出现IO hang,云盘无法进行读写操作。建议您查看云盘的性能指标,具体操作,请参见 查看云盘监控信息。如果您使用的是Alibaba ...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

ECS实例宕机并报错“Out of memory and no killable ...

[]call_usermodehelper_exec_async+0xfb/0x150[28663.777246][]ret_from_fork+0x39/0x50 问题原因 操作系统内核分配内存失败后,尝试通过 kill 进程来释放内存,但系统没有可被 kill 的进程,进而触发了系统的主动宕机。出现该问题的可能...

管理MySQL集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定的系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

管理集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定的系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

管理集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定的系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

SAP HANA 操作指南

这样当遇到意外的系统故障时,你可以从容恢复你的数据。附录:如何创建 NAT 网关 NAT 网关(NAT Gateway)是一款企业级的 VPC 公网网关,提供 NAT 代理(SNAT、DNAT)、10Gbps 级别的转发能力、以及跨可用区的容灾能力。NAT 网关与共享带宽...

使用mount命令挂载ext4文件系统

当软件发生崩溃或者硬件发生宕机时,如果使用默认的挂载方式(不指定挂载参数)挂载文件系统,由于部分用户数据、文件系统元数据仍在内存中未写入硬盘,因此会有数据丢失的风险。如果使用本场景推荐的挂载参数,任何内存的修改都会同步写入...

节点诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。基于专家经验和AI智能诊断两种诊断模式,节点诊断可以深入定位问题根因。节点诊断包括诊断检查项和诊断根因。诊断检查项:包括Node检查、...

创建MySQL集群

资源分配策略 专属集群资源调度的默认分配策略:均衡分配:最大化追求更稳定的系统表现,优先从未分配资源或已分配资源较少的主机中分配资源。紧凑分配:最大化追求更充分的资源利用率,优先从创建时间较早且已分配资源较多的主机中分配...

创建集群

重要 选择对应的引擎创建集群,才能在添加主机时选择对应的系统镜像,以及创建实例时选择对应的数据库类型。引擎设置后无法修改,请确保引擎选择正确。架构系列 仅引擎选择 MySQL 时出现此参数,默认为高可用。专属集群名称 专属集群的名称...

创建集群

重要 选择对应的引擎创建集群,才能在添加主机时选择对应的系统镜像,以及创建实例时选择对应的数据库类型。引擎设置后无法修改,请确保引擎选择正确。架构系列 仅引擎选择 MySQL 时出现此参数,默认为高可用。专属集群名称 专属集群的名称...

快速使用专属集群MyBase

重要 选择对应的引擎创建集群,才能在添加主机时选择对应的系统镜像,以及创建实例时选择对应的数据库类型。引擎设置后无法修改,请确保引擎选择正确。架构系列 仅引擎选择 MySQL 时出现此参数,默认为 高可用。专属集群名称 专属集群的...

Windows操作系统云虚拟主机耗资源(客户程序故障)...

本文主要介绍Windows操作系统云虚拟主机耗资源(客户程序故障)问题的原因分析及处理意见。调用Access程序问题(最常见)原因:Access数据库大小超过30M,频繁调用时耗用系统资源。解决方法:将数据库大小压缩到30M以内,或者升级到SQL ...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障的发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

捷顺

DAS服务自动SQL限流和自动SQL调优,帮助DBA从救火员转向数据库架构师,有更多时间和精力帮助研发优化系统架构,审核数据库的变更和各种操作,进一步降低系统故障的概率。DAS服务自动对数据库实例进行治理,帮助捷顺科技把数据库的运维成本...

SAP HANA Scale-Out 部署指南

SAP HANA Scale-Out 部署指南 概述 架构总览 资源规划 前期准备 阿里云账号 VPC ECS实例 ECS Metrics Collector的安装 文件存储NAS ECS宕机迁移 HANA安装 维护主机名 创建文件系统 准备OS以及安装包 安装SAP HANA 验证集群安装 版本管理 ...

访问云虚拟主机上的网站提示“Internal Server Error...

本文主要介绍访问云虚拟主机上的网站时提示“Internal Server Error”报错的原因和解决方案。问题描述 Linux操作系统云虚拟主机:访问该主机上的网站时提示“Internal Server Error”相关报错,具体信息如下所示:Internal Server Error ...

强弱依赖治理概述

强弱依赖治理的应用 强弱依赖治理主要可以被应用到以下场景:系统改造验收:对于分布式系统,至少在运行态中,不会因为依赖的系统后台出现故障,引起当前应用出现系统级可用性的故障,例如进程挂掉、频繁FullGC、负载飙高等,何时何地都应...

主机管理

选择要导入堡垒机的ECS实例,并单击 导入。同步阿里云ECS,操作步骤如下:在主机列表右上方,选择 更多操作>导入主机。在 导入主机 页,单击 下载模板文件,将文件下载至本地并解压缩。编辑并保存主机表格。说明 第一列为主机IP(必填)、...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

主机部署和管理

系统事件 单击 系统事件,系统跳转到主机 系统事件 页面,查看所有系统事件。更多信息,请参见 系统事件。应用激活 部分型号边缘一体支持预装应用,请参见您已购买的边缘一体随行的使用手册,确认该一体支持的预装应用。单击 应用...

功能概览

生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。更多信息,请参见 跨地域容灾。跨可用区容灾 当生产站点因为不可抗力因素(比如机房...

设计原则

因此,数据容灾对于企业来说是非常必要的,数据灾备是企业保护核心数据的重要手段,能有效降低勒索病毒、系统故障、自然灾害和运维事故导致的数据丢失和损坏问题,同时满足行业安全和合规要求,可以保障企业的正常运行和稳定发展。...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

管理主机

删除主机 如果您不再需要维护某个主机,可以在堡垒机的主机列表中删除该主机。警告 删除该主机后,该主机相关的所有授权会被同时删除。例如某用户已授权该主机,删除主机后,该授权关系会被同时删除。您将无法使用堡垒机登录该主机。登录...

运维审计

堡垒通过对堡垒机系统运维操作(系统登录日志、系统配置修改日志等)和资产运维会话(会话录像、字符命令等)等全方位审计,最大化保障企业运维安全。审计类型 对堡垒机系统的操作审计 堡垒机会记录用户登录堡垒机系统、修改堡垒配置等...

内核热补丁FAQ

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存页时由于访问空指针导致系统宕机 Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode出现系统宕机如何处理?Alibaba Cloud Linux 2系统的ECS实例OverlayFS的dentry泄露...

云盒计算资源配置最佳实践

存储设备:可以 确保在两台存储服务器同时宕机的情况下,数据的安全可靠。计算设备:支持宕机迁移和热迁移能力,在有充足冗余资源的情况下,可以确保业务连续性。本文主要介绍如何选择合适的计算SKU以满足业务需求,同时配置一定的冗余资源...

RedeployDedicatedHost-执行专有宿主机的故障迁移

调用RedeployDedicatedHost执行专有宿主机的故障迁移。接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询...

RedeployDedicatedHost-执行专有宿主机的故障迁移

调用RedeployDedicatedHost执行专有宿主机的故障迁移。接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询...

堡垒管理员角色授权

详细说明如下:管理员权限可以进行堡垒实例、用户及资产管理,以及控制策略设置、系统设置、查看审计信息等操作。重要 如果作为管理员角色的RAM用户需要导入阿里云资产或RAM用户,则至少需要给管理员授予对应资产或访问控制(RAM)的只读...

用户管理

或先下载模板文件,根据文件格式填写完成后再上传到本系统。操作步骤 参照以下步骤创建用户:登录云盾堡垒Web管理页。在左侧导航栏选择 用户>用户管理。可选:(可选)手动创建用户。单击 新建用户,进入配置页。输入 用户名、密码、姓名...

客户端远程连接工具及版本说明

本文介绍使用Windows或Mac系统中的客户端连接堡垒运维资产时,堡垒兼容的客户端远程连接工具及版本说明。重要 为确保堡垒机系统的稳定性和安全性,请您使用本文推荐的客户端工具连接堡垒,以防连接失败或对系统稳定性造成影响,且...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云虚拟主机 运维安全中心(堡垒机) 云数据库 Redis 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用