如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

IIS常见问题排查

概述 本文主要介绍使用阿里云ECS实例搭建IIS网站时,遇到的一些常见问题的处理方法。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS...

Linux系统实例的宕机问题排查

常见宕机原因和解决方案 实例宕机并产生日志“not syncing:Out of memory:system-wide panic_on_oom is enabled”问题描述 Linux操作系统的ECS实例在运行过程中宕机,产生了“not syncing:Out of memory:system-wide panic_on_oom is ...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图单机宕机平均响应对比图。以下是集群宕机吞吐对比图集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

耗资源用户处理流程

为了保证您的站点能够安全、...关于网站耗资源的原因以及排查方法,更多信息,请参见 网站耗资源(客户程序故障)常见问题。增强版共享虚拟主机独享虚拟主机可以更好地应对耗资源问题,避免站点被关停。更多信息,请参见 云虚拟主机官网。

错误码查询

标记返回结果的性质和原因的数字代码,方便用户查询对应解释和应对方案。status_text:状态消息。如状态码为错误码,此处为错误详情。task_id:本次调用请求的唯一标识。代码示例如下:.status:40020105 status_text:Meta:APPKEY_NOT_EXIST...

资源规划

也可以使用按量服务实例抢占式实例结合的方法应对无状态且有低算力需求的业务场景。按量付费实例容量用于满足最低算力的需求,在此基础上使用抢占式实例可以大大降低成本,具体请参考 弹性供应 实践。规划配额 公共云云资源有配额的约束...

Hologres SQL语句的常见问题

解决方法:提交工单排查Hologres实例宕机原因。报错:value too long for type character varying(256)问题原因:字段长度超过了VARCHAR类型的长度限制。解决方法:处理数据或将VARCHAR的长度设置得更长。报错:internal error:Write is ...

自动化创建Topic相关问题

例如网络抖动、服务端升级、管控平台升级维护、ECS宕机等情况,会大幅度增加创建Topic的耗时,业务的超时是固定的,必然因为超时,导致创建失败。业务冲突:自动创建Topic,容易触发不同业务名称冲突,如果触发,不同业务数据混合,很难...

开启Windows实例的内核转储(Kernel Memory Dump)...

在某些特殊情况下,比如蓝屏、卡死、宕机、黑屏等,需要借助内核转储才能更快的定位问题原因,进一步进行针对性的处理。本文主要介绍开启Windows实例的内核转储功能的方法。背景信息 您可以通过以下两种方法配置内核转储,在微软官方文档...

使用实例时镜像相关问题

具体的原因和解决方案,请参见 Ubuntu 18.04版本的ECS实例中启动安骑士进程后系统负载较高。FreeBSD镜像问题 FreeBSD系统如何打补丁编译内核?阿里云的FreeBSD公共镜像已为内核添加了补丁,已满足系列V及以上的实例规格族的启动需求。具体...

自动创建Topic

例如网络抖动、服务端升级、管控平台升级维护、ECS宕机等情况,会大幅度增加创建Topic的耗时,业务的超时是固定的,必然因为超时,导致创建失败。业务冲突:自动创建Topic,容易触发不同业务名称冲突,如果触发会导致不同业务数据混合,很...

自动创建Topic

例如网络抖动、服务端升级、管控平台升级维护、ECS宕机等情况,会大幅度增加创建Topic的耗时,导致创建失败。业务冲突:自动创建Topic,容易触发不同业务名称冲突,如果触发会导致不同业务数据混合,很难发现问题。发现之后,恢复难度过大...

访问控制常见问题

配置限制访问CDN资源的用户时,如果遇到疑问请参考以下常见问题及处理建议。...远程鉴权服务器发生故障或宕机时,CDN与鉴权服务器之间的数据交互超时后,按照设置的 鉴权超时之后的动作 参数,选择是否放行鉴权超时的用户请求。

多账号操作日志统一归集与审计

场景二:企业内部运维 场景描述 企业面对内部的运维问题,如疑似AK泄露、异常的停机宕机、计划外的资源增删、违法员工操作盘查、故障排查、资源生命周期追溯、异地登录、异常操作、高危操作等,需要依赖审计日志进行排查分析。...

CentOS7实例随机性宕机问题

问题原因 CentOS7.57.6内核加入支持磁盘 mq-deadline elevator 的补丁,由于此补丁有Bug,会导致磁盘请求的 nr_phys_segments 有可能超过磁盘参数 max_segments 设置,virtio block 驱动代码检测到这个错误后,会主动触发内核异常。...

存储资源

可能原因包含数据库服务进程异常退出、数据库节点宕机、数据库网络异常等,常见的容错策略如下:自动重启:当数据库实例异常终止或崩溃时,可以设置自动重启恢复机制,自动重新启动数据库服务,并进行必要的数据恢复操作,以确保数据库的...

常见退信内容分析

提示信息 退信原因 解决方法 User not found/User unknown/No such user/Invalid User/No exist/Mailbox not found/invalid address(#5.5.0)指收件人不可用,或者收件人不存在而导致投递失败。请重新核实对方邮件地址的真实性。Dns,Host/...

无法连接Windows实例

检查远程访问端口配置是否异常 检查CPU负载是否过高 尝试重启实例 步骤一:使用管理终端登录实例 无论何种原因导致无法远程连接实例,请先尝试用阿里云提供的远程连接功能进行连接,确认实例还有响应,没有完全宕机,然后再按原因分类进行...

什么是Web应用防火墙

Web应用防火墙(Web Application Firewall,简称WAF)对网站或者App的业务流量进行恶意特征识别及防护,在对流量进行清洗过滤后,将正常、安全的流量返回给服务器,避免网站服务器被恶意入侵导致性能异常等问题,从而保障网站的业务安全...

网站耗资源(客户程序故障)常见问题

由于我们是对主机服务器进行实时监控的,出现问题后必须马上采取措施,否则将会导致服务器宕机,所以发出此通知信的同时,已将您的网站暂停,希望您能理解,因此给您带来的不便向您表示深深的歉意,谢谢您的支持与理解。云虚拟主机会因为...

驱逐及防护

当某节点因宕机或其他原因处于NotReady异常状态时,ACS将启动节点自愈流程,此时节点上的Pod将会被驱逐。节点升级:升级节点内核或其他模块时,可能需要触发节点重启操作,在节点重启前,ACS会先将节点上的所有Pod进行驱逐。资源调度运营:...

主备双活

宕机测试 单机宕机吞吐对比 单机宕机平均响应对比 集群宕机吞吐对比 集群宕机平均响应对比 使用方法 准备 使用云HBase主备容灾方案参见 主备容灾。在高可用管理页面获取高可用链接地址高可用实例ID。客户端依赖版本。hbase1.X版本使用...

服务条款

影响阿里云与国际互联网或者阿里云与特定网络、服务器及阿里云内部正常通畅的联系,或者导致阿里云云平台产品与服务或者阿里云的其他用户的服务器宕机死机或者用户基于云平台的产品/应用不可访问等;3.1.6.7.不进行任何破坏或试图破坏...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

节点伸缩概述

Pod Disruption Budgets:可限制在同一时间因自愿干扰导致的多副本应用中发生宕机的Pod数量。节点即时弹性 支持根据Pod选择最优 装箱策略(Bin Packing) 预绑定(PreBind)策略(自定义特性),可将调度碎片率优化30%。节点即时弹性 的...

安全响应

应急响应通常是安全事件发生后,或正在发生过程中,采用的一系列延缓攻击或阻断攻击的流程、手段和方法。应急响应也包含前、中、后三个节点。通常情况下我们将应急响应的阶段划分如下:应急响应前:应制定应急响应事件的分类分级、预案、...

Windows系统的ECS实例远程登录后无法显示桌面或显示...

当控制台的终端连接也无法进入系统,则系统可能已经宕机了,建议通过控制台重启服务器,再检查系统日志寻找原因。系统显示设置 问题现象 在服务器上打开浏览页面是黑的,且其他界面也是黑的。解决方案 右键单击桌面空白处,然后选择 屏幕...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理实例操作系统内相关配置进行全方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

清林云

阿里云 函数计算 承载了清林云的业务API层、常用应用自定义应用,再配合使用 Serverless工作流,使得整个流程Serverless化,轻松应对清林云高峰流量集中自动化流运行。公司介绍 清林云是一家专业的互联网业务咨询公司,为客户提供技术...

清林云

阿里云 函数计算 承载了清林云的业务API层、常用应用自定义应用,再配合使用 Serverless工作流,使得整个流程Serverless化,轻松应对清林云高峰流量集中自动化流运行。公司介绍 清林云是一家专业的互联网业务咨询公司,为客户提供技术...

风险治理的工作开展

但并非所有风险都需要被100%规避,需要充分评估风险的实际影响,采取不同的应对方法。在上云的不同阶段,或业务发展的不同阶段,风险治理的要求是不同的。而在云上,各个阶段的转换很迅速,没有风险治理团队能一开始就探测到所有潜在风险,...

使用限制

受保护服务器不支持断电重启(包括但不限于ECS强制关机、ECS宕机等),断电重启会导致容灾复制失败。受保护服务器不支持磁盘缩容减盘操作,这些操作会导致容灾复制失败。Windows系统不支持磁盘扩容或加盘操作,这些操作会导致容灾复制...

如何处理Windows Server 2003/2008系统的ECS实例虚拟...

问题现象 一般而言,Windows Server 2003/2008系统的ECS实例缺少虚拟内存时会引起很多问题,包含但不限于如下现象:操作系统运行缓慢,甚至出现宕机,远程桌面连接实例时出现蓝色背景界面。VNC连接实例时输入用户名、密码后,无法登录到...

日志管理概述

消费端宕机了,消费失败的消息什么时候可以再次被消费?消息发布到主题,Endpoint却迟迟收不到消息?想看一个月前的消息操作日志?这些问题可以通过 消息服务MNS 的日志管理功能解决,方法如下:将日志推送到 SLS,在控制台查看完整消息...

诊断项与诊断结果说明

检查该实例的操作系统(Guest OS)内部是否存在内核Panic、OOM异常或内部宕机等故障。此类故障可能是由于实例配置不当或用户空间的程序配置不当导致的,您可以尝试通过重启实例进行恢复。实例虚拟化异常 实例在运行中出现崩溃或出现异常...

大数据安全治理的难点

通常,大数据系统中的工作流涉及多部门、多责任人且跨系统的数据,如何才能协调好这些业务系统准时、保质保量地产出数据,避免出现因业务系统宕机/脏数据导致数据延时产出、产出脏数据,关乎到企业数据业务的连续性问题甚至高层的信任问题...

刷新预热相关常见问题

检查源站状态:确认源站服务器是否正常工作,没有出现过载或宕机情况,如不能正常访问也将造成预热失败。控制预热任务的数量:如果同时提交了大量的预热任务,可能会因为系统繁忙导致一部分任务失败。预热时请尽量分批次执行,避免对源站...

2024年

2024年02月28日-MaxCompute单机宕机演练 尊敬的MaxCompute用户:MaxCompute将于北京时间 2024年02月28日(周三)15:00~16:00,在中国华北3(张家口)、西南1(成都)地域进行接入服务可靠性演练,预计不会对用户作业运行产生影响。...

常见问题

否则说明事务云服务已宕机或者网络已中断。分布式事务 SDK 与事务云服务网络连接正常,但是通信失败,是什么原因?TCP 连接正常,说明事务云服务启动正常。分布式事务 SDK 与事务云服务通信返回失败消息,说明 SDK 发送给事务云服务的消息...
共有32条 < 1 2 3 4 ... 32 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用