如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

ECS实例CPU占用高的原因

概述 本文主要介绍ECS实例CPU占用高的原因。详细信息 通常ECS实例的CPU占用有以下几种原因。ECS实例有多个用户在同时使用,其他用户占用了较多的系统资源。ECS实例的IP地址被泄漏,被不法份子利用或攻击。建议购买独享型ECS实例...

主机CPU或内存使用导致网站无法访问

说明 引起网站无法正常访问的原因较多,本文以主机的CPU或内存使用原因为例进行说明。更多信息,请参见 网站无法访问。解决方案 本文的解决方案仅适用于独享云虚拟主机,以普通版Linux操作系统独享云虚拟主机为例进行详细介绍。登录 ...

诊断项与诊断结果说明

检查该实例的系统盘是否存在IO hang的情况(即磁盘内的文件系统因读写IO延迟过导致系统不稳定或宕机)。如果出现IO hang,云盘无法进行读写操作。建议您查看云盘的性能指标,具体操作,请参见 查看云盘监控信息。如果您使用的是Alibaba ...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

主备方案介绍

云数据库HBase存储海量大数据,在业务场景中往往承载着重要数据,为保障数据的高可用性和安全性,云数据库HBase提供了主备双活和主备容灾特性。本文介绍云数据库HBase的主备双活和主备容灾特性功能。使用场景 主备双活:大数据量随机读响应...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

诊断项与诊断结果说明

检查该实例的系统盘是否存在IO hang的情况(即磁盘内的文件系统因读写IO延迟过导致系统不稳定或宕机)。如果出现IO hang,磁盘无法进行读写操作,建议您查看磁盘的性能指标。具体操作,请参见 查看磁盘读写指标。如果您使用的是Alibaba ...

节点伸缩概述

Pod Disruption Budgets:可限制在同一时间因自愿干扰导致的多副本应用中发生宕机的Pod数量。节点即时弹性 支持根据Pod选择最优 装箱策略(Bin Packing)和 预绑定(PreBind)策略(自定义特性),可将调度碎片优化30%。节点即时弹性 的...

集群管理

服务介绍 集群管理是物联网边缘计算提供的边缘一体高可用服务,可帮助您实现边缘一体机的高可用性和集群扩展能力,还可以配合您的业务应用,实现应用自动迁移等功能。前提条件 已开启了您的物联网边缘计算业务,即您的阿里云账号下,已...

智能生产制作时长包

与按量付费相比,资源包享有更的折扣优惠。可以帮您在进行各类型视频剪辑任务时有效的降低使用成本。资源包简介 智能生产制作时长包可支持多种生产制作相关服务,按合成时长抵扣,包含视频剪辑、直播剪辑、高级模板剪辑、智能任务和数字...

实时监控

您可以在实时监控页面查看应用服务各项指标的总体统计数据,包括应用服务响应时间、错误及请求量。实时监控总览 应用服务 Top 5排行榜 应用服务请求量 Top 5:即请求量最多的 5 个应用,显示在默认统计时间窗口内请求量最多的 5 个应用...

无法连接Windows实例

检查远程访问端口配置是否异常 检查CPU负载是否过 尝试重启实例 步骤一:使用管理终端登录实例 无论何种原因导致无法远程连接实例,请先尝试用阿里云提供的远程连接功能进行连接,确认实例还有响应,没有完全宕机,然后再按原因分类进行...

功能特性

可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用升高、内存利用升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

Partial Result Cache(PTRC)

partial_result_cache_high_hit_rate Global/Session PTRC命中率的高水位阈值。当内存使用达到上限并且命中高于此值时,内存缓存变更为文件存储缓存,已缓存的数据也会转存至文件中。取值范围:0~100。默认值:70。partial_result_cache_...

告警规则指标说明

磁盘利用,表示节点机的存储容量越紧张。节点机系统负载 无 是 可以根据该指标判断节点机目前工作负载是否过,一般拥有N核的节点机,负载建议不应高于N。节点机空闲内存 MB 是 节点机中当前未被使用的内存空间大小。可以根据该指标...

ECS服务器内操作出现卡顿的排查步骤

当在Linux系统的ECS服务器中操作出现卡顿或机器宕机的时候,可以参考如下步骤进行排查。检查服务器内进程与服务否占用过多的内存,或者内存没有正常释放,导致出现内存溢出或系统宕机。检查/var/spool/cron 目录等系统配置中,是否有添加...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

MongoDB实例空间使用率高问题

本文介绍查看MongoDB实例空间使用情况的方法,以及各种空间使用情况的原因和优化策略。背景信息 实例空间使用达到80%~85%以上时,可通过降低数据库实际占用空间或扩容存储空间的方法避免空间占满的风险。查看空间使用情况 副本集架构 当...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

借助云效实现发版周期缩短一半,自动化提升60%

在业务需求不断更替、系统运维成本不断增高、研发效能缺乏有效度量以及复杂多样的技术架构等多重挑战下,上汽通用通过与阿里云效平台合作,引入云效研发流程,成功将发版周期缩短了一半,自动化提升了60%。挑战 上汽通用汽车信息系统部有...

DescribeVerifyResult

取值:UNQUALIFIED:照片质量较差 LOW:低 NORMAL:一般 HIGH: IdCardInfo Struct 身份证信息的OCR结果。说明 认证过程中如果没有身份证正面和反面信息,实人认证服务则不会返回身份证的OCR结果。认证过程中如果有身份证正面和反面信息...

DescribeVerifyResult

取值:UNQUALIFIED:照片质量较差 LOW:低 NORMAL:一般 HIGH: IdCardInfo Struct 身份证信息的OCR结果。说明 认证过程中如果没有身份证正面和反面信息,实人认证服务则不会返回身份证的OCR结果。认证过程中如果有身份证正面和反面信息...

照片实人认证

verifyScore阈值说明 千分之一误识 万分之五误识 万分之一误识 十万分之五误识 十万分之一误识 70 71.5 75 76.5 80 说明 如果您有个性化需求,您可以根据业务情况,参考返回的比对分和阈值,自定义认证结果。

排查Redis实例内存使用率高的问题

解决方案 请依次排查内存使用突然升高的原因,并参考对应的解决方案解决问题。排查是否写入大量新数据 排查方法:查看 Redis 性能监控的 入流量 与 写QPS。如果入流量与写QPS的趋势与内存使用的趋势一致,说明大量的数据写入导致内存...

为什么Redis内存报警与监控的内存使用不一致

如果Redis内存使用告警显示内存占用较,或您的应用程序出现OOM异常,但性能监控显示的内存使用并不,可参考本文排查原因并解决问题。问题现象 现象一:您收到 Redis 内存告警,显示 内存使用超过阈值(例如,连续满足3次平均值>=...

主备双活

宕机测试 单机宕机吞吐对比 单机宕机平均响应对比 集群宕机吞吐对比 集群宕机平均响应对比 使用方法 准备 使用云HBase主备容灾方案参见 主备容灾。在可用管理页面获取可用链接地址和高可用实例ID。客户端依赖版本。hbase1.X版本使用...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

什么是边缘智能一体(执行计划版本)

升降级能力 支持一体机识别到现场AI事件超出硬件可处理的拼接时,一体机会根据用户配置的升降次策略进行处理,降低硬件在压力情况下出现宕机的风险;任务感知 支持在云端对边缘一体机中的任务进行远程开关,同时可通过执行记录对边缘运行...

常见退信内容分析

是由对方邮件服务商的服务器宕机或网络互联质量不佳造成的。另外,系统对此类投递情况会自动尝试转由负责中继的万网海外邮局进行再投递,以提高投递的成功。您可以稍后重新尝试此邮件的投递。Error in command/Syntax error 无法识别的...

集群可用

阿里云Cloudera CDP默认支持集群中组件HDFS NameNode、YARN ResourceManager以及Hive Metastore Server的高可用,此外对于Hive、Hue等组件用于存储元数据的元数据库MariaDB也做了主从备份,能最大限度保证服务的可用性和数据的可恢复性。...

Windows实例中带宽使用问题的排查及解决方法

本文主要介绍Windows实例中带宽使用问题的排查及解决方法。问题现象 Windows系统的ECS实例中带宽使用。问题原因 带宽使用可能有以下原因。您的正常应用业务访问频繁,占用较带宽。恶意病毒、木马引起的网络流量。有时...

主机健康诊断

导致磁盘使用常见的原因有:没有设置日志回滚策略或者设置不合理,历史文件没有及时进行清理等,这些问题都会导致磁盘使用持续上涨,当上涨到某个阈值时,会导致系统或应用程序运行异常。磁盘Inode使用检测 磁盘Inode使用 ...

云消息队列 Kafka 版何时删除旧消息?

当往Kafka Topic中写入数据提示磁盘空间已满或 Queue full 时,为避免因磁盘容量不足而导致机器宕机,进而影响服务可用性,云消息队列 Kafka 版 会根据磁盘使用的多少,执行不同的消息清理策略。清理策略 磁盘使用每天凌晨4:00集中删除...

修改分辨率

创建云手机后,您可以根据业务需求修改云手机的分辨,以适应不同的应用程序,获得更好的性能和体验。本文介绍如何修改云手机的分辨。前提条件 云手机的实例状态必须为 已停止。操作步骤 登录 云手机管理控制台。在左侧导航栏,单击 云...

设置偏好

若您需要更的分辨(如4K)云桌面,建议购买带显卡的GPU镜像,同时登录客户端的本地设备也支持相应的分辨,不支持非GPU镜像和GPU镜像互换。缩放设置 如果桌面应用或文本的显示比较模糊或者不满足您的预期,您可以通过 缩放设置 更改云...

如何使用Prometheus监控Cassandra

collectd_df_df_complex Critical 硬盘的使用 该指标过说明硬盘可用空间不足,会导致数据无法正常持久化存储,有宕机的风险。SSTable压缩 指标名称 重要级别 指标描述 指标说明 mcac_table_pending_compactions Major 进行中的SSTable...

如何使用Prometheus监控Cassandra

collectd_df_df_complex Critical 硬盘的使用 该指标过说明硬盘可用空间不足,会导致数据无法正常持久化存储,有宕机的风险。SSTable压缩 指标名称 重要级别 指标描述 指标说明 mcac_table_pending_compactions Major 进行中的SSTable...

HEIF或AVIF图片高级压缩

通过OSS提供的图片高级压缩功能,您可以高效地将图片转换为HEIF或AVIF压缩比格式。前提条件 仅华北3(张家口)、华东2(上海)、华南1(深圳)、华东1(杭州)以及华北2(北京)地域支持使用图片高级压缩功能。背景信息 随着拍照设备分辨...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云虚拟主机 短信服务 云数据库 Redis 版 运维安全中心(堡垒机) 商标服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用