Linux实例负载高问题排查和异常处理

内存使用率过高,可能会出现系统卡顿、内部服务响应速度变慢等问题。I/O使用率过高:一般来说,当前I/O读写≥该云盘I/O的80%时,定义为I/O使用率过高。I/O使用率过高,可能会出现文件读写变慢、应用性能下降或报错等问题问题排查 您可以...

升级Linux ECS实例内核

升级须知 升级操作系统内核是一个比较复杂和风险较高的操作,可能导致系统稳定出现兼容性问题。在进行升级前,建议备份重要数据,了解升级过程和可能出现问题,并谨慎操作。操作步骤 以CentOS和Debian系列操作系统为例,指导您如何...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

浏览器兼容性和已知问题

Webkit issue iOS15.x使用蓝牙耳机播放音频时有概率失真,建议增加提示使用用户蓝牙耳机可能会出现问题,或升级系统版本。Webkit issue iOS 15.0 至 15.3 上的浏览器及内嵌 WKWebView 的应用听到远端音频音量低,建议升级系统版本。Webkit ...

ack-node-repairer

当节点出现故障时,自愈系统会自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD会修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

常见问题概览

下载备份文件 性能、空间与内存 热点问题 其他常见问题 如何排查MongoDB实例负载过高的问题 MongoDB实例内存使用率高问题 MongoDB实例的CPU使用率高问题 MongoDB实例IOPS使用率高问题 MongoDB实例空间使用率高问题什么高可用系统会触发...

内核统一异常框架(UKFEF)

Normal:当前应用进程可能会出现异常。建议对当前应用采取措施,例如 kill、重启或迁移。Fatal:可能会对系统产生致命影响。建议立即进行业务迁移。事件报告 UKFEF将通过以下方式输出事件报告:通过内核日志输出单次事件的详细信息。信息...

回切至本地物理机

如果扩充的是包含系统分区的磁盘,那么扩充的这部分空间会被ECS自动填充给系统分区,这样在恢复到本地的物理机时可能会出现分区越界的问题。如果系统分区相对源端机器被扩容,将会收缩相应的空间,确保和源端机器保持一致。反向注册。确认...

节点异常问题排查

常见排查方法 节点故障诊断 当节点出现故障时,您可以使用容器服务ACK提供的故障诊断功能,一键诊断节点异常。登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...

节点异常问题排查

常见排查方法 节点故障诊断 当节点出现故障时,您可以使用容器服务ACK提供的故障诊断功能,一键诊断节点异常。登录 容器服务管理控制台。在控制台左侧导航栏,单击 集群。在 集群列表 页面,单击目标集群名称或者目标集群右侧 操作 列下的 ...

搭建高可用架构

恢复数据 如果您已经按照前文的步骤搭建了高可用架构实例,您的业务一般是可以稳定运行的,即使出现问题也能快速恢复到可用状态。如果是单机故障,RDS除了基础系列之外的实例都可以在短时间内进行 主备切换 快速恢复您的业务。如果是可用区...

部署和使用跨可用区实例

同时,您可以通过控制台的切流操作,将出现故障的可用区隔离,这时系统会自动在剩余的可用区中补充计算资源,满足业务对资源的需求。本文介绍如何部署和使用(切流和恢复)跨可用区实例。应用场景 跨可用区部署支持单可用区、跨2个可用区、...

解决Windows实例中无法查看数据盘问题

磁盘显示为 外部 或 脱机 将Windows的系统更换到更高版本的系统后,可能会出现看不到数据盘的情况。在运行窗口输入 diskmgmt.msc 命令,运行磁盘管理,磁盘可能会显示为 外部 或 脱机。请参考如下步骤修复磁盘。显示为 外部 的磁盘,在磁盘...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

Alibaba Cloud Linux 2 EOL延保支持计划

Alibaba Cloud Linux 2作为Alibaba Cloud Linux的第一个版本,自2019年03月上线以来,一直致力于为用户提供更稳定、性能更好、更可控的操作系统,为阿里云大量用户提供服务。Alibaba Cloud Linux 2将于2024年03月31日结束生命周期,届时将...

实例启动异常常见错误与对应解决方案

问题原因 该问题可能是因为Windows系统引导配置数据(Boot Configuration Data,BCD)配置异常或者磁盘文件系统故障,导致系统无法加载。解决方案 在存有快照的情况下,您可以使用快照来恢复系统盘。具体操作如下:警告 回滚云盘是不可逆...

常见问题

更多产品定价常见问题 挂载访问FAQ Linux挂载NFS文件系统常见问题 Windows挂载SMB文件系统常见问题 Linux挂载SMB文件系统常见问题 Windows挂载NFS文件系统常见问题什么卸载旧NAS并重新挂载新NAS后,容器Pod仍将数据写入旧NAS?...

选择网络

全球加速 如果业务服务器、日志服务Project分别属于国内地域和国外地域,使用公网传输数据可能会出现网络延迟高、传输不稳定问题,您可以选择全球加速传输数据。更多信息,请参见 全球加速。场景 网络类型 ECS实例和Project属于同一地域 ...

更新软件

重要 由于该命令可能更新系统内核,导致出现系统无法启动、内核与软件不兼容等问题。建议您完成不升级系统内核的配置后,再运行该命令。yum update 执行以下命令,查看软件版本号。软件名>-V#请将<软件名>替换为您需要查看版本号的软件 ...

重置系统

背景信息 警告 重置或更换系统会清除轻量应用服务器上的磁盘数据,请您根据需要做好数据备份。重置系统后,可能会导致监控失效。如果监控出现问题,您可以手动安装云监控插件。远程连接服务器安装:具体操作,请参见 安装和卸载云监控插件...

EMR Kafka磁盘故障运维

业务场景 Kafka将日志数据存储到磁盘中,当磁盘出现故障时,导致磁盘IO能力下降、集群吞吐下降、消息读写延时或日志目录offline等问题。这些情况有可能影响到线上业务平稳运行、数据丢失、Kafka集群容错能力下降,单块盘故障甚至有可能...

概述

数据库治理的常见问题 系统对外提供查询接口,由于SQL语句涉及多表Join,因此可能触发慢查询,最终导致DB连接池/Tomcat线程池满,应用整体不可用。在应用启动时,数据库Druid连接池处于初始化,同时伴有大量请求进入,可能导致Dubbo的...

开源对比

千级分区就会出现大量抖动。巡检系统 针对死锁、宕机等问题进行自动发现和修复。无。Bug修复 及时发现并修复。只能等社区缓慢修复,且通常要等新版发布,周期长。内核能力 项目 云消息队列 Kafka 版 Apache Kafka 弹性能力 秒级弹缩,业务...

Windows 系统内相关目录图标出现小黄锁

问题现象 有时在 ECS Windows 系统内发现相关目录或文件上会出现如下图所示小黄锁安全图标。问题分析 该问题出现的原因通常是由于 Windows 的系统数据保护机制导致。当用户对相应文件或文件夹取消共享,或做了一些其它方面的权限调整时,...

基础管理FAQ

为防止再次出现这类异常问题,建议您在删除文件系统实例前,先在操作系统中卸载文件系统,然后再删除文件系统。如果还开启了自动挂载配置,您还需要删除或修改自动挂载,取消开机自动挂载文件系统。具体操作,请参见 通过NAS控制台卸载挂载...

DDH生命周期

故障 稳定状态 DDH出现故障。您可以 提交工单 检查并处理问题。是 已过期 稳定状态 包年包月DDH到期时出现的状态。对DDH续费后,DDH的状态变为 运行中。续费详情,请参见 手动续费DDH。是 已释放 稳定状态 包年包月DDH过期后自动释放...

设计原则

在分布式系统中,需要考虑的稳定问题比较复杂,贯穿软件系统设计态、研发态、运维态、运行态,覆盖从IaaS、PaaS到上层SaaS系统,所有这些都可能影响系统稳定性。为了确保系统能够持续稳定地工作,建议遵循以下设计原则。面向失败的...

访问云虚拟主机上的网站提示“Internal Server Error...

说明 如果Linux操作系统云虚拟主机上安装了WordPress网站后,修改WordPress网站中主题的某些变量时,也会出现上述报错信息。Windows操作系统云虚拟主机:访问该主机上的网站时提示“Internal Server Error”相关报错,具体信息如下所示:...

执行计划管理

查询优化器的稳定性,对于数据库性能的稳定性和可预期性都非常重要,尤其是对于变更操作频繁的事务型数据库系统,统计信息经常会出现滞后或不准确的问题,此外一些优化器固有的限制也可能导致偏离最优的执行方式,通过Query Cache和Outline...

SSH服务未设置开机时自启动

在临时挂载的修复盘中,问题实例原有系统盘的文件系统会被挂载到某一临时目录下。您可以通过以下任一方式查看所在的临时目录信息:通过ECS控制台的实例健康诊断结果获取,对应的信息格式示例如下所示:/tmp/ecs-offline-diagnose_disk-bp19...

出错提示“Use of NFS detected.Upgrade can't ...

在操作系统迁移过程中,会涉及到安装Anolis OS或Alibaba Linux的驱动以及软件包,因此不保证网络在迁移过程中能正常使用,如果此时系统挂载NFS文件系统或通过NFS访问远端文件,那么可能会出现一些不可预估的错误。解决方案 取消挂载NFS,在...

【通知】Lettuce客户端升级建议

修复与优化 Lettuce 6.3.0.RELEASE版本已修复客户端在多次请求超时后不再自动重连的问题,更多关于该问题的背景、复现方法与解决方案等信息,请参见 为什么Lettuce带来更长的故障时间?版本建议 若依赖为Lettuce:请直接升级到6.3.0....

自助诊断系统

由于存在未支付订单时不能升级配置,因此会出现 错误提示,您可以利用自主诊断系统排查错误原因。有关如何正确升级实例配置,请参见 包年包月实例升级配置。步骤一:提交自动诊断 完成以下操作,提交自动诊断:登录 ECS管理控制台。在左侧...

强弱依赖治理概述

通过以上对比可以看出,当下游依赖出现问题时,当前系统会受到一些影响,严重影响用户体验的是强依赖,影响较小的则是弱依赖。强弱依赖治理 强弱依赖治理就是提前发现因为依赖问题可能导致的故障,避免依赖故障影响用户体验,积累数据持续...

版本说明

修复问题 解决非阿里云主机的操作系统Windows Server 2012及以下版本缺少某些动态链接库的问题。3.4.8 分类 说明 发布时间 2020-11-17 新特性 无 修复问题 解决可用性监控无法正确解析URL的问题。3.4.7 分类 说明 发布时间 2020-07-27 新...

如何解决实例迁移后的宕机问题

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

查看并管理治理工作台

您可以在治理工作台查看数据质量在校验过程中的出错情况及针对该质量校验问题发起整改、忽略、通知等治理操作,从而实现资产质量从制定计划到实现整改的PDCA完整流程,有效提升数据质量。本文为您介绍如何查看并管理治理工作台。权限说明 ...

查看并管理治理工作台

您可以在治理工作台查看数据质量在校验过程中的出错情况及针对该质量校验问题发起整改、忽略、通知等治理操作,从而实现资产质量从制定计划到实现整改的PDCA完整流程,有效提升数据质量。本文为您介绍如何查看并管理治理工作台。权限说明 ...

性能优化与诊断简介

在RDS PostgreSQL日常运维中,您可以通过数据库自治服务DAS(Database Autonomy ...存储自动扩容 当数据库实例的已使用存储空间大于等于设置的扩容阈值时,系统会进行自动扩容,保障您的业务稳定运行。相关文档 什么是数据库自治服务DAS

Linux系统的ECS实例运行卡顿,在/var/log/messages...

系统内核问题:当系统内核存在漏洞或者其他问题时,可能会出现hung task故障系统资源紧张:ECS实例中应用或进程占用系统资源使用率(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
阿里邮箱 负载均衡 商标服务 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用