Linux实例负载高问题排查和异常处理

内存使用率过高,可能会出现系统卡顿、内部服务响应速度变慢等问题。I/O使用率过高:一般来说,当前I/O读写≥该云盘I/O的80%时,定义为I/O使用率过高。I/O使用率过高,可能会出现文件读写变慢、应用性能下降或报错等问题问题排查 您可以...

界面提示“应急联系电话为必填项”时如何处理

如果您之前的备案信息没有填写应急联系电话,系统会出现上述弹窗提示,提示您的应急联系人信息不完善,需补充应急联系电话。排查处理 登录 阿里云ICP代备案管理系统,单击 主体详情,可以查看主体详细信息,鼠标放置到网站信息位置,网站...

修改运行作业日志级别

背景信息 系统支持的日志级别从低到高的顺序与下面表格内容中的前后顺序一致。级别 详情 TRACE 比DEBUG更细粒度的信息。DEBUG 系统运行状态的信息。INFO 重要或者您感兴趣的信息。WARN 系统可能会出现的潜在错误信息。ERROR 系统出现错误和...

内核统一异常框架(UKFEF)

在运维过程中,您可以利用这些信息进行故障预测和实施运维操作,但由于这些信息分散在系统中的不同模块,且输出格式各异。因此,您在收集系统异常事件时可能面临以下问题:解析系统异常事件(例如异常事件的含义、可能造成的影响等)需要...

替换主机

背景信息 当主机发生故障时,系统会通过短信通知您某台主机有故障待修复,同时对应的主机状态会显示为 待替换。您可以在 计划内事件 中查看本次故障信息。影响 系统会将主机设置为停止分配实例。迁移走本主机上所有实例。系统会保证把实例...

标准版-双副本

当主节点出现故障,自研的HA系统会自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

标准架构

当主节点出现故障,自研的HA系统会自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

访问云虚拟主机上的网站提示“Internal Server Error...

说明 如果Linux操作系统云虚拟主机上安装了WordPress网站后,修改WordPress网站中主题的某些变量时,也会出现上述报错信息。Windows操作系统云虚拟主机:访问该主机上的网站时提示“Internal Server Error”相关报错,具体信息如下所示:...

热线高级配置

概述 热线高级配置用于配置热线场景中的一些坐席配置。...应急配置 应急配置就是在热线系统出现问题时,可以一键将所有座机转为手机接听。聊天窗埋点测试 聊天窗埋点测试是用于检测客户在对接访客名片时,拼接的埋点聊天窗URL是否有问题

在使用阿里云服务的过程中我应该避免哪些操作?

6)重置以及更换系统务必要了解的事项 重置以及更换系统会导致被操作磁盘数据跟快照丢失并不可找回,如有重要数据一定要提前备份,谨慎操作。7)Linux系统下不能开启NetWorkManager服务 linux系统请不要开启NetWorkManager服务,该服务会跟...

PTS压测快速入门

演练阶段:在演练排查阶段,您需要对系统进行故障演练,进而发现并验证系统问题,锻炼系统及相关人员的应急能力,阿里云提供了 故障演练 平台帮助您演练预案。更多信息,请参见 什么故障演练。容灾阶段:在容灾防护阶段,您需要构建系统...

设计方案

告警关联分析:在故障发生时,系统会自动产生告警信息。为了更好地定位故障原因,需要对各种告警信息进行关联分析。这样可以快速确定故障的范围和影响,并且能够帮助排查故障的根本原因。告警关联分析可以使用各种工具和算法,如事件关联...

访问Windows IIS网站显示"503 Service Unavailable...

问题原因 一般出现该报错可以先从系统和应用层的日志查看是否有相关记录信息,原因可能有多种。解决方案 ISAPI筛选器加载的扩展项失败。检查ISAPI筛选器中的加载项不能正常加载。应用程序池启动失败,这个问题的原因较多。可能的情况如下。...

ack-node-repairer

当节点出现故障时,自愈系统会自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD会修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

常见问题

当DataWorks任务运行失败时,系统会向DataWorks智能监控中设置的报警接收人的手机号码和邮箱发送报警信息,如果手机号码和邮箱信息不正确,则系统会将报警信息发送到阿里云账号 基本接收管理 中设置的产品欠费、停服、即将释放等相关信息的...

实例启动异常常见错误与对应解决方案

1671696280:Windows系统BCD配置异常或磁盘文件系统故障,导致系统启动失败 问题现象 通过VNC登录实例时,Windows系统启动失败,启动界面显示 Windows未能启动,原因可能是最近更改了硬件或软件 错误信息,且 状态 为 0xc0000001。...

替换主机

背景信息 当主机发生故障时,系统会通过短信通知您某台主机有故障待修复,同时对应的主机状态会显示为 待替换。您可以在 计划内事件 中查看本次故障信息。影响 执行替换主机操作会有如下影响:系统会将主机设置为停止分配实例。迁移走本...

预案执行

预案执行时,系统会生成一个对应的预案执行单,记录预案的执行信息。查看应急预案执行单 登录高可用管理控制台。在左侧导航栏上,单击 应急预案>预案执行。选择 应急预案 页签。应急预案总览页面展示了当前环境的预案执行单总量、各种状态...

开启ASP详细错误信息

背景信息 网站程序通过FTP客户端上传到Windows云虚拟主机后,由于部署环境和权限等问题经常出现安装或访问失败,系统给出的报错信息不够详细。此时可通过开启ASP详细错误信息,对故障进行辅助定位或代码问题排查。报错类型通常如下两种:...

常见问题

如果您在使用云虚拟主机时遇到网站无法访问、网站访问异常(报错或者缓慢)、FTP使用异常、网站迁移异常、数据库使用问题、主机功能设置问题、耗资源/DDoS/大流量/升级或续费以及产品计费等问题,您可以参考本文方法进行问题排查。...

基础信息校验

常见问题 错误提示:该域名存在进行中的订单或此证件存在进行中的订单 错误提示:该域名对应的主体信息系统中已经存在 错误提示:此域名已存在备案 错误提示:此证件已存在备案信息 如何取消进行中的备案订单?更多常见问题请参见 基础...

Linux系统的ECS实例运行卡顿,在/var/log/messages...

系统内核问题:当系统内核存在漏洞或者其他问题时,可能会出现hung task故障系统资源紧张:ECS实例中应用或进程占用系统资源使用率(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考...

故障协同处理(基于钉钉)

本文主要介绍什么故障协同处理。云钉运维故障协同效果 功能概述 移动应用端(目前仅支持“钉钉”,以下功能说明均基于钉钉场景)支持接收故障消息提示和进行故障操作,且支持移动端操作管理故障,操作记录实时同步到 运维事件中心 控制台...

主机健康诊断

文件系统读写检测 文件无法正常读写 您可以尝试在主机上创建文件,如果出现 No space left on device…的报错信息一般是如下问题导致:磁盘分区空间使用率过高。磁盘分区inode使用率过高。存在僵尸文件(已删除文件因句柄被占用未释放,...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

监控与日志

您可以分别查看SSL服务端和SSL客户端的日志信息系统支持查看180天内SSL服务端和SSL客户端的日志信息,您一次可查看的日志周期最长为10分钟。具体操作,请参见 查看SSL-VPN连接日志。通过SSL-VPN连接日志排查问题,请参见 自主排查SSL-VPN...

强弱依赖治理概述

通过以上对比可以看出,当下游依赖出现问题时,当前系统会受到一些影响,严重影响用户体验的是强依赖,影响较小的则是弱依赖。强弱依赖治理 强弱依赖治理就是提前发现因为依赖问题可能导致的故障,避免依赖故障影响用户体验,积累数据持续...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

初始化小于等于2 TiB数据盘(Linux)

如果e2fsprogs版本低于1.42,会出现如下错误信息。mkfs.ext4:Size of device/dev/vdb too big to be expressed in 32 bits using a blocksize of 4096.您需要按以下方式安装高版本的e2fsprogs,例如本示例中使用的1.42.8。运行以下命令,...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现故障 ...

签署代付协议

发起签署时,为什么会出现“身份证号码和社会统一识别代码必须为18位”的提示?A:出现如图提示时,表明您这边前期在认证阿里云账号时,使用其他证件认证,导致系统未能识别您的实名认证信息以及社会统一识别代码等,需要您手动发起 工单...

管理MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

解决Windows实例中无法查看数据盘问题

磁盘显示为 外部 或 脱机 将Windows的系统更换到更高版本的系统后,可能会出现看不到数据盘的情况。在运行窗口输入 diskmgmt.msc 命令,运行磁盘管理,磁盘可能会显示为 外部 或 脱机。请参考如下步骤修复磁盘。显示为 外部 的磁盘,在磁盘...

添加NVR设备

更多设备信息 单击 更多设备信息系统跳转到 物联网平台控制台 上的 设备详情 页面,您可以查看该设备在云端的详细信息。更多说明,请参见 查看具体设备信息。诊断 设备状态 为 离线 时出现的功能按钮。单击 诊断 后,系统为您进行故障...

常见问题

产品常见问题 EMAS崩溃保护机制导致SDK无法初始化且功能不可用 阿里百川账号如何在阿里云平台使用 覆盖patch需要重启App生效吗 热修复支持多进程吗 后台上传补丁的时候出现,找不到补丁的情况 补丁发错了怎么办,是否有相应办法补救 针对同...

产品简介

应用场景 故障应急:当云产品出现影响可用性的事件时,用户可以通过“阿里云健康看板”及时查看相关信息,帮助用户了解事件的影响和处理进展,及时实施相应的应急预案,最大程度的降低业务影响。异常排查:当用户使用云产品过程中遇到了...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 云安全中心 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用