内核统一异常框架(UKFEF)

在运维过程中,您可以利用这些信息进行故障预测和实施运维操作,但由于这些信息分散在系统中的不同模块,且输出格式各异。因此,您在收集系统异常事件时可能面临以下问题:解析系统异常事件(例如异常事件的含义、可能造成的影响等)需要...

替换主机

您可以在 计划内事件 中查看本次故障信息。影响 系统会将主机设置为停止分配实例。迁移走本主机上所有实例。系统会保证把实例迁到可用的新主机上。在主机替换时,可能会有1~2次闪断,为避免对业务的影响,建议选择 在实例维护时间段切换。...

访问云虚拟主机上的网站提示“Internal Server Error...

说明 如果Linux操作系统云虚拟主机上安装了WordPress网站后,修改WordPress网站中主题的某些变量时,也会出现上述报错信息。Windows操作系统云虚拟主机:访问该主机上的网站时提示“Internal Server Error”相关报错,具体信息如下所示:...

查询指定地域内的物理专线

接口说明 默认情况下,系统会查询指定地域内所有物理专线的信息,您可以通过 DescribePhysicalConnections 接口为您提供的过滤选项查询指定物理专线的信息。系统支持的过滤选项,请参见本文 请求参数中 Key 的描述信息。调试 您可以在Open...

查询指定地域内的物理专线

接口说明 默认情况下,系统会查询指定地域内所有物理专线的信息,您可以通过 DescribePhysicalConnections 接口为您提供的过滤选项查询指定物理专线的信息。系统支持的过滤选项,请参见本文 请求参数中 Key 的描述信息。调试 您可以在Open...

设计方案

告警关联分析:在故障发生时,系统会自动产生告警信息。为了更好地定位故障原因,需要对各种告警信息进行关联分析。这样可以快速确定故障的范围和影响,并且能够帮助排查故障的根本原因。告警关联分析可以使用各种工具和算法,如事件关联...

ack-node-repairer

当节点出现故障时,自愈系统会自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD会修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

实例启动异常常见错误与对应解决方案

1671696280:Windows系统BCD配置异常或磁盘文件系统故障,导致系统启动失败 问题现象 通过VNC登录实例时,Windows系统启动失败,启动界面显示 Windows未能启动,原因可能是最近更改了硬件或软件 错误信息,且 状态 为 0xc0000001。...

数据质量治理

说明 订阅开关开启后,系统会把当前物理表最新的质量检测结果自动推送至 任务运维>全景监控 模块,在 监控任务管理 页面生成一条对应的质量监控任务。批量订阅 单击 模板下载,将模板下载至本地,并填写物理表名和云计算资源code。单击 ...

替换主机

您可以在 计划内事件 中查看本次故障信息。影响 执行替换主机操作会有如下影响:系统会将主机设置为停止分配实例。迁移走本主机上所有实例。系统会保证把实例迁到可用的新主机上。操作步骤 登录 云数据库专属集群控制台。在页面左上角,...

逻辑表

配置完逻辑库后,系统会自动解析逻辑库中符合条件的物理表,生成逻辑表,您也可以手动更新逻辑表。本文介绍生成逻辑表的规则和手动更新逻辑表的方法。前提条件 已配置逻辑库。更多信息,请参见 逻辑库。逻辑库中有多张表结构相同且表名前缀...

常见问题

如果您在使用云虚拟主机时遇到网站无法访问、网站访问异常(报错或者缓慢)、FTP使用异常、网站迁移异常、数据库使用问题、主机功能设置问题、耗资源/DDoS/大流量/升级或续费以及产品计费等问题,您可以参考本文方法进行问题排查。...

Linux系统的ECS实例运行卡顿,在/var/log/messages...

系统内核问题:当系统内核存在漏洞或者其他问题时,可能会出现hung task故障系统资源紧张:ECS实例中应用或进程占用系统资源使用率(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考...

PTS压测快速入门

演练阶段:在演练排查阶段,您需要对系统进行故障演练,进而发现并验证系统问题,锻炼系统及相关人员的应急能力,阿里云提供了 故障演练 平台帮助您演练预案。更多信息,请参见 什么故障演练。容灾阶段:在容灾防护阶段,您需要构建系统...

主机健康诊断

文件系统读写检测 文件无法正常读写 您可以尝试在主机上创建文件,如果出现 No space left on device…的报错信息一般是如下问题导致:磁盘分区空间使用率过高。磁盘分区inode使用率过高。存在僵尸文件(已删除文件因句柄被占用未释放,...

响应云盒维修事件

流程说明 运行中的ECS实例出现故障风险时,向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知后,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机...

强弱依赖治理概述

通过以上对比可以看出,当下游依赖出现问题时,当前系统会受到一些影响,严重影响用户体验的是强依赖,影响较小的则是弱依赖。强弱依赖治理 强弱依赖治理就是提前发现因为依赖问题可能导致的故障,避免依赖故障影响用户体验,积累数据持续...

回切至本地物理

如果扩充的是包含系统分区的磁盘,那么扩充的这部分空间会被ECS自动填充给系统分区,这样在恢复到本地的物理机时可能会出现分区越界的问题。如果系统分区相对源端机器被扩容,将会收缩相应的空间,确保和源端机器保持一致。反向注册。确认...

监控与日志

通过应用分组进行资源分类后,云产品产生的系统事件自动与组中资源关联,帮助您集成各类监控信息,方便您在业务故障时,快速分析并定位问题。云监控同时还为您提供事件的报警功能,您可以根据事件等级配置报警,通过 短信、邮件、钉钉...

DDH生命周期

是 故障 稳定状态 DDH出现故障。您可以 提交工单 检查并处理问题。是 已过期 稳定状态 包年包月DDH到期时出现的状态。对DDH续费后,DDH的状态变为 运行中。续费详情,请参见 手动续费DDH。是 已释放 稳定状态 包年包月DDH过期后自动释放...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

标准版-双副本

当主节点出现故障,自研的HA系统会自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

围绕混沌工程的平台实践

基于监控指标的自动恢复,如果指标触发了恢复规则,系统会自动执行演练恢复操作。基于演练时长的自动恢复。更多信息 关于AHAS Chaos的更多信息,请参见 Chaos Engineering的历史、原则以及实践 和 混沌工程实践经验:如何让系统在生产环境...

云数据库MongoDB产品架构

本文详细介绍云数据库MongoDB的...在线迁移系统 当实例所运行的物理出现故障,在线迁移系统会根据备份系统中的备份文件重新搭建实例,保障业务不受影响。详情请参见 数据迁移和同步方案概览。产品架构 单节点架构 副本集架构 分片集群架构

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现故障 ...

PolarDB MySQL版8.0.1版本发布日志

修复RO节点的物理出现故障时,RW节点在特殊情况下未将其复制关系中断,而引发RW节点刷脏受阻的问题。修复HA后,因表数量过多而引发table cache淘汰导致Autoinc回退的问题。修复多主集群缓存中心重启情况下,读写节点可能无法启动的问题。...

签署代付协议

被委托人(丙方)签署 乙方(委托方)签署完成后,系统会根据创建代付协议时填写的信息,给丙方(被委托方)的联系电话发送待签署短信。丙方点击链接,依据提示,进行代付协议的签署,流程参照“乙方(委托方)签署”流程。乙方(委托方)...

管理MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

标准架构

当主节点出现故障,自研的HA系统会自动进行主从切换,保证业务平稳运行。数据可靠 默认开启数据持久化功能,数据全部落盘。支持数据备份功能,用户可以针对备份集回滚实例或者克隆实例,有效地解决数据误操作等问题。同时,在支持容灾的...

服务管控和治理

您可以对应用开启服务熔断功能,使有故障的服务端及时返回错误,并释放系统资源,提高用户体验和系统性能。更多信息,请参见 服务熔断。故障注入 您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测...

常见问题

产品常见问题 EMAS崩溃保护机制导致SDK无法初始化且功能不可用 阿里百川账号如何在阿里云平台使用 覆盖patch需要重启App生效吗 热修复支持多进程吗 后台上传补丁的时候出现,找不到补丁的情况 补丁发错了怎么办,是否有相应办法补救 针对同...

容灾预案

1.创建容灾预案 指用户创建一个容灾预案,可用于日常做容灾演练,或在应用服务出现故障时实现快速切换流量。2.容灾预案名称 指用户可以为创建的容灾预案输入一个易识别的名称,例如“故障演练测试”3.容灾预案备注 您可以根据创建的容灾...

进入Linux系统的单用户模式

在某些特殊场景下(例如排查Linux实例启动故障、修复系统异常、维护硬盘分区或root用户被锁定,需要修改密码),您可以通过Linux系统系统引导器...说明 您也可以通过卸载系统盘功能来排查启动故障问题,具体操作,请参见 卸载或挂载系统盘。

移植问题

本文介绍编译3.x和2.3.0版本的C Link SDK时,可能遇到的问题和解决方法。背景信息 如果您尚未接入物联网平台,推荐使用最新版本的SDK。更多信息,请参见 概述。在Linux系统编译SDK后,运行Demo时,为何出现如core dump等错误?SDK提供的HAL...

Windows系统内存分析工具介绍

如果已提交虚拟内存非常接近上限,那么系统会出现性能问题。Windows 2008 R2 打开任务管理器,单击 性能,通过任务管理器查看内存使用情况。还可以添加各类内存指标进行检查,打开任务管理器,依次选择 查看>选择列,添加各类内存指标,请...

V5.4.x系列实例版本说明

修复在只读实例上使用包含 auto_increment_increment 变量的命令会出现的NPE问题。修复GSI DDL任务恢复后可能会导致不同随机后缀物理表遗留的问题。修复DDL命令执行过程中偶发性的死锁问题。修复当使用CHECK TABLE检查单表时,系统只检查...

Pod诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

弹性加速计算实例FAQ

EAIS因为网络问题出现较大的延迟吗?我们选用了Resnet50、Inception4以及Bert模型进行了多次测试,相比常规的GPU实例几乎无延迟。为什么选择EAIS?与常规的异构实例相比,EAIS提供的异构实例具有解耦性、低成本、弹性和多适配性的优势。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 云安全中心 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用