节点诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。基于专家经验和AI智能诊断两种诊断模式,节点诊断可以深入定位问题根因。节点诊断包括诊断检查项和诊断根因。诊断检查项:包括Node检查、...

实例内第三方软件安装与配置问题

Linux系统软件源配置问题 说明 进入 阿里云官方镜像站,找到所需的Linux系统,查看对应的源配置说明。您可以 通过脚本文件自动更新Linux实例中的软件源。CentOS 6与CentOS 8操作系统版本结束了生命周期(EOL),按照社区规则,CentOS 6/8的...

实例健康诊断

实例健康诊断功能可以对 轻量应用服务器 实例的计算服务状态、网络服务、存储服务和配置管理等进行全方位的诊断,帮助您了解实例的健康状态,及时发现并解决常见的问题。前提条件 轻量应用服务器...轻量应用服务器故障问题,请参见 故障排除

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

DescribeExcludeSystemPath-查询防勒索系统排除目录

查询防勒索系统排除目录。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中...

增量迁移源服务器

常见错误及修复方案,请参见 故障排除 和 常见问题。相关操作 在增量迁移的过程中,您可以执行下列操作:暂停增量迁移任务。具体操作步骤如下:说明 仅当增量迁移任务状态为 同步中 或 等待中 时,您才可以暂停该任务。在 迁移任务 页面,...

云盘异步复制容灾常见问题

请在故障切换后参考 配置辅助弹性网卡 检查和配置容灾端网卡,确保网络正常工作。多网卡存在限制如下:ECS实例在绑定辅助弹性网卡后,部分镜像无法自动识别辅助弹性网卡的IP地址并添加路由,导致无法正常使用辅助弹性网卡。若ECS实例配置了...

ECS容灾常见问题

请在故障切换后参考 配置辅助弹性网卡 检查和配置容灾端网卡,确保网络正常工作。多网卡存在限制如下:ECS实例在绑定辅助弹性网卡后,部分镜像无法自动识别辅助弹性网卡的IP地址并添加路由,导致无法正常使用辅助弹性网卡。若ECS实例配置了...

ECS容灾常见问题

请在故障切换后参考 配置辅助弹性网卡 检查和配置容灾端网卡,确保网络正常工作。多网卡存在限制如下:ECS实例在绑定辅助弹性网卡后,部分镜像无法自动识别辅助弹性网卡的IP地址并添加路由,导致无法正常使用辅助弹性网卡。若ECS实例配置了...

访问策略

概述 访问策略是针对用户配置相应的访问策略,在此环节...注意:如未设置备用地址池,则代表当默认地址池出现故障时,系统将摘除故障地址,但不支持智能切换。如默认地址池摘除故障地址后,还有存活的IP地址,那么则响应剩余存活的IP地址。

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

BUG:soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

通过SMC客户端导入迁移源

常见问题及修复方案的更多信息,请参见 SMC FAQ 和 故障排除。使用sudo权限:sudo./go2aliyun_client-abort sudo./go2aliyun_client 使用root权限:./go2aliyun_client-abort./go2aliyun_client 后续步骤 导入迁移源后,您需要创建并启动...

导入迁移源概述

迁移源概指待迁移IDC服务器、虚拟机、其他云平台的云主机或其他类型的服务器。本文主要介绍迁移场景及其导入迁移源的方式对比。...常见问题及修复方案的更多信息,请参见 SMC FAQ 和 故障排除。SMC提供多种技术支持渠道,请参见 联系我们。

Linux系统的ECS实例运行卡顿,在/var/log/messages...

问题原因 在Linux系统的ECS实例中,当某个进程因为某种原因无法继续执行,并且长时间停滞在某个状态下无法响应,就会发生挂起任务(hung task)故障,出现hung task故障可能原因如下:进程卡住(blocked):当某个进程在执行过程中出现死锁...

什么是消息演练

定位故障根源:经过消息演练之后,积累了消息系统的处理经验,对于未来的系统诊断定位有参考和提升作用。消息的演练场景 消息服务通常是由不同的模块组成。例如,RocketMQ分为生产者Producer、消费者Consumer、服务集群Broker和注册中心...

业务连续性

阿里云的客户需要负责业务系统的架构设计合理性,确保能在必要时实现故障转移,保障业务连续不中断。建议您根据本文介绍的相关方案,来建设您的边缘计算应用的业务连续性能力。最佳实践 多实例容灾 为了确保高可用,应用必须能处理高负载、...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

故障演练

应急组织流程、止损预案验证 故障演练实践参考 阿里巴巴集团借助混沌工程实现了无损演练和有损演练的常态化执行,缩短建设大规模演练实施的进程、加速演练执行效率,让业务更聚焦在架构/流程风险识别与系统优化/容灾能力建设上,保障混沌...

实时分析链路数据

如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障...

什么是容器报警演练

不同于其他故障演练模块对系统注入真实故障,报警演练只会对集群的API Server投递事件,由事件触发报警链路,不会对系统造成真实故障。无侵入。无需在用户集群中安装探针以注入故障,所有事件投递都是通过API Server来进行网络请求。

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

通过CADT实现NLB可用区级容灾演练

云速搭CADT(Cloud Architect Design Tools)容灾管理服务提供规划、部署、演练高可用业务的能力,在业务上线前及业务上线后定期进行容灾演练,验证系统是否能够抵御资源故障或者可用区故障,保障系统健壮性。本文为您介绍如何通过CADT实现...

跨地域容灾

生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。本文介绍跨地域容灾的操作步骤。前提条件 在实现跨地域容灾之前,您需要选择一个不同于...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

SAP HANA 操作指南

这样当遇到意外的系统故障时,你可以从容恢复你的数据。附录:如何创建 NAT 网关 NAT 网关(NAT Gateway)是一款企业级的 VPC 公网网关,提供 NAT 代理(SNAT、DNAT)、10Gbps 级别的转发能力、以及跨可用区的容灾能力。NAT 网关与共享带宽...

步骤七:故障切换

数据同步后切换 正向保护-故障切换 请参考以下步骤进行正向保护故障切换操作。登录 云备份Cloud Backup控制台。在左侧导航栏,选择 容灾>ECS容灾。在概览页面,单击 云盘异步复制型容灾。在 容灾站点对 页面,单击目标容灾站点对,选择 ...

故障管理

在IT和互联网企业的实践中,以下情况都有可能造成故障:按计划进行的硬件、操作系统维护所引起的故障,包括更换硬盘、操作系统补丁。应用性故障,包括软件应用性能问题、应用缺陷(bug)、系统应用变更。人为操作故障:包括误操作以及不按...

备份本地文件

排除系统目录 打开 排除系统目录 开关,表示不对系统目录进行备份。备份文件类型 选择 全部类型 或 指定类型。若您选择了 指定类型,需要在 选择文件类型 框中指定要备份的文件类型。备份文件路径 仅当打开 高级规则模式 开关并 指定目录 ...

管理集群

主机故障处理策略 设置主机故障系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 设置主机故障系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

企业单AZ架构升级到多AZ

多可用区部署的常见应用:关键业务系统:对于需要高可用性和连续性的关键业务系统,如金融服务、医疗保健和电子商务平台,多AZ部署可以确保系统即使在一个数据中心发生故障的情况下也能继续运行。容灾要求高的场景:当组织需要符合特定的...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

备份ECS文件

排除系统目录 打开 排除系统目录 开关,表示不对系统目录进行备份。备份文件类型 选择 全部类型 或 指定类型。若您选择了 全部类型,则备份所有文件类型。若您选择了 指定类型,需要在 选择文件类型 框中指定要备份的文件类型。备份策略 从...

概述

但随着各公司业务范围的扩展和软件系统架构持续迭代升级,系统的复杂度随之增加,面对更多的非预期事件风险,如各类软硬件故障、错误的变更、突发流量,甚至到光纤挖断、自然灾害等引起的整个机房不可用情况,如何保障系统稳定性具有很大...

步骤七:故障切换

数据同步后切换 正向保护-故障切换 请参考以下步骤进行正向保护故障切换操作。登录 混合云容灾管理控制台。在左侧导航栏,单击 云盘异步复制容灾。在 容灾站点对 页面,单击目标容灾站点对,选择 保护组。在 保护组 页签,在目标保护组的...

常见问题

5.java sdk异常 5.1 gson版本过低问题 dashscope要求gson版本至少为2.8.9,如果用低版本会出下面的异常:Caused by:java.lang.ClassNotFoundException:com.google.gson.ToNumberStrategy 您可以通过排除系统依赖的低版本gson解决问题,步骤...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
文件存储 CPFS 数据库自治服务 负载均衡 云安全中心 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用