设备显示离线

本文介绍智能接入网关设备显示离线的原因和处理方法。问题现象 登录 智能接入网关控制台,查看设备状态为 离线。可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的...

智能压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

EasyCkpt:AI大模型高性能状态保存恢复

功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的功能特点:特点1:任务的故障是部分的。通常,故障的根因是一到两台机器的故障,这只会影响部分Worker。对于大规模分布式训练任务而言,不会所有...

事件列表

事件列表集中展现了Kubernetes事件,包括事件的级别、类型、对象、信息、原因和发生时间。Kubernetes事件(event)是一种对象(object),用于展示集群内发生的情况。...原因 该事件被记录的主要原因。信息 该事件的具体描述。

RDS MySQL的SQL审计查询记录返回0的原因

概述 本文主要介绍RDS MySQL的SQL审计查询记录返回0的原因。详细信息 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、RDS)等进行配置与数据修改...

可观测性的设计原则

日志记录 系统需要记录关键事件和故障,以帮助诊断问题和解决故障。对于一个系统来说,日志是非常重要的。它可以记录在系统中发生的一切,包括成功的操作、错误的操作、警告信息等等。因此,日志记录是可观测性设计中最基本的需求之一。...

故障演练常见问题

故障不生效的原因较多,可能是参数配置不正确或无对应的请求命中,但故障规则已成功下发,故需要计费。刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主...

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障”错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

DeviceWanLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'productMethod':'created','language':'zh-CN',};

AccessGatewayFailover

告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。icmsDocProps={'productMethod':'created','language':'zh-CN',};

CNAME解析常见问题

CNAME记录和MX记录冲突 您可以通过使用URL转发记录来解析CNAME记录和MX记录冲突问题。注意 URL转发前和转发后的域名都需要接入备案。URL转发配置请参考下表 解析记录配置。表 1.解析记录配置 记录类型 主机记录 解析线路 记录值 TTL URL@...

Dataphin资产元数据的分区记录数不准确

问题原因 资产这里分区记录数是T+1更新的。由于ds='20220420'分区是2022041才产出的,因此是没有采集到的。解决方案 待T+1后就会更新ds='20220420'分区的记录数和大小,记录数就可以恢复正常。适用于 Dataphin 独立部署v3.3

邮箱管理控制台中显示MX未解析

如果控制台中显示 MX未解析,可能的原因如下:解析记录冲突,请检查是否使用了主机记录为@的CNAME域名解析;域名刚注册,还在审核中;MX解析未配置;配置了多个不同服务商的MX记录;配置错域名,加到了二级域名上。解决方案 请根据实际情况...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

运维服务内容说明

因客户自身原因导致的问题故障,不属于阿里云运维服务范围。如客户有不定期现场服务需求,可按天购买运维专家现场服务。运维服务专家可帮助客户进行疑难问题现场处理,故障现场救援,变更现场保障、现场运维培训等服务。运维专家现场服务需...

短信发送FAQ

短信发送高延迟可能是以下原因:短信下发时终端处于异常状态(如关机、停机、空号、信号不好或者收件箱满等原因),未能及时应答网关导致的信息下发延迟。建议前往 短信服务控制台,发送记录查询 页面,找到该条短信,点击 号码状态诊断 ...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

云原生应用交付平台支持被审计的事件说明

ListEnvChangeRecordParams 查询某条局点记录的配置参数信息 ListEnvironmentChangeRecords 查询局点部署记录 ListEnvironmentChaosApplications 查询环境的故障演练应用列表 ListEnvironmentChaosExperiments 查询环境的故障演练列表 ...

智能解析调度不准问题

调度不准原因 当请求非默认线路下解析记录时:如果请求的解析记录类型为A,且对应线路下设置的解析记录中有AAAA记录但没有A记录,则返回的解析记录为空,不会造成解析调度不准确的情况。如果请求的解析记录类型为AAAA,且对应线路下设置的...

修改域名DNS解析设置

在某些极端情况下(例如节点故障、机房故障等),CNAME记录可以实现自动切换节点IP,甚至直接将解析切回源站,从而最大程度保证业务的稳定运行,提供高可用性和灾备能力。警告 WAF不支持使用A记录。为提升系统稳定性与安全性,WAF默认为接...

修改域名DNS解析设置

在某些极端情况下(例如节点故障、机房故障等),CNAME记录可以实现自动切换节点IP,甚至直接将解析切回源站,从而最大程度保证业务的稳定运行,提供高可用性和灾备能力。警告 WAF不支持使用A记录。为提升系统稳定性与安全性,WAF默认为接...

申请SSL证书出现审核失败的原因及处理方法

本文介绍申请SSL证书审核失败的可能原因及其解决方法。背景信息 不同的CA中心,SSL证书实际签发的时间可能有所不同,如果SSL证书申请提交很久之后,还是一直在审核中,具体解决方法,请参见 证书申请提交很久了,为什么还是审核中?和 免费...

InnoDB Physiological Logging

对于 INSERT、UPDATE 和 DELETE 等操作可以保证记录到页面级别,在故障恢复时,不需要重新执行Btree遍历找到页面就可以并行回放日志,从而加快故障恢复。PolarDB 针对当前InnoDB日志一些冗余的地方也做了改进。例如,增加了record长度信息...

故障取消

cancelReason Long Body 否 取消原因 取消原因 problemNotifyType Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 ...

故障排查

排查故障的经典步骤与常见原因 如何通过查看日志排查故障?ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的...

查看应用分组

创建应用分组后,您可以查看应用分组的组内资源、监控视图、故障列表、可用性监控等数据,并执行相关操作。通过应用分组集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

云原生应用交付平台的审计事件

操作审计记录了用户通过OpenAPI或控制台等方式操作云资源时产生的管控事件,云原生应用交付平台支持在操作审计中查询的事件如下表所示。事件名称 事件含义 AddEnvironmentNodes 创建环境节点信息。AddEnvironmentProductVersions 绑定环境...

常见问题旧版索引

排查故障的经典步骤与常见原因 如何通过查看日志排查故障?产品FAQ 授权管理FAQ 集群管理FAQ 节点与节点池FAQ 容器网络FAQ Service FAQ Ingress FAQ DNS FAQ 应用FAQ 存储FAQ-CSI 存储FAQ-Flexvolume 容器安全FAQ 为什么可观测监控 ...

ping不通云服务ECS(SAG-1000)

本文介绍SAG-1000设备无法ping通ECS实例的原因和处理方法。问题现象 终端无法连接到阿里云,例如ping不通同CEN的ECS。可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入...

CDN添加域名时DNS解析验证失败

问题原因 DNS解析异常,可能原因如下:TXT解析的记录值错误。TXT解析未生效。解决方案 在添加域名时,完成源站配置后,将进入验证页面,执行以下操作进行处理:在验证页面,单击 方法1:DNS解析验证,记录类型、主机记录记录值已经由系统...

无法连接到同一个云连接网内的本地客户端

本文介绍SAG-1000设备无法连接到同一个云连接网内的本地客户端的原因和处理方法。问题现象 SAG-1000设备无法连接到同一个云连接网内的其他本地客户端。可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标PC环境的网络故障。...

ping不通云服务(SAG-100WM)

可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请参见...

域名解析记录账号间转移

概述 出于某些原因,企业需要将域名解析记录从当前账号转移到其他账号下使用,针对此场景,云解析DNS产品为您提供域名解析记录账号间平滑转移的方案。说明 此应用场景只是将域名解析记录及其管理权转移至其他阿里云账号,域名管理权还在原...

更新记录

2023年11月更新记录 时间 特性 内容描述 2023.11.21 新增 控制台-目录管理,增加商品目录授权按钮用于授权Meta商品目录。控制台-回落规则,新增回落规则时回落类型为必选项。API接口新增 WhatsApp Flow相关接口。API接口新增号码二维码相关...

接入容器服务K8s版

AHAS架构感知提供了针对容器服务K8s环境的可视化展示能力,自动侦测容器环境包含的ECS主机、容器组、容器、进程和云服务等组件,绘制组件之间的拓扑关系,持续记录,跟踪变化。AHAS的故障演练提供了对容器演练的功能。本文介绍如何将探针接...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

产品简介

支持故障全生命周期管理,包括通知、处理、Timeline记录、改进、预防;报警、事件、故障全链路数据在线化管理,实现业务运营的可视化、在线化、智能化管理。升级策略 针对所有事件,按照不同优先级、影响程度,制定系列不同时间、通知策略...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 数据库审计 运维安全中心(堡垒机) 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用