消费重试

消费者出现异常,云消息队列 RocketMQ 版 会根据消费重试策略重新投递该消息进行故障恢复。本文介绍消费重试的应用场景、原理机制、版本兼容性和使用建议。应用场景 云消息队列 RocketMQ 版 的消费重试主要解决的是业务处理逻辑失败导致的...

时延洞察

您可以通过该功能排查 Tair 数据库的故障和性能降低的原因。功能简介 原生Redis在2.8.13版引入时延监控(Latency Monitoring)特性,基于事件机制帮助您发现和排查可能的时延问题。该功能仅支持获取最近160秒的数据,且只存取每秒内时延...

虚拟机场景

本文列出了虚拟机常见的故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

混沌工程缓存实战系列-Redis

5 periodSeconds 探测时间间隔。2秒 successThreshold 连续成功几次算成功。2 url 需要探测的URL。http://www.example.com(购物车的查询地址)method GET或POST方法。GET 最终配置成如下完整演练流程:重要 在演练前需要确保业务系统处于...

云数据库RDS MySQL版主实例与只读实例之间存在复制...

解决方案 不同的问题原因对应的解决方案不同,请您先通过SQL洞察功能对故障发生时的所有SQL语句进行审计,检查是否存在上述几种情况。说明:更多有关SQL洞察的信息,例如如何开通SQL洞察以及如何使用SQL洞察,请参见 SQL洞察。如果存在上述...

TCP健康检查

检查间隔 选择每次TCP监控的时间间隔,默认每间隔1分钟执行一次检查,健康检查间隔最小支持15秒(面向旗舰版用户开放)。检查端口 检查目标IP地址上该端口是否可以进行Telnet,如果端口可以Telnet成功即为服务正常,如果端口Telnet失败,即...

Ping健康检查

检查间隔 选择每次Ping监控的时间间隔,默认每间隔1分钟执行Ping监控,健康检查间隔最小支持15秒(面向旗舰版用户开放)。Ping包数目 每次Ping监控,同时发出多少个PING数据包,用以计算PING的网络丢包率。可选值为:20、50、100。丢包率 ...

CLB健康检查FAQ

配置 推荐值 健康检查响应超时时间 10秒 健康检查间隔时间 5秒 健康检查健康阈值 3次 健康检查不健康阈值 3次 重要 此配置有利于您的服务和应用状态的尽快收敛。如果您有更高要求,可以适当地降低响应超时时间值,但必须优先保证服务在正常...

注意要点

mandatory 设置为true时,如果消息因为路由原因,未到达Queue,客户端添加的 ReturnListener 接口将会被调用。发送消息时,强烈建议自定义msgId,即消息的唯一标识。可用于消息查询、轨迹查询、以及故障排查时后台信息定位。消息发送时,...

HTTP(S)健康检查

运营商节点 武汉市联通、大连市联通、南京市联通、天津市联通、青岛市电信、长沙市电信、西安市电信、郑州市电信、深圳市移动、大连市移动、南京市移动 重要 如果地址池的地址均为阿里云地址,且使用黑洞策略进行故障测试,监控节点请选择...

Group Identity功能说明

ID_EXPELLEE_NEVER_HOT 该特性被启用后,正在被驱逐的任务在判断是否需要迁移至其他CPU时,不会因为热缓存的原因而造成拒绝迁移。用于帮助 ID_UNDERCLASS 任务尽快摆脱被驱逐的状态。NO_ID_EXPELLEE_NEVER_HOT:表示特性为关闭状态。ID_...

系统检查点或作业快照

配置间隔时间为3,最小间隔时间为5,这种情况下,间隔时间会调整为5。以两个场景进行说明,两个场景Checkpoint间隔时间为3分钟,超时时间为10分钟,最小间隔时间为5分钟。场景一:作业正常运行(Checkpoint每次都成功)12:00第一次开始执行...

ModbusV3协议接入说明

操作类型为“保持寄存器”系列和“输入寄存器”时,数据类型支持:int16、uint16、int32、uint32、int64、uint64、float、double、string、bool、custom、bits 比特位置 点位数据为采样数据的指定比特位置,数据类型为bits有效 寄存器个数 ...

使用Redis实现多地容灾的会话管理

业务案例 需求 因用户遍布全国,部署应用服务的地域需要间隔稍远,尽量使全国各地用户在访问业务时都能获得较理想的访问速度。如果应用服务发生单地故障,尽量不要影响用户的会话,因此需要在多地间同步数据,保持全局会话信息一致。结合...

常见网络问题

专线故障 VPN或云企业网故障 具体排查方法,请参见 请求失败排查方法。控制台显示 打开备份库失败 通过诊断工具检测,出现如下问题:This is usually a temporary error during hostname resolution and means that the local server did ...

基本概念

比特率表示经过编码(压缩)后的音、视频数据每秒钟需要用多少个比特来表示,而比特就是二进制里面最小的单位,要么是0,要么是1。与码率类似,比特率与音、视频压缩的关系,简单的说就是比特率越高,音、视频的质量就越好,但编码后的文件...

InvokeCommand-为一台或多台ECS实例触发一条云助手...

当因为进程原因、缺失模块、缺失云助手 Agent 等原因无法运行命令时,会出现超时现象。超时后,会强制终止命令进程。若不设置该值,会采用创建命令时指定的超时时间。该值只会作为该次命令执行的超时时间,不会改变命令本身的超时时间。60 ...

如何排查Java场景下故障注入不生效的问题

为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,您需要先确认该演练的故障执行步骤是否已开启Debug模式。若...

故障演练常见问题

故障不生效的原因较多,可能是参数配置不正确或无对应的请求命中,但故障规则已成功下发,故需要计费。刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主...

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障”错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

DeviceWanLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'productMethod':'created','language':'zh-CN',};

AccessGatewayFailover

告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。icmsDocProps={'productMethod':'created','language':'zh-CN',};

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

运维服务内容说明

因客户自身原因导致的问题故障,不属于阿里云运维服务范围。如客户有不定期现场服务需求,可按天购买运维专家现场服务。运维服务专家可帮助客户进行疑难问题现场处理,故障现场救援,变更现场保障、现场运维培训等服务。运维专家现场服务需...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

旧版告警设置

原因如下(以执行间隔为1分钟为例):数据写入日志服务到能够被查询到,这期间存在延时(一般少于3秒)。即使延时很低,也存在数据漏查的风险。例如告警执行时间为12:03:30,查询和分析的时间范围为相对一分钟,即[12:02:30,12:03:30),...

主从实例读写分离部署(共享存储)

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...

基于多集群实现跨地域容灾和流量负载均衡

服务网格 ASM为应用服务提供了跨地域流量分布和跨地域故障转移能力。跨地域流量分布功能可以将流量按照设定的权重路由至多个集群,实现多地域负载均衡。跨地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现跨...

基于多集群实现跨地域容灾和流量负载均衡

服务网格 ASM为应用服务提供了跨地域流量分布和跨地域故障转移能力。跨地域流量分布功能可以将流量按照设定的权重路由至多个集群,实现多地域负载均衡。跨地域故障转移功能可以在某地域服务发生故障时,将该地域流量转移至其他地域,实现跨...

故障取消

cancelReason Long Body 否 取消原因 取消原因 problemNotifyType Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 ...

故障排查

排查故障的经典步骤与常见原因 如何通过查看日志排查故障?ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

常见问题旧版索引

排查故障的经典步骤与常见原因 如何通过查看日志排查故障?产品FAQ 授权管理FAQ 集群管理FAQ 节点与节点池FAQ 容器网络FAQ Service FAQ Ingress FAQ DNS FAQ 应用FAQ 存储FAQ-CSI 存储FAQ-Flexvolume 容器安全FAQ 为什么可观测监控 ...
共有178条 < 1 2 3 4 ... 178 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用高可用服务 云数据库 OceanBase 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用