附录:SOFAStack 产品目录

上游应用作为生产方,将比较耗时且不需要即时(同步)返回结果的操作作为消息放入消息队列;下游应用作为消费者进行消息订阅和消费。只要保证消息格式不变,消息的发送方和接收方并不需要直接连接,任何一方的系统故障都不会对其他应用产生...

错误码

ERR-CODE:[PXC-4102][ERR_ATOM_GET_CONNECTION_FAILED_KNOWN_REASON]Get connection for db '*' failed because wait millis 5000,active 0,maxActive 5 说明:PolarDB-X 计算节点获取数据节点连接时出错,错误原因已经在ERR-CODE消息中给...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

消息发送重试和流控机制

消息发送重试机制 重试基本概念 云消息队列 RocketMQ 版 客户端连接服务端发起消息发送请求时,可能会因为网络故障、服务异常等原因导致调用失败。为保证消息的可靠性,云消息队列 RocketMQ 版 在客户端SDK中内置请求重试逻辑,尝试通过重...

产品简介

平台提供通讯录管理、即时通讯、音视频、消息触达、应用接入能力,支持专有云部署。助力解决三融五跨组织数字化协同、沟通和统一工作门户的问题。客户群体 金融行业:助力监管机构、银行、证券、保险行业企业构建专有的移动数字化协同体系...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

共享内存通信(SMC)常见问题

问题原因及解决方案 由于某些原因,导致应用创建的SMC连接回退到TCP,此时无法使用RDMA加速网络通信。详细的回退排查和解决方法,请参见 启用SMC后回退无法使用RDMA加速。应用的网络通信开销在整个应用中占比较小。例如应用是倾向于CPU密集...

Linux系统的ECS实例运行卡顿,在/var/log/messages...

问题原因 在Linux系统的ECS实例中,当某个进程因为某种原因无法继续执行,并且长时间停滞在某个状态下无法响应,就会发生挂起任务(hung task)故障,出现hung task故障可能原因如下:进程卡住(blocked):当某个进程在执行过程中出现死锁...

为什么消费客户端频繁出现Rebalance?

可能原因 可能导致故障原因包括:v0.10.2之前版本的客户端:Consumer没有独立线程维持心跳,而是把心跳维持与poll接口耦合在一起。其结果就是,如果用户消费出现卡顿,就会导致Consumer心跳超时,引发Rebalance。v0.10.2及之后版本的客户...

常见问题

运维管理 容器应用服务常见问题 经典应用服务常见问题 中间件 SOFABoot 常见问题 微服务常见问题 微服务故障排查之 DRM 微服务故障排查之限流 微服务故障排查之 RPC 服务网格-故障排查 消息队列常见问题 任务调度常见问题 分布式链路跟踪...

Redis客户端重连指南

引发暂时性故障原因 原因 说明 故障触发了高可用机制 云数据库Redis支持节点健康状态监测,当监测到实例中的主节点不可用时,会自动触发主备切换,例如将主节点和从节点进行互换,保障实例的高可用性。此时,客户端可能会遇到下列暂时性...

Tair客户端重连指南

引发暂时性故障原因 原因 说明 故障触发了高可用机制 云原生内存数据库Tair 支持节点健康状态监测,当监测到实例中的主节点不可用时,会自动触发主备切换,例如将主节点和从节点进行互换,保障实例的高可用性。此时,客户端可能会遇到...

产品简介

音视频通话可实现一对一通话及多人会议,通话过程中支持屏幕录制、屏幕共享、截图等功能,同时支持即时文字消息和文件传输。此外,支持实时语音识别,能够识别对端的语音确认,辅助本端判断对端的意向;点播功能可实现在视频通话过程中,...

功能发布记录

2.事件协同处理:开通维蜜后,企业内部运维群可实时接收运维事件和故障消息通知,目前己开通事件模块的详情和操作,包括事件编辑、转交、响应、完结。3.开放被拉取的人员权限,所有人员均可拉取其他人员。4.一次拉取人员上限为1000人。V1...

功能介绍

背景信息 在物联网边缘计算业务中,由边缘一体机分析的告警事件、设备故障消息,需要及时发送通知给特定的人员处理,避免出现安全风险或者业务停滞等情况。对此场景,物联网边缘计算研发了 智慧立方 钉钉小程序,您只需要配置小程序,...

Android 5.X 手机证书过期的问题

故障描述 在客户端出现如下日志。com.android.org.bouncycastle.jce.exception.ExtCertPathValidatorException: Could not validate certificate: Certificate expired at Sat No v 06 20:00:00 GMT+08:00 2021 (compared to Wed Jan 12 10...

采集客户端数据的高可用方案

但是在一些相对极端的场景下,单集群可能由于一些预期外原因存在故障停服风险。针对该单集群故障风险,日志服务提供两种异地多活的客户端数据采集方案。方案比较 对比项 方案1:双写 方案2:数据加工复制+写入切换 部署复杂度 低 需要额外...

创建压测场景

背景信息 MQTT 是专为移动互联网(Mobile Internet)、物联网(IoT)设计的超轻量级消息协议,用于连接移动端与云服务双向通信,广泛应用于各种应用领域,如端向云汇报状态、云向端推送消息、端向端发送消息即时聊天)等场景。...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

注意要点

mandatory 设置为true时,如果消息因为路由原因,未到达Queue,客户端添加的 ReturnListener 接口将会被调用。发送消息时,强烈建议自定义msgId,即消息的唯一标识。可用于消息查询、轨迹查询、以及故障排查时后台信息定位。消息发送时,...

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

生产者负载均衡

异常处理 当发送某条消息发送失败时,云消息队列 RocketMQ 版 会根据失败原因决定在接下来一段时间内,选择队列目标时跳过本地失败队列所在的节点,快速实现自适应的故障隔离。策略特点 RoundRobin模式的生产者负载均衡策略仅适用于无顺序...

查看消费者状态

如果消息消费出现异常,您可以在 云消息队列 RocketMQ 版 控制台查看指定Group ID的消费状态,包括消费者在线状态、订阅关系一致性结果、消费堆积相关指标、消费者客户端信息等,帮助您快速定位异常原因。应用场景 消费者状态信息包括在线...

常见问题列表

错误原因:Ubuntu的版本过低,导致调用make menuconfig出错 解决办法:将Ubuntu进行升级到16.04及以上 如何编译SDK能够减小二进制尺寸 请注意以下的编译选项在 CFLAGS 中能够起到的作用 选项 说明-Os 尺寸优化选项,GNU系列的工具链一般都会...

【已恢复】WhatsApp 消息发送异常公告

2024 年 4 月 4 日【更新】针对影响消息发送的故障的修复程序已部署完毕,截至新加坡标准时间 2024 年 4 月 4 日上午 4:45此问题已得到缓解。感谢您的耐心等待。WhatsApp Message Delivery Disruption Notice Due to an unexpected ...

云端运行日志

通过日志记录的消息内容、业务类型、操作类型和状态码等信息,可以了解设备状态、通信情况,并定位操作失败的原因,帮助您监控和管理设备,进行故障排查。本文介绍如何查看云端运行日志,以及相关错误码和排错方法。日志业务类型说明 上行...

消费重试

消费者出现异常,云消息队列 RocketMQ 版 会根据消费重试策略重新投递该消息进行故障恢复。本文介绍消费重试的应用场景、原理机制、版本兼容性和使用建议。应用场景 云消息队列 RocketMQ 版 的消费重试主要解决的是业务处理逻辑失败导致的...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

按量计费

0.01元/封 100封/日 即时通讯通知 钉钉/微信/飞书的消息通知费用,按通知次数收费。0.01元/次 100次/日 电话通知 报警/事件/故障等语音电话通知费用,按通知时长收费。说明:告警语音未拨通时,不会重复拨打,将以短信方式发送通知,语音未...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

概览

以及不同Group和Topic消息消费情况同样差异显著,使您难以设定一个通用的阈值适配不同业务下的消息队列监控,容易引发故障漏报或发现不及时等问题。智能阈值可以凭借自动化报警能力简化报警规则配置和维护成本,2分钟~3分钟快速发现异常,...

消息存储和清理机制

消息在队列中的存储情况如下:消息存储管理粒度说明 云消息队列 RocketMQ 版 按照服务端节点粒度管理存储时长而非队列或主题,原因如下:消息存储优势权衡:云消息队列 RocketMQ 版 基于统一的物理日志队列和轻量化逻辑队列的二级组织方式...

查询并配置计划内事件

为保证能够及时接收风险通知信息,请登录 消息中心,并完成以下操作:勾选 故障消息 中的 云数据库故障或运维通知 和 应急风险预警通知。设置消息接收人(推荐设置为数据库运维人员)。操作步骤 登录 Lindorm管理控制台。在左侧导航栏中,...

通过可观测性能力进行故障处理最佳实践

本文为您介绍如何将 云消息队列 RocketMQ 版 可观测性功能应用于 云消息队列 RocketMQ 版 的故障管理场景中,为您的日常运维和故障处理提供实践方案。设计思路 核心问题 运维场景下,故障处理的核心问题如下:服务出现异常如何预警并上报 ...

配置消息监控告警实现风险预警

背景信息 云消息队列 RocketMQ 版 提供全托管的消息服务,对于每个规格的实例都有明确的 SLA保障,您购买实例后即可保证消息收发TPS、消息存储等指标达到规格规定的能力。您无需担心实例性能问题,但实际生产环境中仍需要关注实际的业务...

MQ订阅消息

取值:新建:"New"处理中:"Processing"已取消:"Cancel"已完结:"Close"重新开启:"Reopen"消息内容 基站 离线 基站与云价签系统连接中断后触发消息,例如:门店网络故障或基站故障 {"EventCatgory":"DEVICE","Event":"DEVICE_OFFLINE",...

概述

再者云计算平台会提供冗余存储和备份能力,避免系统因为硬件故障或其他原因导致的停机或数据丢失。这种备份机制可以提高系统的可靠性。责任共担模型 阿里云平台提供高可用的基础设施,并提供应用稳定性相关工具体系。用户可以基于阿里云...
共有112条 < 1 2 3 4 ... 112 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云原生数据仓库AnalyticDB MySQL版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用