消费重试

例如,您预设消息处理耗时最多20 ms,但实际业务中20 ms内消息处理不完,您可以修改消息不可见时间,延长消息处理时间,避免消息触发重试机制。修改消息不可见时间需要满足以下条件:消息处理未超时 消息处理未提交消费状态 如下图所示,...

故障协同处理(基于钉钉)

云钉运维故障协同效果 功能概述 移动应用端(目前仅支持“钉钉”,以下功能说明均基于钉钉场景)支持接收故障消息提示和进行故障操作,且支持移动端操作管理故障,操作记录实时同步到 运维事件中心 控制台。故障协同处理使用条件 成功开通...

内容分割

背景信息 数据清洗功能提供常见消息处理模板,包括内容分割、动态路由、内容富化和内容映射等。您可以直接利用模板处理消息,也可以根据业务情况在模板基础上修改代码。消息数据清洗任务提供基本的算子能力,底层逻辑使用函数计算。支持...

内容映射

背景信息 数据清洗功能提供常见消息处理模板,包括内容分割、动态路由、内容富化和内容映射等。您可以直接利用模板处理消息,也可以根据业务情况在模板基础上修改代码。消息数据清洗任务提供基本的算子能力,底层逻辑使用函数计算。支持...

内容富化

背景信息 数据清洗功能提供常见消息处理模板,包括内容分割、动态路由、内容富化和内容映射等。您可以直接利用模板处理消息,也可以根据业务情况在模板基础上修改代码。消息数据清洗任务提供基本的算子能力,底层逻辑使用函数计算。支持...

动态路由

背景信息 数据清洗功能提供常见消息处理模板,包括内容分割、动态路由、内容富化和内容映射等。您可以直接利用模板处理消息,也可以根据业务情况在模板基础上修改代码。消息数据清洗任务提供基本的算子能力,底层逻辑使用函数计算。支持...

消息过滤

使用 云消息队列 RocketMQ 版 的消息过滤功能,可以帮助消费者更高效地过滤自己需要的消息集合,避免大量无效消息投递给消费者,降低下游系统处理压力。云消息队列 RocketMQ 版 主要解决的单个业务域即同一个主题内不同消息子集的过滤问题...

仪表盘

业务背景 云消息队列 RocketMQ 版 的消息收发流程中,队列的堆积情况、缓冲情况以及消息处理各关节的耗时等,会直接反映当前业务处理的性能和服务端运行的状态。因此,云消息队列 RocketMQ 版 的重点指标主要涉及以下业务场景。消息堆积...

常见问题

运维管理 容器应用服务常见问题 经典应用服务常见问题 中间件 SOFABoot 常见问题 微服务常见问题 微服务故障排查之 DRM 微服务故障排查之限流 微服务故障排查之 RPC 服务网格-故障排查 消息队列常见问题 任务调度常见问题 分布式链路跟踪...

什么是消息演练

定位故障根源:经过消息演练之后,积累了消息系统处理经验,对于未来的系统诊断定位有参考和提升作用。消息的演练场景 消息服务通常是由不同的模块组成。例如,RocketMQ分为生产者Producer、消费者Consumer、服务集群Broker和注册中心...

管理集群

主机故障处理策略 设置主机故障时系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

管理集群

主机故障处理策略 设置主机故障时系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

产品功能

消息队列分布式事务 在多次调用消息系统的场景中,通过 GTS,应用可轻松具备消息事务的处理能力。混合的分布式事务 GTS 可将各个资源加入事务范畴,实现同时跨服务、数据库、跨消息系统的事务处理能力。多种事务模式 提供了标准事务模式、...

定时/延时消息

消息队列 RocketMQ 版 定时消息的状态支持持久化存储,系统由于故障重启后,仍支持按照原来设置的定时时间触发消息投递。若存储系统异常重启,可能会导致定时消息投递出现一定延迟。使用示例 和普通消息相比,定时消费发送时,必须设置...

使用报警服务

查看目标报警规则的报警历史 您可以查看指定报警规则中的所有故障资源的报警详情和报警图表,及时定位并处理资源故障。使用阈值报警回调 云监控除了 电话、短信、邮件和WebHook的报警通知方式外,还可以使用报警回调方式,实现将云监控发送...

消息堆积和延迟问题

背景信息 消息处理流程中,如果客户端的消费速度跟不上服务端的发送速度,未处理的消息会越来越多,这部分消息就被称为堆积消息消息出现堆积进而会造成消息消费延迟。以下场景需要重点关注消息堆积和延迟的问题:业务系统上下游能力不...

迁移上云概述

消息收发无大量重复 保证迁移过程中不会出现大量的消息重复,业务方无需为迁移方案单独处理系统性重复消息消息收发无明显延迟 保证迁移过程中消息收发端到端延迟不会有明显变化,不会因迁移导致大量消息接收不到。方案设计原理 为满足...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

重置消费位点

使用场景 消费堆积快速清理:当下游消费系统性能不足或消费速度小于生产速度时,会产生大量堆积消息。若这部分堆积消息可以丢弃,您可以通过重置消费位点快速将消费位点更新到指定位置,绕过这部分堆积的消息,减少下游处理压力。业务回溯...

Maxwell

在很多情况下,利用这个特性非常的有用,例如:将增量数据从数据库同步到其他系统 日志审计 数据库的实时物化视图 数据库表的temporal join变更历史 Flink还支持将Flnk SQL中的INSERT、UPDATE或DELETE消息编码为Maxwell格式的JSON消息,...

API概览

当消费者出现故障或者消费错误数据时,您可通过重置消费位点将消费位置回滚到之前的某个位点重新开始消费,您也可以将消费位置移动至最新位点,暂时不处理堆积的消息。ListConsumerGroupSubscriptions 查询消费者组订阅关系列表 查询指定...

附录:SOFAStack 产品目录

只要保证消息格式不变,消息的发送方和接收方并不需要直接连接,任何一方的系统故障都不会对其他应用产生影响。分布式事务的数据一致性 应用解耦后还需要确保数据的最终一致性,利用消息队列事务消息消息的可靠传递机制,可以在实现系统...

主题(Topic)

错误拆分示例:拆分粒度过粗:会导致业务隔离性差,不利于独立运维和故障处理。例如,所有交易消息和物流消息都共用一个主题。拆分粒度过细:会消耗大量主题资源,造成系统负载过重。例如,按照用户ID区分,每个用户ID使用一个主题。单一...

基于Kubernetes容器集群的容灾架构与方案

在进行系统架构设计时,您必须考虑到信息系统和基础设施可能遇到的各种潜在威胁,例如:硬件故障、软件系统崩溃、人为操作失误、安全攻击、自然灾害等。为了确保系统能够在各种异常故障场景下快速恢复并保持业务连续性,您必须为系统设计...

支持计划

4.9.3 订阅支持 阿里云针对购买云产品的客户,将免费提供消息订阅企业级支持,目前提供的消息种类主要包含产品消息、故障消息、服务消息、活动消息几大类,客户可根据需要登录阿里云官网进入 消息中心 设置订阅或查看消息。5.阿里云支持...

事件分析概述

微服务领域:微服务在现代开发架构中比较常见,该架构由小型、松耦合、可独立部署的服务集合而成,这导致微服务架构很难调试,系统中某一部分的小故障可能会导致大规模服务崩溃。很多时候不得不跳过某些正常服务来调试单个请求。事件总线...

Exactly-Once投递语义

消息队列 RocketMQ 版 的Exactly-Once语义就是解决业务中最常见的一条消息的消费结果(消息在消费端计算处理的结果)在数据库系统中有且仅生效一次的问题。典型使用场景 在电商系统中,上游实时计算模块发布商品价格变更的信息,异步通知...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

计算资源

计算资源常指用于执行计算任务的软硬件资源,包括CPU、GPU、内存、操作系统和特定计算任务的软硬件环境等。计算资源的主要作用是执行各种计算任务,包括数据处理、算法运算、业务逻辑执行等。计算资源的性能和容量直接影响到系统的计算能力...

管理MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

产品架构

TSCompute 是负责时序数据实时计算的组件,重点解决监控领域常见的降采样转换和时间线聚合需求,通过Lindorm Stream进行数据订阅,并完全基于内存计算,所以,整体非常的轻量、高效,适合系统已预置的计算功能。针对部分灵活复杂的分析需求...

常见问题

本文列举了阿里云 表格存储 的常见问题,帮助您快速了解 表格存储。一般性常见问题 什么是 表格存储?表格存储 面向海量结构化数据提供Serverless表存储服务,同时针对物联网场景深度优化提供一站式的IoTstore解决方案。适用于海量账单、IM...

常见问题

本文汇总了 云数据库ClickHouse 的常见问题及解决方案。选型与购买 云数据库ClickHouse和官方版本对比多了哪些功能和特性?购买实例时,推荐选择哪一个版本?单双副本实例各有什么特点?购买链路资源时显示“当前区域资源不足”,应该如何...

管理运维事件

数据传输服务DTS(Data Transmission Service)支持运维事件报警功能,当系统检测到可能会导致DTS实例无法正常运行的风险时会触发相应的运维事件,并会通过控制台、短信、邮件或站内消息进行通知。您可以查看运维事件涉及的DTS实例信息、运...

常见问题

更多产品定价常见问题 挂载访问FAQ Linux挂载NFS文件系统常见问题 Windows挂载SMB文件系统常见问题 Linux挂载SMB文件系统常见问题 Windows挂载NFS文件系统常见问题 为什么卸载旧NAS并重新挂载新NAS后,容器Pod仍将数据写入旧NAS?...

创建MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...

创建集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...

创建集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...

应用场景

前端的监控系统和大数据处理系统会利用 TSDB 的数据查询和计算分析能力进行业务监控和分析结果的实时展现。电力化工及工业制造监控分析 传统电力化工以及工业制造行业需要通过实时的监控系统进行设备状态检测,故障发现以及业务趋势分析。...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云消息队列 RocketMQ 版 云消息队列 Kafka 版 对象存储 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用