灾备规划

云上容灾 为减少因应用故障导致的业务损失,当数据中心出现严重故障无法快速恢复时,混合云容灾服务可以高效地在ECS上快速恢复您的应用。RTO和RPO要求 应用容灾有两个核心的指标:RPO:指应用发生故障时可以容忍的数据丢失量。数据越重要,...

消费进度管理

消息被指定消费者消费过一次后,如果业务出现异常需要做故障恢复,该消息能否被重新消费?消费进度原理 消息位点(Offset)参考 云消息队列 RocketMQ 版 主题 和 队列 的定义,消息是按到达服务端的先后顺序存储在指定主题的多个队列中,...

定时/延时消息

定时/延时消息为 云消息队列 RocketMQ 版 中的高级特性消息,本文为您介绍定时/延时消息的应用场景、功能原理、使用限制、使用方法和使用建议。应用场景 说明 定时消息和延时消息本质相同,都是服务端根据消息设置的定时时间在某一固定时刻...

计费概述

申请协助服务 阿里云提供工作日内09:00~18:00的证书申请协助服务,帮助您快速签发SSL证书,包括排查证书审核出现问题、加快CA中心证书签发速度等服务。部署服务 阿里云提供工作日内09:00~18:00的证书部署服务,帮助您解决部署问题,快速...

发现和排查实例问题

请确保在 消息中心 开启接收ECS到期通知、产品运维通知、ECS故障通知等消息相关的站内信,否则在ECS管理控制台将不能收到系统事件,设置页面如下图所示。关注实例运行指标 阿里云收集并展示实例运行指标,供您了解实例的实时和历史运行情况...

ResetConsumeOffset-重置消费位点

当消费者出现故障或者消费错误数据时,您可通过重置消费位点将消费位置回滚到之前的某个位点重新开始消费,您也可以将消费位置移动至最新位点,暂时不处理堆积的消息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的...

现代IM系统中的消息系统—架构

消息会由端发出,通常消息体中携带消息ID(用于去重)、逻辑时间戳(用于排序)、消息类型(控制消息、图片消息或者文本消息等)、消息体等内容。消息会先写入消息队列,作为底层存储的一个临时缓冲区。消息队列中的消息会消息处理...

使用阿里云管理控制台

在阿里云管理控制台顶部导航栏中,单击消息中心图标,进入 消息中心 页面。单击左侧菜单中的 消息接收管理。系统列出所有的消息类型以及对应的接收人和接收方式。修改各类消息的接收方式,包括邮箱和短信。系统默认的消息接收人为账号联系...

常见问题

本文汇总了使用多活容灾时的常见问题。MSHA基础常见问题 什么是...同城多活单元格流量切零后,企业版RocketMQ的ons.log中为什么会出现日志brokerName=msha_mock_queueBrokerName?异地多活如何查看MSHA-agent是否从HTTP流量中提取出了路由标?

回切至本地物理机

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到用户本地数据中心的物理服务器上。前提条件 服务器已进入实时复制状态。更多信息,请参见 启动复制。背景信息 目前阿里云的混合...

消息队列Kafka版删除Group后仍然收到消息堆积的告警...

问题描述 使用阿里云消息队列Kafka版时,删除Group后,仍然收到消息堆积的告警信息,如何过滤某个Group的消费堆积告警...相关文档 为什么Group不存在但能消费消息 消息堆积了怎么办 使用消息队列Kafka版时出现消息堆积 适用于 消息队列Kafka版

基本概念

但是会出现部分分区发送消息失败的情况,等到宕机机器重新上线后即可恢复正常。更多信息,请参见 存储引擎对比。Connector 云消息队列 Kafka 版 的组件,用于 云消息队列 Kafka 版 和其他阿里云服务之间的数据同步。更多信息,请参见 ...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

发布者最佳实践

本文介绍 云消息队列 Kafka 版 发布者的最佳实践,帮助您降低发送消息的错误率。本文最佳实践基于Java客户端。对于其他语言的客户端,其基本概念与思想是相通的,但实现细节可能存在差异。发送消息 发送消息的示例代码如下:Future...

集群管理FAQ

当Kubernetes集群出现问题或者节点异常时,您可通过容器服务ACK提供的一键故障诊断功能,辅助您定位集群中出现问题,详情请参见 使用集群诊断。如果集群诊断功能无法满足需求,您需要分别在Master节点和异常的Worker节点上收集Kubernetes...

主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...

主备切换

但在切换过程中,会出现以下情况:执行切换的数据节点将出现秒级的连接闪断,可能还会出现30秒内的只读状态。在实例处于 切换中 状态时,将无法执行实例级别的操作(例如变更配置、迁移可用区等)。当实例完成主备切换后,实例状态会显示为...

死信消息

消息消费异常时自动进行消费重试,达到最大重试次数后还未成功,则消息会转为死信状态。云消息队列 RocketMQ 版 支持将这些死信消息保存至指定Topic,方便后续进行业务恢复或回溯。本文介绍死信消息的应用场景、死信策略、使用限制、配置...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

更新记录

本文为您介绍ChatApp消息服务文档更新的最新动态,基于此您可以及时了解ChatApp消息服务的新增特性及功能变更。2023年11月更新记录 时间 特性 内容描述 2023.11.21 新增 控制台-目录管理,增加商品目录授权按钮用于授权Meta商品目录。控制...

如何快速测试云消息队列 Kafka 版服务端是否正常?

但是会出现部分分区发送消息失败,等到分区恢复后即可恢复正常。当 存储引擎 选择 Local 存储 时,默认选择 分区顺序消息。普通消息 日志清理策略 Topic日志的清理策略。当 存储引擎 选择 Local 存储(当前仅专业版实例支持选择存储引擎...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

充值常见问题

通过网银支付成功后,为什么收款方显示“支付宝(中国)网络技术有限公司”?网银支付接入的是支付宝的支付产品。支付宝为国内持有牌照的第三方支付公司,人行的监管规定,所有经支付宝支付提供的资金支付结算服务,都需先经过第三方支付在...

割接与上线

割接上线前的准备 应用的割接上线是整个应用上云迁移实施的最关键环节,这一环节出问题,可能造成重大故障。针对割接上线的重要性,我们建议在实施应用割接前,制定详细的割接前检查清单,这个清单的严谨程度很大程度上决定了割接成功率...

MQTT连接相关问题

发布QoS1数据时,偶尔会出现MQTT_PUSH_TO_LIST_ERROR(-42),如何解决?需要等待ACK的packet都会存放起来,等待ACK。存放量有上限,当需要等待的packet太多到达上限时,就会触发 MQTT_PUSH_TO_LIST_ERROR(-42)error。出现错误可能是因为当前...

连接问题

SDK的MQTT的Buffer默认为1024个字节,当接收的单次MQTT消息长度超过该值时,就会出现此错误。在SDK源码中搜索宏 CONFIG_MQTT_RX_MAXLEN 的值为所需的大小,可解决该问题。同理,如果发送消息时遇到该报错,您可以修改 CONFIG_MQTT_TX_...

0003-00000901

当在 消息中心 存在阿里云OSS欠费提醒后,请及时充值,否则影响您的正常使用。打开 消息中心,在右侧的 安全消息 中,请查看是否存在违规通知。如果因安全原因被禁,请根据实际情况处理。具体操作,请参见 Bucket被切入沙箱如何处理。...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...

概览

应用场景 在不同业务场景下,云资源实例的监控指标的数值水位、周期变化、方差波动等统计特点呈现不同状态,例如:您的流量日间大、夜间小,导致ECS实例或CDN域名的网关流量、消息队列任务堆积等监控指标出现日夜波峰和波谷;...

常见问题

无法访问/访问异常 CDN回源时网站出现5xx报错的排查方法 使用CDN加速后网站无法访问 地域节点获取CDN节点文件异常或访问域名失败 使用CDN加速后访问URL时出现空白页面 定位访问异常是CDN节点问题还是源站问题 开通海外节点后没有提高海外...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

产品优势

架构上难以支持万级的消息规模,消息上下行并发给系统带来巨大的冲击。无法做到削峰填谷,影响高峰时正常业务运行。安全性 等保2.0版(三级等保),提供多重防护,保障设备数据安全。接入层使用高防IP防止DDoS攻击。设备认证保障设备安全...

集群消费和广播消费

集群消费和广播消费是 云消息队列 RocketMQ 版 的基本消费模式,您可以在消费者客户端将消费模式设置为集群消费或者广播消费,用于控制同一条消息只能被集群内一个消费者消费到,还是被集群内每个消费者都消费到。背景信息 云消息队列 ...

普通消息

普通消息为 云消息队列 RocketMQ 版 中最基础的消息,区别于有特性的顺序消息、定时/延时消息和事务消息。本文为您介绍普通消息的应用场景、功能原理、使用方法和使用建议。应用场景 普通消息一般应用于微服务解耦、事件驱动、数据集成等...

控制台的常见问题

新创建的自定义属性,控制台界面却没有对应的组件 浮点读写属性对应的功能滚动组件,在功能定义设置了步长时,为什么面板上会出现不同的步长?产品发布 发布产品需要上架测试吗,并寄样品到阿里吗?产品量产之后撤销发布,已经销售的产品会...

事件通知常见问题

本文为您介绍事件通知常见问题。事件通知公共常见问题 如何从回调中获取HTTPS的URL用于播放?点播的HTTP回调和MNS回调,都不支持返回HTTPS的URL。如需要从回调中直接获取到HTTPS的URL用于视频播放,可参考下述步骤实现:为域名配置HTTPS...

常见网络问题

常见网络问题概览 问题 诊断工具检测 客户端日志 问题分析及排查方法 控制台显示 打开备份库失败 通过诊断工具检测,出现如下问题:i/o timeout An existing connection was forcibly closed by the remote host No connection could be ...

分布式链路概述

全链追踪:能够深入应用、服务、数据库、消息,捕获性能异常,识别出现故障的组件及服务。易于使用:可以与 SOFAStack 上的应用进行无缝对接,用户的业务代码无需任何修改即可轻松接入,实现性能可视化与问题分析。扩展性强:遵循业界 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 商标服务 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用