公共云基础服务说明书

订阅支持 阿里云针对购买云产品的客户,将提供消息订阅基础支持,目前提供的消息种类主要包含产品消息、故障消息、服务消息、活动消息几大类,客户可根据需要登录阿里云官网进入 消息中心 设置订阅或查看消息。3.服务SLA 电话/官网在线咨询...

支持计划

4.9.3 订阅支持 阿里云针对购买云产品的客户,将免费提供消息订阅企业级支持,目前提供的消息种类主要包含产品消息、故障消息、服务消息、活动消息几大类,客户可根据需要登录阿里云官网进入 消息中心 设置订阅或查看消息。5.阿里云支持...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

消息发送重试和流控机制

消息发送重试机制 重试基本概念 云消息队列 RocketMQ 版 客户端连接服务端发起消息发送请求时,可能会因为网络故障服务异常等原因导致调用失败。为保证消息的可靠性,云消息队列 RocketMQ 版 在客户端SDK中内置请求重试逻辑,尝试通过重...

常见问题

运维管理 容器应用服务常见问题 经典应用服务常见问题 中间件 SOFABoot 常见问题 微服务常见问题 微服务故障排查之 DRM 微服务故障排查之限流 微服务故障排查之 RPC 服务网格-故障排查 消息队列常见问题 任务调度常见问题 分布式链路跟踪...

附录:SOFAStack 产品目录

上游应用作为生产方,将比较耗时且不需要即时(同步)返回结果的操作作为消息放入消息队列;下游应用作为消费者进行消息订阅和消费。只要保证消息格式不变,消息的发送方和接收方并不需要直接连接,任何一方的系统故障都不会对其他应用产生...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

容灾恢复

解决了服务故障持续影响业务的问题,避免了雪崩效应,提高系统可用率。功能原理 单机故障剔除会统计一个时间窗口内的调用次数和异常次数,并计算每个服务对应 IP 的异常率和该服务的平均异常率。当 IP 的异常率大于服务平均异常率,且达到...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

产品高可用

CLB系统的高可用 负载均衡实例采用集群部署,可实现会话同步,以消除服务器单点故障,提升冗余,保证服务的稳定性。其中四层负载均衡通过LVS(Linux Virtual Server)+keepalived的方式实现,七层负载均衡通过Tengine(淘宝网发起的Web...

什么是数据库自治服务DAS

解决方案 数据库自治服务DAS(Database Autonomy Service)是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助用户消除数据库管理的复杂性及人工操作引发的服务故障,有效保障数据库服务的稳定...

ack-node-repairer

您可对某个自愈功能进行开关和配置,以下以NTP服务故障为例。查看default-node-repairer资源的YAML文件。在安装ACK自愈系统后,集群会默认在kube-system命名空间下创建类型为noderepairers.nodes.alibabacloud.com,名为default-node-...

使用Kubernetes事件中心监控GPU异常

GPU设备在使用中,容易发生一些Xid错误,可以配合Kubernetes事件中心,对这些Xid错误进行监控告警,及时发现并定位故障原因。操作步骤 进入日志服务 K8s事件中心 页面。具体操作步骤,请参见 创建并使用Kubernetes事件中心。在 K8s事件中心...

实例健康诊断

实例健康诊断功能可以对 轻量应用服务器 实例的计算服务状态、网络服务、存储服务和配置管理等进行全方位的诊断,帮助您了解实例的健康状态,及时发现并解决常见的问题。前提条件 轻量应用服务器 实例需处于 运行中 状态。操作场景 推荐您...

HarmonyOS SDK快速入门

7 服务错误 服务故障。请 提工单 申请联系技术支持。8 数据被丢弃 一般是设备时间与服务器时间不同步导致,SDK会自动重新发送。9 与服务器时间不同步 设备时间与服务器时间不同步,SDK会自动修复该问题。10 SDK销毁时,缓存数据还没有发出 ...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

云盒故障服务器维修流程

本文介绍当云盒内的服务器出现故障时,阿里云如何进行更换和维修,保证数据安全。背景信息 当云盒内的服务器出现故障,需要更换和维修时,出于客户成本考虑,云盒内没有部署数据擦除服务,阿里云不在客户现场进行数据擦除。重要 在您购买...

网络资源

DNS服务异常可能由多种原因引起,如DNS服务器故障、网络连接问题、配置错误等。DNS服务异常可能会造成域名解析失败,导致无法外部服务调用等,或导致服务不可用。常使用的容错策略如下:DNS缓存:在客户端或本地网络环境中设置DNS缓存,将...

注意要点

本文介绍使用开源的客户端SDK接入 云消息队列 RabbitMQ 版 服务端时的注意事项。要点 说明 com.rabbitmq.client.ConnectionFactory 接口 设置 com.rabbitmq.client.ConnectionFactory 接口时,必须开启连接自动恢复功能,保证服务端升级时...

阿里云产品服务协议(通用)

您对于服务的使用将优先消耗订购的资源包,除法定及双方另行约定外,如资源包中的各项服务使用完毕或者服务期限到期,且您未继续订购资源包服务但持续使用此项服务的,阿里云将视为您使用阿里云以后付费形式售卖的该服务(如有),阿里云将...

部署高可用及共享存储Web服务

随着业务规模的增长,数据请求和并发访问量增大、静态文件高频变更,企业需要搭建一个高可用和共享存储的网站架构,以确保网站服务能够7*24小时运行的同时,可保障数据一致性和共享性,并降低数据重复存储的成本。方案架构 方案提供的默认...

基于流量规则配置实现流量泳道和流量降级

在 无状态 页面的 操作 列,单击 mockb-v2 工作负载对应的 伸缩,在 伸缩 对话框,将 所需容器组数量 调整至 1,单击 确定,在 确认 对话框,单击 确定,模拟v2版本的mockb服务故障效果。执行以下命令,查看v2泳道的访问效果。for i in {1....

基于流量规则配置实现流量泳道和流量降级

在 无状态 页面的 操作 列,单击 mockb-v2 工作负载对应的 伸缩,在 伸缩 对话框,将 所需容器组数量 调整至 1,单击 确定,在 确认 对话框,单击 确定,模拟v2版本的mockb服务故障效果。执行以下命令,查看v2泳道的访问效果。for i in {1....

可观测概述

可观测性在云原生应用中扮演着非常重要的角色,它可以帮助我们实时监控服务的运行情况和性能指标,发现并解决服务故障和瓶颈,从而提高应用的可靠性和性能。阿里云服务网格ASM提供了统一标准化方式,为您提供一种收敛后的可观测数据生成与...

UpdateMeshFeature-更新服务网格的功能配置

{/当北京地域服务故障时,流量转移到杭州同服务。from:"cn-beijing",to:"cn-hangzhou",}]distribute:跨地域流量分布配置,例如:distribute:[/struct,跨地域流量分布配置。{/路由到北京地域的流量 70%分配到北京,30%分配到杭州。from":...

响应云盒维修事件

背景信息 配置云盒计算资源时,您需要配置一定的冗余资源或购买SLA服务包,以便在硬件故障时,可以迁移业务。关于如何更好地配置计算资源,请参见 云盒计算资源配置最佳实践。流程说明 运行中的ECS实例出现故障风险时,会向您发送ECS故障 ...

消息处理时长自适应

背景信息 消息服务MNS 的规范中,每条消息都有个默认的VisibilityTimeout,Worker在接收到消息后,Timeout就开始计时了。如果Worker在Timeout时间内没能处理完消息,那么消息就有可能被其他Worker接收到并处理。Timeout计时的好处在于消息...

消息存储和清理机制

消息在队列中的存储情况如下:消息存储管理粒度说明 云消息队列 RocketMQ 版 按照服务端节点粒度管理存储时长而非队列或主题,原因如下:消息存储优势权衡:云消息队列 RocketMQ 版 基于统一的物理日志队列和轻量化逻辑队列的二级组织方式...

消费重试

消费者出现异常,云消息队列 RocketMQ 版 会根据消费重试策略重新投递该消息进行故障恢复。本文介绍消费重试的应用场景、原理机制、版本兼容性和使用建议。应用场景 云消息队列 RocketMQ 版 的消费重试主要解决的是业务处理逻辑失败导致的...

云盒计算资源配置最佳实践

背景信息 云盒的硬件设计中,各类硬件设备的保障如下:网络设备:采用双机冗余双上连设计,确保云盒内网络的高连续性,且不存在单点故障。存储设备:可以 确保在两台存储服务器同时宕机的情况下,数据的安全可靠。计算设备:支持宕机迁移和...

如何确保在MNS中存储的数据的可靠性?

本文介绍阿里云如何确保 消息服务MNS 中数据可靠性。消息服务MNS 将所有队列和消息存储在阿里云高可靠、高可用的数据中心组成的网络中。所有消息冗余地存储在多台服务器上,当某台服务器出现问题时,冗余数据将会被自动拷贝至其他服务器;...

生产者负载均衡

消息服务能力的均衡性策略:了解生产者负载均衡策略,您可以知晓消息在不同节点间分配的规律,您可以按照负载策略针对性地设计流量迁移和水平扩缩容的方案。RoundRobin模式 使用范围 对于非顺序消息(普通消息、定时/延时消息、事务消息)...

故障协同处理(基于钉钉)

故障状态:展示故障实时状态变化,PC端和移动端故障状态保持一致,分为四个故障操作节点记录故障状态变换,方便用户查询操作记录。时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生、故障...

配置消息监控告警实现风险预警

背景信息 云消息队列 RocketMQ 版 提供全托管的消息服务,对于每个规格的实例都有明确的 SLA保障,您购买实例后即可保证消息收发TPS、消息存储等指标达到规格规定的能力。您无需担心实例性能问题,但实际生产环境中仍需要关注实际的业务...

开源RabbitMQ迁移上云

消息队列 RabbitMQ 版 采用了独创的架构设计,有效避免了因消息积压导致的内存泄漏和服务器故障等稳定性问题,并成功解决了分布式系统中的脑裂难题。此外,它还提供了高度的可伸缩性和灵活的按量计费模式,进一步增强了服务的弹性、降低...

通过可观测性能力进行故障处理最佳实践

设计思路 核心问题 运维场景下,故障处理的核心问题如下:服务出现异常如何预警并上报 出现异常问题如何快速定位 解决方案 云消息队列 RocketMQ 版 定义的Metrics、Tracing指标覆盖消息收发各阶段的状态信息、云消息队列 RocketMQ 版 服务...

配置消息监控告警实现风险预警

背景信息 云消息队列 RocketMQ 版 提供全托管的消息服务,对于每个规格的实例都有明确的 SLA保障,您购买实例后即可保证消息收发TPS、消息存储、网络吞吐等指标达到规格规定的能力。您无需担心实例性能问题,但实际生产环境中仍需要关注...

计费常见问题

本文汇总了 云消息队列 RocketMQ 版 计费的常见问题。每天扣除2元,这是什么费用?我昨天删除了Topic,为什么今天会收到账单并被扣费?我没有使用 云消息队列 RocketMQ 版 服务,为什么会扣费?我在控制台上看到没有开通 云消息队列 ...
共有114条 < 1 2 3 4 ... 114 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用高可用服务 云原生数据仓库AnalyticDB MySQL版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用