消费重试

系统异常时处理中的消息状态如何恢复:帮助您了解当系统出现异常(宕机故障)等场景时,处理中的消息状态如何恢复,是否会出现状态不一致。消费重试策略 消费重试策略指消费者在消费某条消息失败后,消息重试的间隔时间和最大重试次数。...

容器版本说明

3.5.0 2018-09-10 51、71 3.5.0 升级eagleeye-core到1.7.4.8版本,修复Web应用URL请求中的中文参数值在应用中获取出现乱码的问题。升级HSF到2.2.6.7-edas版本,修复了通过Pandora QoS命令无法看到HSF服务列表的问题。去掉了ons-client插件...

容器版本说明

3.5.0 2018-09-10 51、71 3.5.0 升级eagleeye-core到1.7.4.8版本,修复Web应用URL请求中的中文参数值在应用中获取出现乱码的问题。升级HSF到2.2.6.7-edas版本,修复了通过Pandora QoS命令无法看到HSF服务列表的问题。去掉了ons-client插件...

消息发送重试和流控机制

若由于系统异常触发了SDK内置的重试逻辑,则服务端需要等待最终重试结果,可能导致消息发送请求链路阻塞。对于某些实时调用类场景,您需要合理评估每次调用请求的超时时间以及最大重试次数,避免影响全链路的耗时。最终异常兜底:云...

调用链采样配置最佳实践

基于重保角度考虑,特定时间段全采样 运维过程中也经常面临重大事件保障的场景,比如大促、新版本压测等,需要针对某一类标签的数据甚至全部应用开启全量数据采集和存储,以便出现问题或者故障时,可以快速定位,甚至影响审计和定责。...

微服务治理概述

无 消除变更过程中的风险 功能 使用场景 相关文档 相关视频 无损上线 在某些场景下,服务提供者需要接收大流量请求并成功返回,而刚启动的冷系统直接处理大量请求,可能由于应用内部资源初始化不彻底从而出现请求阻塞、报错等问题。...

阻塞

说明 将鼠标移动到SQL语句上,在SQL语句的右边会出现 图标,单击该图标即可复制该SQL语句。时间:阻塞发生的时间。数据库名:发生阻塞的数据库名称。单击某一行的任意位置,可在页面下方查看该行对应的阻塞关系图。阻塞关系图 展示阻塞的...

阻塞

说明 将鼠标移动到SQL语句上,在SQL语句的右边会出现 图标,单击该图标即可复制该SQL语句。时间:阻塞发生的时间。数据库名:发生阻塞的数据库名称。单击某一行的任意位置,可在页面下方查看该行对应的阻塞关系图。阻塞关系图 展示阻塞的...

历史版本常见问题

本文介绍了 PolarDB-X 1.0 历史版本的常见问题以及处理建议。RDS主备切换后PolarDB-X1.0报错一段时间 现象描述 PolarDB-X 1.0 与RDS的连接使用了连接池,连接池中保存了一部分连接。正常的RDS主备切换流程中,对老的连接进行KILL操作,...

Link Visual SDK更新记录

ilop 优化高倍数下点播获取当前进度精度 修复反复快速start/stop可能产生的播放无法退出的问题 优化iOS APP未配置background audio情况下进入后台后使用对讲直播伴随模式会出现恢复时音频播放不出声的问题 修复复用点播播放器从云存切换到...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口...相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用ARMS的告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 应用监控告警规则。

版本发布说明

缺陷修复 修复长事务在事务日志清理时可能会阻塞其他事务的问题。修复DML语句中包含视图时,语义校验异常导致优化器报错的问题。修复包含'BIGINT SIGNED'列定义的建表语句及解析语法报错的问题。修复特殊Project-Agg组合场景下,相关联子...

2024年

修复数据处理场景中存储引擎处理特定数据时触发 negative bitmapset member not allowed 报错信息,导致执行引擎异常崩溃的问题。修复数据处理过程中系统在尝试读取数据文件的特定块时发生错误,触发 beam could not read block in file ...

Pod诊断

ECSControllerManager 检查ECS实例常见问题,检查项包括ECS实例状态、网络链路、操作系统、磁盘IO等。Pod 检查项名称 检查项说明 修复方案 Pod容器重启次数统计 统计Pod中容器重启次数。请检查Pod状态及日志。更多信息,请参见 Pod异常问题...

附录:SOFAStack 产品目录

分布式链路跟踪系统能迅速定位到有问题的服务,协助快速解决问题。查看完整的应用调用拓扑关系:自动发现该服务之前的调用以及对所有中间件的调用,绘制整个系统的完整调用拓扑关系。快速定位不健康应用:在调用关系拓扑中,对不健康应用...

大数据安全治理的难点

大数据系统以数据类型多(结构化、非结构化、半结构化)、数据量大(动辄PB级别)著称,某些巨头组织一天就能新增数十万甚至数百万张表,如此体量给数据分级分类带来了极大挑战,通过人工进行数据分级分类显然是不现实的,难免会出现遗漏的...

体验中心

场景一:版本回滚 对新版 Portal 应用进行分组发布时,在第一组服务实例发布完成后,发布人员在微服务平台的服务监控中观测到业务异常,用户登录错误率快速增长,经分析判断是新版服务出现问题,立即到 AKS 中进行回滚发布,恢复到应用的旧...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

压测流媒体HLS协议

各随机值出现概率相等。高斯定时器:高斯定时器与统一随机定时器类似,同样用于设置停顿时长,可设置 延迟基准 和 可变跨度。若要求随机停顿时间符合正态分布,可使用高斯定时器。固定吞吐量定时器:固定吞吐量定时器用于控制吞吐量,使...

可观测链路 OpenTelemetry 版服务协议

欢迎您与阿里云计算有限公司(以下简称“阿里云”)共同签署本《可观测链路 OpenTelemetry 版 协议》(下称“本协议”)并使用阿里云服务!协议中条款前所列索引关键词仅为帮助您理解该条款表达的主旨之用,不影响或限制本协议条款的含义或...

创建压测场景

各随机值出现概率相等。高斯定时器:高斯定时器与统一随机定时器类似,同样用于设置停顿时长,可设置 延迟基准 和 可变跨度。若要求随机停顿时间符合正态分布,可使用高斯定时器。固定吞吐量定时器:固定吞吐量定时器用于控制吞吐量,使...

服务网格落地

延迟方面平均每跳增加 0.17 ms,两个合并部署系统链路增加 5~6 ms,有 7%左右的损耗。在单机房上线 SOFAMosn 时,SOFAMosn 在全链路压测下的整体性能表现更好。比如:交易付款时,带 SOFAMosn 比不带 SOFAMosn 的响应时间(RT)降低了 7....

创建压测场景

各随机值出现概率相等。高斯定时器:高斯定时器与统一随机定时器类似,同样用于设置停顿时长,可设置 延迟基准 和 可变跨度。若要求随机停顿时间符合正态分布,可使用高斯定时器。固定吞吐量定时器:固定吞吐量定时器用于控制吞吐量,使...

事件中心

实现自动化运维 在 NIS 控制台展示的事件均定义了事件状态,方便区分相应系统运维任务的执行情况,而且事件产生及状态变化时上报至云监控,方便您进一步根据自身需要搭建事件驱动的自动化运维体系。使用限制 已停售的实例规格族不支持...

挂载命令参数设置类问题

如果发生网络切换或者后端服务的HA倒换,小概率会造成NFS文件系统阻塞,若发生则可能需要几分钟时间连接才会自动恢复,极端情况下甚至需要重启ECS才能恢复。使用noresvport参数后,仅需要几秒即可自动完成恢复。如何检查并修改noresvport...

数据质量:全流程的质量监控

当离线MaxCompute数据发生变化时,数据质量对数据进行校验,并阻塞生产链路,以避免问题数据污染扩散。同时,数据质量提供历史校验结果的管理,以便您对数据质量进行分析和定级。详情请参见 数据质量。数据质量为您解决以下问题:数据库...

压测场景的结构和数据分配

说明 只有使用了数据导出指令,才会出现串联链路之间不是全都并行的情况。为保证用户登录信息不重复,需在压测API对应的 数据配置 中为某参数设置 数据轮询一次。本示例中串联链路1中的参数设置了数据只轮询一次。一批用户登录完成后,将...

应用场景

首先是在出现问题时,问题发现与定位如果能够快速精准,最大程度减少业务上带来的损失;其次,应用的性能优化,服务能否降级,强依赖与关键路径在哪,如何做预算等在大促或者压测时能够分析链路中最早波动的点,沉淀压测资产等。场景一:...

可观测性的设计原则

链路追踪 当系统出现问题时,需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求...

概述

资金安全监控 资金安全监控平台是一个通过旁路方式,对业务流程中资金流向进行实时分析和实时告警、从技术上保障资金安全的实时核对平台,旨在保障资金在流经业务系统时,不会出现资金流失的问题。全链路压测 全链路压测(Loadcenter)为...

等待资源

问题现象 调度将任务下发到对应执行引擎上,此过程可能会出现以下等待资源问题:等待调度资源组。数据集成任务等待数据集成资源。计算任务等待引擎计算资源。产生原因 资源组下可用资源是有限的,如果有任务长时间执行未释放资源必定会阻塞...

日志关联

当应用出现业务异常问题时,您可以分析业务日志,精准定位业务异常。本文介绍如何在调用链分析中关联日志服务SLS的日志。前提条件 已将应用数据上报至 可观测链路 OpenTelemetry 版,具体操作,请参见 接入指南。已创建Project。具体操作,...

使用ping命令丢包或不通时的链路测试方法

当客户端访问目标服务器或负载均衡,使用ping命令测试出现丢包或网络不通时,可以通过链路测试工具进行链路测试来判断问题来源。本文介绍如何使用链路测试工具进行链路测试。链路测试流程 通常情况下,链路测试流程如下图所示。链路测试...

诊断应用卡顿问题

日志不全或质量欠佳 应用日志是排查线上问题的主要方法,但出现问题的位置往往无法预期,而且“慢”通常是偶发现象,要真正找到“慢”的原因,需要在每个可能出现问题的地方打印日志,记录每一次调用,但是成本太高。监控不足 业务发展过快...

云数据库RDS SQL Server版阻塞问题处理方法

问题描述 云数据库RDS SQL Server版出现阻塞问题问题原因 当应用程序频繁读写某个表或者资源时,很容易出现阻塞情况。当阻塞问题严重时,应用程序端的语句执行变得缓慢。解决方法 排查方法 针对云数据库RDS SQL Server版阻塞问题,排查...

专业版

版本号 发布日期 版本说明 v2.4.9 2021-01-05【修复】修复了启动Link IoT Edge后,如果变更DNS(域名系统)地址,可能导致远程运维连接云端不成功的问题。【修复】修复了网关断电重启后,双机热备功能概率性启动失败等问题。v2.4.7 2020-...

数据资产等级定义

局部性质:数据直接或间接用于某些业务线的运营、报告等,如果出现问题会给业务线造成一定的影响或造成工作效率降低。标记为A3。一般性质:数据主要用于日常数据分析,出现问题带来的影响极小。标记为A4。未知性质:无法明确数据的应用场景...

性能监控最佳实践

透传协议标准化:全链路所有应用需要遵循同一套协议透传标准,保证链路上下文在不同语言应用间能够完整透传,不会出现断链或上下文缺失的问题。目前主流的开源透传协议包括 W3C、Jaeger、B3、SkyWalking等。最大化释放多语言产品能力:链路...

节点诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障,导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

链路流量控制简介

多应用问题排查 当部署在EDAS中的HSF微服务应用出现问题时,可以通过全链路流量控制将特定流量引入到某个应用,排查链路中具体应用的问题,保证整个微服务应用正常运行。入口应用与流量控制规则 在全链路流量控制中首先要指定入口应用,并...
共有137条 < 1 2 3 4 ... 137 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
可观测链路 OpenTelemetry 版 应用实时监控服务 智能数据建设与治理 Dataphin 全局事务服务 (文档停止维护) 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用