通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

数字人流媒体服务WebSDK

aliyun-avatar-sdk,数字人开放平台推出的适用于Web浏览器的数字人流媒体服务SDK。当您调用服务端OpenAPI StartInstance接口获取RTC和IM参数信息后,可以在Web端搭建本地SDK,实现数字人拉流和双工对话。aliyun-avatar-sdk通过 阿里云音...

什么在控制台看不到数据?

使用开源客户端上报数据后,如果遇到控制台或日志中打印了错误日志,或者控制台上没有观察到报错数据,可以根据本文档进行问题排查。控制台没有数据的可能原因:网络无法连通 控制台中上报开关设置有误 SLS数据源上报失败 HTTP上报数据失败...

什么在控制台看不到数据?

使用开源客户端上报数据后,如果遇到控制台或日志中打印了错误日志,或者控制台上没有观察到报错数据,可以根据本文档进行问题排查。控制台没有数据的可能原因:网络无法连通 控制台中上报开关设置有误 SLS数据源上报失败 HTTP上报数据失败...

DeviceWanLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'productMethod':'created','language':'zh-CN',};

同城双活

在日常业务链路中,会出现多次跨机房调用,增加性能损耗。同城双活模式:会优先调用同可用区,同可用区找不到调用目标,再调用其他可用区。最佳实践 最佳实践方案建议包含下述逻辑:每个应用的所有节点对等部署在同城的两个可用区。每个...

ConnectionDisconnect

ConnectionDisconnect事件提示您智能接入网关的主备IPsec链路出现故障。告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障。处理...

功能特性

建议您从运营商处购买一个可以传输数据的4G卡,该4G卡插入智能接入网关设备后可作为宽带备份链路,在宽带链路故障时为您传输数据。专线备份:在客户网络中已有专线链路的情况下,可增加智能接入网关作为备份上云链路。专线+Internet备份:...

使用ping命令丢包或不通时的链路测试方法

网络区域 通常情况下,从客户端到目标服务器的整个链路显著的包含如下区域:客户端本地网络 本地局域网和本地网络提供商网络,如前文链路测试结果示例图中的区域A,一般为前2~3个节点。如果该区域出现异常,如果是客户端本地网络相关...

设置SSL加密

RDS SQL Server的SSL(Secure Socket Layer)...常见问题 Q:SSL证书到期后不更新什么影响?影响实例运行或数据安全吗?A:SSL证书到期后不更新,仅导致使用加密连接的客户端程序无法正常连接实例,但不会影响实例运行或数据安全。

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

可观测性的设计原则

链路追踪 当系统出现问题时,需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求...

等待资源

什么会出现等待资源?为什么任务一直在等待gateway调度资源?为什么数据集成任务一直显示wait?为什么会出现等待资源?问题现象 调度将任务下发到对应执行引擎上,此过程可能会出现以下等待资源问题:等待调度资源组。数据集成任务等待...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

调用链采样配置最佳实践

调整采样是目前解决这类问题最高效且主流的方式,但具体配置什么样的采样策略,能够在可控的资源开销和费用成本内,最大程度保证错、慢、异常等链路被采集,从而最大限度保障性能监控和问题排查的使用需求。本文将重点围绕不同业务场景下...

通过Jaeger上报Go应用数据

通过Jaeger为应用埋点并上报链路...常见问题 Q:在运行过程中,为什么会出现以下报错?2021/06/28 21:11:54 ERROR:error when flushing the buffer:error from collector:403 A:出现上述报错,说明输入的接入点信息不正确。请更正并重试。

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

通过Zipkin上报Go应用数据

通过Zipkin为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用Zipkin为Go应用埋点...

诊断应用卡顿问题

排查、解决网站卡顿、页面加载过慢等问题过程复杂,耗时较长,原因如下:应用链路太长 从前端页面到后台网关,从Web应用服务器到后台数据库,任何一个环节出现故障都有可能导致整体卡顿。采用微服务架构的应用,链路更加复杂,而且不同组件...

2023年

无 缺陷修复 修复带SORT KEY的内存攒批任务执行后可能会出现的查询报错问题。修复Serverless实例读取字符串类型数据可能出错的问题。修复WHERE子句中过滤条件过多可能出错的问题。修复SQL包含like语句时可能出现报错的问题。修复扩缩容等锁...

基本概念

本文介绍在使用 可观测链路 OpenTelemetry 版 之前需要了解的基本概念,包括分布式追踪系统的作用,什么是调用链,可观测链路 OpenTelemetry 版 所依赖的OpenTracing数据模型,以及在 可观测链路 OpenTelemetry 版 产品里数据是如何上报的...

分布式链路概述

分布式链路(原 SOFAStack 中间件中的 概述)逐步融合到业务智能可观测服务中,实现监控和链路分析一体化,方便用户对问题进行跟踪定位,对应用性能、调用链路进行实时分析。背景信息 分布式链路是面向分布式架构、微服务(比如 Spring ...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

压测场景的结构和数据分配

说明 只有使用了数据导出指令,才会出现串联链路之间不是全都并行的情况。为保证用户登录信息不重复,需在压测API对应的 数据配置 中为某参数设置 数据轮询一次。本示例中串联链路1中的参数设置了数据只轮询一次。一批用户登录完成后,将...

数据资产等级定义

一般性质:数据主要用于日常数据分析,出现问题带来的影响极小。标记为A4。未知性质:无法明确数据的应用场景。标记为Ax。这些性质的重要性依次降低,即重要程度为A1>A2>A3>A4>Ax。如果一份数据出现在多个应用场景汇总,则根据其最重要程度...

购买流程

迁移链路规格 DTS为您提供了不同性能的链路规格,迁移链路规格的不同影响迁移速率,您可以根据业务场景进行选择,详情请参见 数据迁移链路规格说明。资源组 选择迁移任务所属的资源组,相关介绍,请参见 什么是资源管理。购买量 链路数量...

基础设施安全

各可用区之间可以实现故障隔离,即如果一个可用区出现故障,不会影响其他可用区的正常运行。每个地域完全独立,不同地域的可用区完全隔离,但同一个地域内的可用区之间使用低时延链路相连。弹性自动容错 PAI提供基于AIMaster的容错监控能力...

异地应用双活切流

选择 故障单元,代表此时,该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回...

使用前后端链路追踪诊断API错误原因

重要 配置 enableApiCors 为 true,后端服务也需要支持跨域请求及自定义header值,请确认所有请求都配合联调正常,否则会出现请求失败的问题。Nginx配置参考如下:upstream test { server 192.168.220.123:9099;server 192.168.220.123:...

数据资产定级

局部性质:数据直接或间接用于某些业务线的运营、报告等,如果出现问题会给业务线造成一定的影响或造成工作效率降低。标记为A3。一般性质:数据主要用于日常数据分析,出现问题带来的影响极小。标记为A4。未知性质:无法明确数据的应用场景...

应用中心

应用中心是阿里云CDN实用工具和增值服务(例如IP检测等)的快捷入口,便于您快速了解和启用相关服务。当前支持的应用如下:应用分类 应用名称 功能说明 实用...当主源站出现故障时,CDN将回源请求自动切换至备源进行访问,保证服务正常运行。

数据资产定级

局部性质:数据直接或间接用于某些业务线的运营、报告等,如果出现问题会给业务线造成一定的影响或造成工作效率降低。标记为A3。一般性质:数据主要用于日常数据分析,出现问题带来的影响极小。标记为A4。未知性质:无法明确数据的应用场景...

通过Jaeger上报.NET应用数据

通过Jaeger为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用OpenTracing/...

【产品/功能变更】RDS网络链路升级说明

不升级的风险 当前的高安全模式在某种场景下会出现资源稳定性的抖动,有可能给您的业务造成影响。为保证业务的正常稳定运行,请尽快完成实例的升级。升级后的优势【稳定性】升级后网络链路少一次跳转,极大提高了稳定性。【性能】升级后...

实时分析链路数据

背景信息 除了使用调用链排查单次请求的异常,或者使用预聚合的链路统计指标进行服务监控与告警之外,链路追踪还支持基于明细链路数据的后聚合分析,简称调用链分析(Trace Explorer)。相比调用链,调用链分析能够更快地定位问题;相比...

基本概念

设备 一般指IP网数通类网络通信设备,比如交换机、路由器、防火墙等,根据业务场景也可以涵盖无线网络AP/AC的管理和运维。电路(链路)根据管理域链路包括单端链路和双端链路,业务类型包括自有业务或者对接外部的如专线等。安全域 设备等...

【产品/功能变更】RDS网络链路升级说明

不升级的风险 当前的高安全模式在某种场景下会出现资源稳定性的抖动,有可能给您的业务造成影响。为保证业务的正常稳定运行,请尽快完成实例的升级。升级后的优势【稳定性】升级后网络链路少一次跳转,极大提高了稳定性。【性能】升级后...

SSL-VPN连接常见问题

原因分类 原因 解决方案 公网链路质量不佳 如果您使用SSL-VPN连接进行长距离通信(例如美国(硅谷)到新加坡),在客户端访问VPC的过程中,则可能会出现客户端间歇性中断下线的情况。请在阿里云侧将SSL服务端的 协议 修改为 TCP(可靠性更...

通过Zipkin上报 .NET应用数据

通过Zipkin为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用ASP.NET Core/Owin...

上下文

什么是上下文 当 函数计算 运行您的函数时,将上下文对象传递到执行方法中。该对象包含有关调用、服务、函数、链路追踪和执行环境等信息。事件请求处理程序(Event Handler)和HTTP请求处理程序(HTTP Handler)都支持上下文对象作为传入...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
可观测链路 OpenTelemetry 版 物联网无线连接服务 商标服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用