审批负责人治理(Beta)

异常原因 系统检测到审批负责人异常的可能原因(优先级依此降低):同时具备生产和开发环境时,生产表的审批负责人与开发表的审批负责人不相同。表(开发环境/生产环境)的审批负责人对应的云账号不复存在。表(开发环境/生产环境)的审批...

调试场景

若断言出现异常,请在右侧 响应详情 页签的 检查点信息 区域查看断言信息。若当前值为空,则表示未获取到出参值。图示中③为响应的错误信息,可显示异常响应详情,例如超时、参数错误、连接拒绝等。图示中④为请求在核心的生命周期内的耗时...

性能监控最佳实践

同时,还需要设置告警规则,以便在系统出现异常时及时通知管理员。整合监控工具:将多个监控工具整合在一起,形成一个统一的监控平台。这可以通过使用开源的监控集成工具,如Prometheus、Grafana等来实现。这些工具可以将不同的监控数据...

常见问题

启动SSH服务时出现“error while loading shared libraries”错误 ECS网络问题 Windows实例ping外网地址提示“一般故障”Linux系统的ECS中没有禁ping却ping不通的解决方法 使用ping命令测试ECS实例时ping不通的排查方法 如何在Linux实例中...

内核统一异常框架(UKFEF)

Normal:当前应用进程可能会出现异常。建议对当前应用采取措施,例如 kill、重启或迁移。Fatal:可能会对系统产生致命影响。建议立即进行业务迁移。事件报告 UKFEF将通过以下方式输出事件报告:通过内核日志输出单次事件的详细信息。信息...

Alibaba Cloud Linux 2系统中systemd服务异常问题说明

如果您的Alibaba Cloud Linux 2操作系统中systemd服务运行异常,可参考文本提供的方案解决问题。问题现象 在符合以下条件的Alibaba Cloud Linux 2实例中,系统在正常运行时实例内部署的业务有概率启动失败。镜像:Alibaba Cloud Linux 2....

概述

系统出现慢SQL可能会导致CPU、负载异常系统资源耗尽等情况。严重的慢SQL发生后可能会拖垮整个数据库,对线上业务产生阻断性的风险,对于线上常见的慢SQL问题,MSE服务治理提供了场景化的解决方式。具体详情,请参见 慢SQL治理。数据库...

基本概念

本文介绍在使用 可观测链路 OpenTelemetry 版 之前需要了解的基本概念,包括分布式追踪系统的作用,什么是调用链,可观测链路 OpenTelemetry 版 所依赖的OpenTracing数据模型,以及在 可观测链路 OpenTelemetry 版 产品里数据是如何上报的...

在RDS SQL Server中出现阻塞

问题描述 在云数据库RDS SQL Server中出现阻塞情况。问题原因 事务之间锁资源争抢导致出现阻塞情况。解决方案 在云数据库RDS SQL Server中发生锁现象时,通过执行下面的脚本,获取到锁的信息。select dtl.request_session_id as waitSID,...

异常列表

系统发现差异数据后,会创建异常事件。您可以在 异常列表 页面,查看当前租户下的所有异常。目前支持按照以下条件筛选异常异常范围:全部异常、我订阅的异常、待处理异常。核对场景:全部核对场景,某一选定的核对场景。指定条件:规则...

配置数据层

当某个单元出现异常或者不可用的情况时,可通过切流单迅速将数据库从主单元切换到正常单元,保证业务的可持续性和稳定性。前提条件 配置MySQL数据层的前提条件:在两个单元环境中分别已创建一个或多个同名MySQL。具体操作,请参见 快速创建...

Transaction Table2.0概述

因此当前比较典型的解决方案是Lambda架构,全量批处理使用MaxCompute链路,时效性要求比较高的增量处理使用实时系统链路,但该架构也存在大家所熟知的一些固有缺陷,比如多套处理和存储引擎引发的数据不一致问题,多份数据冗余存储和计算...

设备未上线问题

可能异常:通信链路异常。解决方法:排除物理连接断开、防火墙限制等问题。步骤六:确保子设备注册上线时配置的设备证书信息正确 使用如下命令,获取账号下所有子设备的设备证书信息(ProductKey、DeviceName)。cd/linkedge/gateway/build...

网络架构容灾

开启健康检查功能后,当后端某个ECS实例健康检查出现异常时,负载均衡会自动将新的请求分发到其他健康检查正常的ECS实例上,而当该ECS实例恢复正常运行时,负载均衡会将其自动恢复到负载均衡服务中。为了使健康检查功能正常运作,需要开启...

诊断服务端报错问题

步骤三:诊断异常出现的原因 掌握应用异常的统计信息还不足以诊断异常出现的原因。虽然日志中异常堆栈包含调用的代码片段,但并不包含这次调用的完整上下游信息和请求参数。ARMS探针采用了字节码增强技术,让您能够以很小的性能消耗捕获...

强弱依赖治理概述

强弱依赖治理的应用 强弱依赖治理主要可以被应用到以下场景:系统改造验收:对于分布式系统,至少在运行态中,不会因为依赖的系统后台出现故障,引起当前应用出现系统级可用性的故障,例如进程挂掉、频繁FullGC、负载飙高等,何时何地都应...

应用防护规则适用场景

自动重试规则 场景说明 分布式系统中调用关系通常会比较复杂,服务之间的调用可能会偶尔出现异常。这些异常有的是不可恢复的(如业务错误),有的则是可以恢复的(如偶发的超时)。当系统遇到一些非致命性的错误(如偶现的超时等)时,可以...

异地应用双活切流

场景四:故障>数据库故障 说明 部分数据库出现异常,将发生故障的主数据库切换到另一单元(地域)。a.选中想要切换的数据库,在展示框里,同一行代表同一数据库的主备。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到数据库前后主...

基本概念

本文介绍在使用 可观测链路 OpenTelemetry 版 之前需要了解的基本概念,包括分布式追踪系统的作用,什么是调用链,可观测链路 OpenTelemetry 版 所依赖的OpenTracing数据模型,以及在 可观测链路 OpenTelemetry 版 产品里数据是如何上报的...

阻塞

采样原理 通常,单个会话阻塞2秒左右不会有太大问题,但短期内连续出现多个会话阻塞超过2秒的情况就会对整个系统产生显著影响。系统每10秒会对锁阻塞的情况进行一次采样,在系统进行采样的时间点,只要当一个会话执行SQL时间超过2秒、并且...

阻塞

采样原理 通常,单个会话阻塞2秒左右不会有太大问题,但短期内连续出现多个会话阻塞超过2秒的情况就会对整个系统产生显著影响。系统每10秒会对锁阻塞的情况进行一次采样,在系统进行采样的时间点,只要当一个会话执行SQL时间超过2秒、并且...

质量规则参数配置

跨数据源对比字段会被自动转换为string类型,部分特殊字段类型可能会出现异常情况。建议码表中的字段类型和校验字段类型都是string或其他相同类型。码表:选择目标码表。码表名称:输入码表名称,作为质量规则配置时的提示信息。码表参照...

质量规则参数配置

跨数据源对比字段会被自动转换为string类型,部分特殊字段类型可能会出现异常情况。建议码表中的字段类型和校验字段类型都是string或其他相同类型。码表:选择目标码表。码表名称:输入码表名称,作为质量规则配置时的提示信息。码表参照...

微服务洞察

异常 开启后,系统会采集和打印存在异常的接口的日志。全链路灰度标签 开启后,系统会采集和打印匹配指定全链路灰度标签的接口的日志。关于全链路灰度标签请参见 全链路灰度之配置灰度。查看日志 微服务洞察生成的日志会自动存储在本地以及...

分析请求调用链路

背景信息 在应用运行过程中,当出现服务调用异常或资源访问失败时,开发人员通常会选择断点调试来排查问题。但断点调试在某些场景下并不适用,可能存在如下问题:缺乏整体调用概况:上层服务收到请求后,往往会拆分成多个子请求,最后将...

分析请求调用链路

背景信息 在应用运行过程中,当出现服务调用异常或资源访问失败时,开发人员通常会选择断点调试来排查问题。但断点调试在某些场景下并不适用,可能存在如下问题:缺乏整体调用概况:上层服务收到请求后,往往会拆分成多个子请求,最后将...

分析请求调用链路

背景信息 在应用运行过程中,当出现服务调用异常或资源访问失败时,开发人员通常会选择断点调试来排查问题。但断点调试在某些场景下并不适用,可能存在如下问题:缺乏整体调用概况:上层服务收到请求后,往往会拆分成多个子请求,最后将...

通过SkyWalking上报Python应用数据

通过SkyWalking为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用SkyWalking ...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

RocketMQ全链路追踪解决方案

在分布式应用系统中,多个服务间的交互涉及复杂的网络通信和数据传输,往往一次请求需要多个内部服务间的相互调用才能完成,任何一个环节出现问题都可能导致外部服务任务执行失败或延时,且很难快速定位问题根源。链路追踪功能可在多个服务...

诊断应用卡顿问题

在弹出的页面,查看异常的调用链路信息,在 详情 列,单击放大镜图标,查看调用的方法栈,从而获得异常的上下文信息。说明 如何查找目标调用链路,请参见 调用链路查询。在本示例中,可以看到在耗时为705毫秒的调用中,大部分的时间都消耗...

告警规则指标说明

异常接口调用响应时间 毫秒 是 该应用异常调用的响应时间,其中,异常调用指调用中出现异常抛错的调用。可以根据该指标判断调用堆栈抛错对应用调用响应时间的影响大小,从而判断是否存在应用调用异常。指标维度 接口名称,筛选条件如下:遍...

分布式链路概述

分布式链路(原 SOFAStack 中间件中的 概述)会逐步融合到业务智能可观测服务中,实现监控和链路分析一体化,方便用户对问题进行跟踪定位,对应用性能、调用链路进行实时分析。背景信息 分布式链路是面向分布式架构、微服务(比如 Spring ...

全局监控

当三个黄金指标出现拐点时,表示系统已遇到性能瓶颈。在 接口监控 中,查看各API的三个黄金指标、虚拟用户数以及响应各阶段耗时。在异常统计中,可以按异常状态码和异常API维度分析异常分布。同时,支持按API分析断言失败数量。应用监控 ...

自动SQL限流

即使硬件设备或者网络出现故障,巡检系统也可以快速迁移、及时重启,保证服务稳定。但现有的这些手段几乎都是针对服务端的稳定性保证,来自业务端的异常使用造成的问题还需要人工介入处理,比如业务变化中引入了新的慢SQL,突然涌入的洪峰...

使用DTS进行增量迁移时没有同步数据

问题描述 使用阿里云数据传输服务DTS的增量迁移功能时出现延迟,或者使用数据同步功能时很长时间没有同步数据。问题原因 增量迁移没有同步数据的原因如下:目标或者源端实例运行状态异常。源或者目标实例上进程被阻塞。源实例以及目标实例...

播放异常自主排查

本文主要介绍当播放异常时自主排查异常根因的定位思路及排查步骤等。排查思路 说明 当出现播放异常时,建议优先使用播放链接检测工具进行自助检测。本工具可快速诊断常见播放异常问题,并根据具体异常提供解决建议。具体操作,请参见 视频...

播放异常自主排查

本文主要介绍当播放异常时自主排查异常根因的定位思路及排查步骤等。排查思路 说明 阿里云播放器SDK在持续不断的推出新功能并优化提升性能和稳定性,当您使用播放器SDK遇到问题时,建议您先使用最新版SDK进行验证,验证您的问题在最新版SDK...

播放异常自主排查

本文主要介绍当播放异常时自主排查异常根因的定位思路及排查步骤等。排查思路 说明 阿里云播放器SDK在持续不断的推出新功能并优化提升性能和稳定性,当您使用播放器SDK遇到问题时,建议您先使用最新版SDK进行验证,验证您的问题在最新版SDK...

简介

观星台是阿里云音视频通信为开发者提供的通信质量监测平台,分为通信监测、用量统计、质量统计和异常诊断模块,通过提供全链路的质量监控,帮助您及时发现并定位问题,可以有效的降低业务运维成本,并提高产品的使用体验。应用场景 应用...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
可观测链路 OpenTelemetry 版 云监控 威胁情报服务 应用实时监控服务 Web应用防火墙 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用