配置健康检查

如果某条物理专线上连续8个ping报文都 无响应或者ping报文从其他路径被返回,则说明该物理专线链路故障。健康检查探测到物理专线链路故障后并不会向您发送通知,推荐您为物理专线配置报警规则,物理专线触发报警规则后,系统会向您发送报警...

查看应用拓扑图

指标说明 RMS 分布式链路使用不同的拓扑图标颜色进行标识,蓝色表示应用健康、黄色表示应用出现异常情况、红色表示应用出现错误,方便用户迅速聚焦到非健康应用,快速定位异常链路,完成故障排查。此外,将鼠标悬在代表应用的节点或者节点...

畅捷通借助EDAS实现的微服务治理能力提升之路

在此之前,由于畅捷通的SaaS产品所涉及到的业务链路极为复杂,当用户反馈系统Bug或者性能存在问题之后,IT团队需要耗费非常长的时间在错综复杂的链路之间定位故障源以及性能瓶颈。在接入ARMS之后,通过全链路信息排查以及应用实时诊断等...

故障演练

常见故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...

通过Zipkin上报Go应用数据

通过Zipkin为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用Zipkin为Go应用埋点...

故障排查

本文介绍微服务引擎MSE在使用过程中常见问题的故障分析和排查流程。微服务注册配置中心问题排查 在浏览器中输入 XXX:8848/nacos,访问MSE的Nacos注册中心时返回404错误。具体操作,请参见 通过“XXX:8848/nacos”访问MSE的Nacos注册中心时...

通过物理专线实现本地IDC与云上VPC互通

健康检查探测到物理专线链路故障时,如果云企业网实例中存在冗余的路由,健康检查则会立刻触发路由切换使用可用链路。若您关闭本功能,健康检查仅执行链路探测功能。若健康检查探测到物理专线链路故障,则不会触发路由切换。警告 若您选择...

产品优势

服务部署后,计算巢提供阿里云自助服务和全链路检测能力,实现一键排查、智能故障检测,提升业务稳定性。计算巢为用户提供了丰富的软件选择,覆盖常见的软件类型,包括:数据库等基础软件,CRM等应用软件,以及制造、医疗等行业软件。已经...

故障排查

本文介绍阿里云容器服务ACK集群在使用过程中常见问题的故障分析和排查流程。ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes...

ack-node-repairer

背景信息 节点自愈系统默认集成了常见的节点故障以及对应的节点修复操作。当节点出现故障时,自愈系统会自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD会修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要...

事件分析概述

微服务领域:微服务在现代开发架构中比较常见,该架构由小型、松耦合、可独立部署的服务集合而成,这导致微服务架构很难调试,系统中某一部分的小故障可能会导致大规模服务崩溃。很多时候不得不跳过某些正常服务来调试单个请求。事件总线...

诊断应用卡顿问题

排查、解决网站卡顿、页面加载过慢等问题过程复杂,耗时较长,原因如下:应用链路太长 从前端页面到后台网关,从Web应用服务器到后台数据库,任何一个环节出现故障都有可能导致整体卡顿。采用微服务架构的应用,链路更加复杂,而且不同组件...

GTM如何实现同城容灾

常见问题 故障切换时间是多少?在健康检查间隔设置为15秒,TTL10秒,连续失败次数3次的配置下,GTM能在1分钟左右准确发现故障并切换,故障切换后理论上10秒左右可以全网生效,但实际情况取决于全国各地运营商的缓存设置时间。DNS未使用云...

可观测性的设计原则

云上的可观测性主要从监控指标、链路追踪、日志记录、监控看板和事件告警五大方面来进行设计,从而实现云上全方面的可观测性体系能力建设。监控指标 系统需要收集和显示有关运行状况的指标,例如CPU使用率、内存使用率、网络流量等。监控...

通过Zipkin上报Java应用数据

通过Zipkin为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何进行手动埋点,以及使用...

网站耗资源(客户程序故障常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

网络诊断

网络诊断介绍 容器服务控制台中提供了网络诊断功能,通过输入问题链路的源地址和目的地址、目的端口和协议,即可快速诊断常见网络问题。您无需对复杂的容器网络架构和网络插件原理进行了解,也无需对系统内核有丰富的运维经验。网络诊断...

设置SSL加密

RDS SQL Server的SSL(Secure Socket Layer)...常见问题 Q:SSL证书到期后不更新会有什么影响?会影响实例运行或数据安全吗?A:SSL证书到期后不更新,仅会导致使用加密连接的客户端程序无法正常连接实例,但不会影响实例运行或数据安全。

业务流量隔离功能实践

安全生产环境 区别于一般的灰度发布,安全生产环境是搭建一套与生产环境中间件隔离的环境,包含独立配套的监控告警系统,便于灰度发布、故障演练、链路压测、算法调优等,能有效优化研发流程和线上产品服务稳定性。由于中间件隔离,上游...

网络最大传输单元MTU

常见问题 问题描述:使用巨型帧进行UDP/ICMP通信时,如果遇到性能急剧下降的情况,如何解决?解决方案:检查数据包分片情况,必要时关闭ECS实例的巨型帧。具体操作,请参见 开启/关闭巨型帧。问题描述:ECS实例开启巨型帧的情况下,通过UDP...

本地IDC通过ECR主备专线链路上云方案

本文介绍如何组合使用物理专线和专线网关ECR,实现本地数据中心IDC通过ECR主备专线链路上云并和云上专有网络VPC互通。场景说明 本文以下图场景为例,为您介绍IDC通过ECR主备专线链路上云方案。某企业在上海拥有一个IDC,其中部署有数据库...

通过SkyWalking上报Java应用数据

通过SkyWalking为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用SkyWalking ...

本地IDC通过ECR实现负载专线链路上云方案

本文介绍如何组合使用物理专线和专线网关ECR,实现本地数据中心IDC通过ECR实现负载专线链路上云并和云上专有网络VPC互通。场景说明 本文以下图场景为例,为您介绍IDC通过ECR负载专线链路上云方案。某企业在上海拥有一个IDC,其中部署有数据...

通过Zipkin上报Java应用数据

通过Zipkin为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何进行手动埋点,以及使用...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

Mesh 常见问题

本文汇总了使用服务网格时可能遇到的常见问题及解决方案。服务网格目前支持的微服务框架有哪些?服务网格目前支持 Dubbo、SpringCloud 等主流微服务框架。XDS 配置不下发 问题原因:Pilot 未启动或 Pilot 与 MOSN 网络不通。解决方案:查看...

应用场景

通过集成的 可观测链路 OpenTelemetry 版,为分布式应用的开发者提供完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等工具,帮助开发者快速分析和诊断分布式应用架构下的性能瓶颈,提高开发诊断效率。微服务架构 通过ASM,...

告警中心大盘

故障级别 故障类型 故障详情 故障说明 解决方案 error AlertPolicyNotConfigured Alert xxx has no alert policy configured 未在告警监控规则中设置告警策略,告警无法被路由分组合并,导致对应的告警被忽略。修改告警监控规则,设置正确...

日志说明

load.test 判断当前是否为全链路压测:T:表示当前为全链路压测。当前线程中能获取到日志上下文,且上下文中有压测信息。F:表示当前非全链路压测。当前线程中不能获取到日志上下文,或上下文中没有压测信息。HttpClient 日志 SOFATracer ...

什么是应用实时监控服务ARMS?

子产品 功能概述 常见场景 计费方式 应用监控 面向分布式架构,监控Java应用,支持查看应用拓扑、接口调用、异常事务、慢事务等。压测前后的性能调优。微服务改造后的全链路监控。应用运行情况的7×24小时监控和告警。产品计费(新版)前端...

产品架构介绍

数据单向/双向同步:借助DTS等产品能力进行数据同步,特别是对于单向同步链路,支持数据源主备切换过程中的同步链路翻转。读写分离/读写不分离:读写分离,写主云读本地。读写不分离,读写均在主云。主备切换:单云故障,支持数据库跨云主...

附录:SOFAStack 产品目录

分布式链路跟踪 分布式链路跟踪(Distributed System Tracing,简称 DST)是一款面向分布式架构、微服务架构和云原生架构的应用可观察性的金融级解决方案,帮助用户厘清应用间复杂的调用关系,迅速定位故障或者缓慢节点。产品架构 产品优势...

地域及可用区

可用区 北京 F、G、H、K 上海 B、F、G 杭州 H、I、J 深圳 E、F 张家口 B 中国香港 B、C 日本(东京)B 新加坡 C 美国(弗吉尼亚)B 德国(法兰克福)B 印度尼西亚(雅加达)A 英国(伦敦)A 美国(硅谷)B 马来西亚(吉隆坡)B 常见问题 ...

Windows实例网络访问丢包延时高的排查方法

概述 当网站访问很慢或无法访问时,若已经排除显著的问题,而使用ping命令检测到有明显丢包时,建议您做链路测试。在Windows环境中,推荐优先使用WinMTR工具,或者tracert命令行进行链路测试以判断问题来源。通常情况下,链路测试步骤如下...

通过SkyWalking上报Java应用数据

通过SkyWalking为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用SkyWalking ...

以太网接口频繁Up/Down

检查设备两端链路、接口模块是否故障。设备之间是通过双绞线连接,需要做如下检查。检查项 检查标准 后续操作 用测试仪测试双绞线是否故障。测试仪显示双绞线正常。如果检查出线缆故障,请更换线缆。设备间双绞线长度是否满足要求。设备间...

什么是应用监控

告警集成 ARMS监控针对JVM、主机、接口服务情况等指标类型,预置了50种以上的告警规则,您可以对这些规则进行灵活的调整与组合,并通过ARMS告警管理,实现告警的收敛、通知、升级、协同处理,确保及时发现并修复线上故障。开源集成 ARMS...

以太网接口无法接通

检查设备两端链路、接口模块是否故障。如果设备之间使用双绞线连接,请排查以下检查项。检查项 检查标准 后续操作 用测试仪测试双绞线是否故障。测试仪显示双绞线正常。如果测试仪检测出线缆故障,请更换线缆。设备间双绞线长度是否满足...

SSL-VPN连接常见问题

如果探测到公网链路质量不佳(延时高或丢包率高等)可联系运营商协助进行故障排查。如果您使用SSL-VPN连接进行长距离通信(例如美国(硅谷)到新加坡),在客户端访问VPC的过程中,则可能会出现客户端间歇性中断下线的情况。请在阿里云侧将...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
可观测链路 OpenTelemetry 版 数据库自治服务 应用实时监控服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用