访问ECS实例异常时的问题排查和指引

如果排查分析安全组和操作系统内安全软件配置后,均未见明显异常,则请参见 网络异常时抓包操作说明,在出现异常时,从客户端和服务端同时并发抓包,然后 提交工单 联系阿里云技术支持,提交抓包结果。只有源服务器访问目标服务器存在异常...

配置熔断规则

常用场景2:异常熔断示例 例如第三方内容展示时,系统出现异常,当异常比例较高时,可以对其进行熔断操作,以保证更好的用户体验。在 新增熔断规则 或 新增规则 对话框中配置以下示例规则信息。参数 示例值 描述 接口名称 test 接口名称...

版本选型

离群实例摘除 当应用实例出现异常时,该功能可将异常实例按照规则从负载均衡池中移除,保障客户端请求到正常实例上,提升业务的稳定性和服务质量。服务治理可观测 支持查询近五分钟内的实时QPS、RT、CPU、Load等监控数据。企业版 面向全...

全景监控

通过业务场景组织监控链路,包含业务场景名称、业务场景描述、负责人,以及业务场景的正常/异常状态及异常告警个数等统计指标,方便运维人员从全局快速锁定出现问题的业务场景及严重程度。业务场景中包含该场景涉及的业务节点、任务节点,...

功能简介

通过业务场景组织监控链路,包含业务场景名称、业务场景描述、负责人,以及业务场景的正常/异常状态及异常告警个数等统计指标,方便运维人员从全局快速锁定出现问题的业务场景及严重程度。业务场景中包含该场景涉及的业务节点、任务节点,...

功能简介

通过业务场景组织监控链路,包含业务场景名称、业务场景描述、负责人,以及业务场景的正常/异常状态及异常告警个数等统计指标,方便运维人员从全局快速锁定出现问题的业务场景及严重程度。业务场景中包含该场景涉及的业务节点、任务节点,...

配置熔断规则

常用场景2:异常熔断示例 例如第三方内容展示时,系统出现异常,当异常比例较高时,可以对其进行熔断操作,以保证更好的用户体验。在 新增熔断防护规则 对话框中配置以下示例规则信息。参数 示例值 描述 接口名称 test 接口名称。统计...

测试与验证

业务突变测试 业务突变测试主要考察当业务进行突变以后,系统是否出现异常情况,资源在突变前后变化情况。可靠性测试 可靠性测试主要是模拟各种故障(网络中断,服务异常、HA切换)下,系统是否能正确切换,处理能力是否有明显变化。测试...

调用链分析

例如错/慢调用都来自同一个主机、同一个接口,可以分别筛选对应的主机、接口下的Trace,或通过组合维度(例如 serviceName="arms-demo"AND ip="192.168.1.1")筛选Trace,快速定位系统异常。错/慢Trace分析也可以用于梳理慢接口,对系统...

无法连接Linux实例的排查方法

code=exited”错误 Linux实例由于Ulimit限制原因导致SSH登录后系统异常 使用SSH命令登录Linux系统的ECS实例时出现报错 Linux实例中由于SELinux服务开启导致SSH远程连接异常 SSH服务及参数配置 SSH服务的默认配置文件为/etc/ssh/sshd_config...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

ConnectionDisconnect

ConnectionDisconnect事件提示您智能接入网关的主备IPsec链路出现故障。告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路出现网络故障。处理...

性能监控最佳实践

同时,还需要设置告警规则,以便在系统出现异常时及时通知管理员。整合监控工具:将多个监控工具整合在一起,形成一个统一的监控平台。这可以通过使用开源的监控集成工具,如Prometheus、Grafana等来实现。这些工具可以将不同的监控数据...

常见问题

启动SSH服务时出现“error while loading shared libraries”错误 ECS网络问题 Windows实例ping外网地址提示“一般故障”Linux系统的ECS中没有禁ping却ping不通的解决方法 使用ping命令测试ECS实例时ping不通的排查方法 如何在Linux实例中...

查看应用拓扑图

指标说明 RMS 分布式链路使用不同的拓扑图标颜色进行标识,蓝色表示应用健康、黄色表示应用出现异常情况、红色表示应用出现错误,方便用户迅速聚焦到非健康应用,快速定位异常链路,完成故障排查。此外,将鼠标悬在代表应用的节点或者节点...

事件中心

应用场景 NIS 事件由阿里云定义,用于记录和通知云网络资源的信息,例如运维任务执行情况、资源是否出现异常、资源状态变化等。通知风险和异常 如果发生了实例资源可用性或性能受损的事件,例如因实例超规格使用造成性能受损、因运营商链路...

应用场景

全面消除偶发问题引发的风险 依托于限流、降级、熔断、隔离等能力,可以在出现偶发的流量洪峰和依赖服务出现异常时,有效地限流保护、削峰填谷、隔离故障、降级保护。低成本实现微服务敏捷开发 依托于开发环境隔离能力,可以在不增加物理...

基本概念

因此,如果一个服务出现问题,可能导致几十个应用都出现服务异常。分布式追踪系统可以记录请求范围内的信息,例如一次远程方法调用的执行过程和耗时,是我们排查系统问题和系统性能的重要工具。什么是调用链(Trace)?在广义上,一个调用...

调试场景

若断言出现异常,请在右侧 响应详情 页签的 检查点信息 区域查看断言信息。若当前值为空,则表示未获取到出参值。图示中③为响应的错误信息,可显示异常响应详情,例如超时、参数错误、连接拒绝等。图示中④为请求在核心的生命周期内的耗时...

功能特性

分布式事务(Distributed Transaction-eXtended,简称 DTX)是蚂蚁集团自主研发的金融级分布式事务中间件,支持跨数据库、跨服务以及混合...云端恢复机制 提供完备的云端服务功能,帮助业务应用在出现异常事务时进行自动恢复,避免业务损失。

网络洞察仪

您可以将网络洞察仪作为业务单元的网络监测件,通过配置业务相关资源,网络洞察仪将为您分析业务单元流量的实时运行状况,帮助您及时感知业务网络异常,并提供网络质量评估和事件影响面分析。基本概念 术语 说明 网络洞察仪 由用户自定义的...

概述

系统出现慢SQL可能会导致CPU、负载异常系统资源耗尽等情况。严重的慢SQL发生后可能会拖垮整个数据库,对线上业务产生阻断性的风险,对于线上常见的慢SQL问题,MSE服务治理提供了场景化的解决方式。具体详情,请参见 慢SQL治理。数据库...

调试场景

若断言出现异常,请在右侧 响应详情 页签的 检查点信息 区域查看断言信息。若当前值为空,则表示未获取到出参值。图示中③为响应的错误信息,可显示异常响应详情,例如超时、参数错误、连接拒绝等。图示中④为请求在核心的生命周期内的耗时...

强弱依赖治理概述

如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的时候,将导致商品详情页部分内容加载不全,出现如下图的情况,但核心业务流程仍可继续推进,用户体验并未受到太多影响。通过以上对比可以看出,当下游依赖...

网络架构容灾

开启健康检查功能后,当后端某个ECS实例健康检查出现异常时,负载均衡会自动将新的请求分发到其他健康检查正常的ECS实例上,而当该ECS实例恢复正常运行时,负载均衡会将其自动恢复到负载均衡服务中。为了使健康检查功能正常运作,需要开启...

设备未上线问题

可能异常:通信链路异常。解决方法:排除物理连接断开、防火墙限制等问题。步骤六:确保子设备注册上线时配置的设备证书信息正确 使用如下命令,获取账号下所有子设备的设备证书信息(ProductKey、DeviceName)。cd/linkedge/gateway/build...

通过SkyWalking上报Python应用数据

通过SkyWalking为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用SkyWalking ...

调用链采样配置最佳实践

例如,调用链采样率由10%降低为5%,其链路数据对应的费用成本是减半的,但是链路价值并不会缩减一半,因为对于线上生产环境应用来说,出现错、慢、异常链路通常是小概率事件。ARMS支持应用级别设置固定概率采样策略,用户可以根据自身应用...

产品架构介绍

故障隔离:当局部Provider出现异常时,支持将异常的Provider进行故障隔离,保证所有机房内的Consumer均不会调用到异常的Provider,实现微服务流量的故障逃逸。单元化服务寻址:针对异地多活单元化架构,支持按照单元化规则寻址调用Provider...

配置数据层

当某个单元出现异常或者不可用的情况时,可通过切流单迅速将数据库从主单元切换到正常单元,保证业务的可持续性和稳定性。前提条件 配置MySQL数据层的前提条件:在两个单元环境中分别已创建一个或多个同名MySQL。具体操作,请参见 快速创建...

微服务治理概述

流量防护规则适用场景 MSE微服务治理企业版发布 离群实例摘除 当应用节点出现偶发异常时,MSE提供的离群实例摘除功能可以智能屏蔽此节点,等此节点恢复后再继续提供服务,从而屏蔽偶发异常导致的风险,保证业务正常运行。摘除离群实例 无 ...

Windows实例系统异常如何解决?

当磁盘异常时,检测结果将会出现错误提示,以系统盘文件损坏为例,检测结果如下:解决方案 您可以执行以下操作,手动修复系统异常。远程连接ECS实例。具体操作,请参见 连接方式概述。以管理员身份,打开CMD命令行窗口。执行如下命令,...

诊断服务端报错问题

步骤三:诊断异常出现的原因 掌握应用异常的统计信息还不足以诊断异常出现的原因。虽然日志中异常堆栈包含调用的代码片段,但并不包含这次调用的完整上下游信息和请求参数。ARMS探针采用了字节码增强技术,让您能够以很小的性能消耗捕获...

消息发送重试和流控机制

若由于系统异常触发了SDK内置的重试逻辑,则服务端需要等待最终重试结果,可能会导致消息发送请求链路被阻塞。对于某些实时调用类场景,您需要合理评估每次调用请求的超时时间以及最大重试次数,避免影响全链路的耗时。最终异常兜底:云...

基本概念

因此,如果一个服务出现问题,可能导致几十个应用都出现服务异常。分布式追踪系统可以记录请求范围内的信息,例如一次远程方法调用的执行过程和耗时,是我们排查系统问题和系统性能的重要工具。什么是调用链(Trace)?在广义上,一个调用...

附录:SOFAStack 产品目录

SOFAStack 源于自蚂蚁内部沉淀十多年的金融级分布式中间件技术体系,吸收了支付宝自创立以来在关键金融交易系统锤炼出来的架构实践。SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,...

应用防护规则适用场景

自动重试规则 场景说明 分布式系统中调用关系通常会比较复杂,服务之间的调用可能会偶尔出现异常。这些异常有的是不可恢复的(如业务错误),有的则是可以恢复的(如偶发的超时)。当系统遇到一些非致命性的错误(如偶现的超时等)时,可以...

质量规则参数配置

跨数据源对比字段会被自动转换为string类型,部分特殊字段类型可能会出现异常情况。建议码表中的字段类型和校验字段类型都是string或其他相同类型。码表:选择目标码表。码表名称:输入码表名称,作为质量规则配置时的提示信息。码表参照...

质量规则参数配置

跨数据源对比字段会被自动转换为string类型,部分特殊字段类型可能会出现异常情况。建议码表中的字段类型和校验字段类型都是string或其他相同类型。码表:选择目标码表。码表名称:输入码表名称,作为质量规则配置时的提示信息。码表参照...

通过SkyWalking上报Python应用数据

通过SkyWalking为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用SkyWalking ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
可观测链路 OpenTelemetry 版 负载均衡 云安全中心 Web应用防火墙 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用