应用场景

业务护航 您可以阶段性地或定期梳理涉及资金链路的核心业务。可通过配置核对规则,对各类数据作相互核对,或对数据内容作逻辑检查,系统将按规则监控业务的资损风险。变更风险检查 业务变更发布前,您可以添加变更业务表与关联表的核对规则...

通过可观测性能力进行故障处理最佳实践

本文为您介绍如何将 云消息队列 RocketMQ 版 可观测性功能应用于 云消息队列 RocketMQ 版 的故障管理场景中,为您的日常运维和故障处理提供实践方案。设计思路 核心问题 运维场景下,故障处理的核心问题如下:服务出现异常如何预警并上报 ...

2022年

修复任务指定机器都掉线时,开启故障机器自动转移功能无效的问题。任务管理 2022-03-15 变更类型 功能描述 相关文档 新增 概览页功能更新:增加每分钟触发汇总图表。增加汇总数据链接跳转。增加在线Worker列表展示。无 专业版和基础版进行...

混合云应用双活容灾最佳实践

容灾切换数据质量保障难 容灾切换过程中,可能因数据同步延迟导致读到旧数据,以及切换规则推送到分布式应用节点时间不一致等原因可能造成云上云下数据库同时读写而出现脏写的问题,整个切换过程数据质量保障是关键点及难点。无业务代码...

通过SkyWalking上报Java应用数据

通过SkyWalking为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用SkyWalking ...

网络最大传输单元MTU

巨型帧(Jumbo frames)巨型帧是指有效负载超过IEEE 802.3标准所限制的1500字节的以太网帧,增大的有效载荷百分比有助于提高链路利用率,获得更好的网络性能。阿里云支持8500字节的巨型帧,允许您发送8500字节载荷的以太网帧。当前所有ECS...

开启网关日志投递

启用链路追踪后,您可以在 阿里云链路追踪服务 控制台查看网关监测数据。具体操作,请参见 开启网关链路追踪。开启日志投递以后,在 可观测性参数 区域,单击 Project 右侧的链接,系统会自动跳转到该网关对应投递的日志库。更多内容,请...

使用阿里云CDN加速后网站访问速度较慢

因此,造成访问慢的可能原因可以简单归纳为以下几个类型:客户端本地网络因素,例如客户端下行带宽不足、DNS配置错误等。客户端到CDN节点之间的网络不佳,网络延迟较高。CDN节点异常,响应速度慢。资源内容比较大,导致下载比较耗时。CDN回...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

东软案例

总得来说,造成这种现象的主要问题原因,可总结为以下两个方面:新需求推动IT系统监控数据量激增:移动智能终端设备的普及使应用逐渐渗入到我们工作生活的方方面面,企业应用数量激增。企业面向客户、合作伙伴和内部员工建设IT系统及应用...

源站探测

全球加速提供源站探测功能,您可以通过全球加速的监听创建源站探测任务,实时监控从探测点经过全球加速至源站的全链路网络质量,从而快速定位网络故障,针对性的进行网络优化。源站探测介绍 您可以为全球加速的监听创建源站探测任务,源站...

本地IDC通过ECR主备专线链路上云方案

本文介绍如何组合使用物理专线和专线网关ECR,实现本地数据中心IDC通过ECR主备专线链路上云并和云上专有网络VPC互通。场景说明 本文以下图场景为例,为您介绍IDC通过ECR主备专线链路上云方案。某企业在上海拥有一个IDC,其中部署有数据库...

本地IDC通过ECR实现负载专线链路上云方案

本文介绍如何组合使用物理专线和专线网关ECR,实现本地数据中心IDC通过ECR实现负载专线链路上云并和云上专有网络VPC互通。场景说明 本文以下图场景为例,为您介绍IDC通过ECR负载专线链路上云方案。某企业在上海拥有一个IDC,其中部署有数据...

如何排查Java场景下故障注入不生效的问题

为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,您需要先确认该演练的故障执行步骤是否已开启Debug模式。若...

故障演练常见问题

故障不生效的原因较多,可能是参数配置不正确或无对应的请求命中,但故障规则已成功下发,故需要计费。刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主...

通过调用链路和日志分析定位业务异常问题

定位业务异常问题难度大、效率低,为了解决这一难题,ARMS应用监控通过结合调用链路和日志分析,可以快速、准确地定位业务异常问题,提升微服务框架下的诊断效率。前提条件 已开通日志服务SLS。登录 日志服务控制台 时,根据页面提示开通...

常见报错

可能原因:DBS服务调用备份计划管理的备份网关无响应,且重试次数达到100次上限,常见原因为备份网关掉线。报错示例:DBS-000000 Scheduling failed,the task has been retried,exceeding the maximum limit 解决方法:进入目标备份计划 ...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

为什么某个Bucket突然产生大量的下行流量费用?

本文介绍某个Bucket突然产生大量下行流量费用的可能原因及解决方法。Bucket ACL设置为公共读或公共读写 当您的Bucket ACL设置为公共读或者公共读写时,任何人(包括匿名访问者)都可以对该Bucket中的文件进行读操作,从而产生大量的下行...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

应用诊断

应用诊断是对应用的单独故障诊断,可以由链路诊断触发或人工触发。高可用管理平台通过应用诊断初步定位问题,锁定可疑应用,再通过 Arthas 和线程分析进一步确认问题。目前,应用诊断支持用户应用和蚂蚁应用。应用诊断是故障诊断的原子能力...

网络诊断

诊断参数如下:参数 说明 源地址 Pod、Node地址 目标地址 Service的集群IP 端口 需要诊断的端口 协议 需要诊断的协议 场景三:诊断DNS链路的网络 当访问目标为域名时,除源地址到目标域名IP的链路外,可能还需要检查集群内的DNS是否工作...

读多写少型业务场景多活实践

导购链路对商品应用是强依赖,强依赖故障将导致业务不可用,因此故障的爆炸半径应该控制在单元内。创建故障演练。创建杭州单元商品中心故障的演练,具体操作,请参见 创建演练。故障注入。在多活容灾的 监控大盘 页面 异地双活 区域,查看...

故障取消

cancelReason Long Body 否 取消原因 取消原因 problemNotifyType Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 ...

关键技术竞争力

三位一体的业务可观测能力 TRaaS 技术风险防控平台提供多元框架协议,采集监控、链路、日志等多样数据,并支持按业务场景进行多维聚合,以业务监控为核心建立业务连续性保障体系,通过监控下钻、链路分析、日志关联、故障决策树诊断,共同...

故障排查

排查故障的经典步骤与常见原因 如何通过查看日志排查故障?ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的...

什么是物联网平台

解决方案 物联网平台业务链路设计方案 设备数据安全解决方案 设备消息收发解决方案 消息保序递交解决方案 其他阿里云物联网服务 IoT设备身份认证 面向物联网的设备身份认证服务,提供设备与物联网平台云端的双向身份认证和链路加密功能。...

为什么在控制台看不到数据?

控制台没有数据的可能原因:网络无法连通 控制台中上报开关设置有误 SLS数据源上报失败 HTTP上报数据失败 gRPC上报数据失败 监控任务状态异常 控制台链路数据异常问题:控制台链路数据不符合预期 网络连通性排查 确认代码中的上报地址是...

什么是容器报警演练

不同于其他故障演练模块对系统注入真实故障,报警演练只会对集群的API Server投递事件,由事件触发报警链路,不会对系统造成真实故障。无侵入。无需在用户集群中安装探针以注入故障,所有事件投递都是通过API Server来进行网络请求。

功能发布记录

故障演练支持自定义监控 故障演练支持自定义监控。演练场景、演练方案、演练执行单展示优化 演练场景、演练方案、演练执行单展示优化,区分我的和全部。场景实例、系统原子操作展示优化 场景实例、系统原子操作展示关联演练执行单列表。...

CDN加速和OSS传输加速的区别

详细信息 阿里云对象存储OSS以海量、安全、低成本、高可靠等特点已经成为用户存储静态资源和文件的首要选择,实际使用中面向全球各地用户访问OSS资源时,访问速度会受到客户端网络、OSS的下行带宽、Bucket地域、访问链路长等限制出现访问慢...

使用前后端链路追踪诊断API错误原因

在前端监控中,即便已知API的请求耗时,也无从知晓准确的网络传输性能、后端服务的调用链路及性能,因而无法快速准确地排查应用API问题。前后端链路追踪功能可以解决此类问题,它会将API请求从前端发出到后端调用的链路串联起来,真实还原...

为什么在控制台看不到数据?

控制台没有数据的可能原因:网络无法连通 控制台中上报开关设置有误 SLS数据源上报失败 HTTP上报数据失败 gRPC上报数据失败 监控任务状态异常 控制台链路数据异常问题:控制台链路数据不符合预期 网络连通性排查 确认代码中的上报地址是...

概述

分布式链路跟踪系统(Distributed System Tracing,简称 DST)是面向分布式架构、微服务(Spring Cloud、SOFAStack、Service Mesh 等)架构等云原生架构的一种具有应用可观察性(Observability)的金融级解决方案。通过 DST,运维人员、...

智能瓶颈分析

智能瓶颈分析通过在压测期间对服务端应用定时巡检,自动发现的异常问题,并给出...单击 疑似根因,可以对异常原因做进一步的下钻分析。单击 链路详情,可以跳转到具体的异常调用链。展开可查看方法栈和对应时段的监控指标。方法栈 监控指标

流水单据型业务场景多活实践

在 读多写少型业务场景多活实践 中,已经将导购链路进行了异地多读改造,而该业务后续在一次大促期间,遭遇了一次订单应用大面积故障,导致大促期间下单业务长时间无法使用,于是下单业务的容灾建设也提上了议程。下单业务是典型的流水单据...

同城多活架构实践

演练预期:电商首页展示的查询链路对商品应用是强依赖,强依赖故障将导致业务不可用,且故障的爆炸半径应该控制在单元格内。创建故障演练。创建杭州单元格B下的商品应用故障演练(例如网络丢包)。具体操作,请参见 创建演练。故障注入。在...

Dataphin维度逻辑表修改之后提交的时候报执行链路异常...

问题描述 Dataphin维度逻辑表修改之后提交的时候报执行链路异常错误,错误情况如下:问题原因 节点输出名称以数字开头导致的错误。解决方案 将以数字开头的节点输出名称修改后正常提交。适用于 Dataphin 当前版本:私有云独立部署V2.9.5.3

概述

链路追踪:支持网格外部应用调用网格内部应用并形成一个完整的链路追踪信息 链路数据透传:支持应用调用上下文中存放数据,达到整个链路上的应用都可以操作该数据。故障剔除:目前支持 bolt 协议。它会自动监控 RPC 调用的情况。协议支持 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
可观测链路 OpenTelemetry 版 数据库自治服务 应用实时监控服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用