什么是应用实时监控服务ARMS?

完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能表现情况,并支持日志数据查询,帮助您快速跟踪定位故障原因,提升用户体验。...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

发现并处理大Key和热Key

在使用 云原生内存数据库Tair 的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能...

发现并处理Redis的大Key和热Key

在使用Redis的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能引发的问题及如何快速...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

通过错/慢调用链排查应用产生异常的原因

在生产环境中,引发应用异常(如耗时突增、错误突增)的原因有很多,常见的包括流量不均、单机故障、程序异常和依赖组件故障等。在新应用上线或大促备战前通常建议做一次系统性的性能调优,分析当前系统存在哪些性能瓶颈,梳理出常出错的...

附录:SOFAStack 产品目录

混合云场景 API 生命周期管理:云间网络互通的基础上提供 API 生命周期管理,避免所有 API 都对外暴露,提高安全性。高性能跨云 RPC 调用:支持跨云的场景下的 RPC 调用,使用方式同云内调用。超强安全保障能力:提供多种安全能力确保...

功能概览

应用下钻和性能分析 支持基于应用>上下游应用>接口等逐层下钻分析,并展现其黄金性能指标(比如吞吐量、平均响应时、错误、满意度等),建立由底层到上层间的数据关联信息,从而深度分析分布式场景下的影响应用性能的问题根因。...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理和实例操作系统内相关配置进行方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

源站探测

全球加速提供源站探测功能,您可以通过全球加速的监听创建源站探测任务,实时监控从探测点经过全球加速至源站的链路网络质量,从而快速定位网络故障,针对性的进行网络优化。源站探测介绍 您可以为全球加速的监听创建源站探测任务,源站...

如何使用Prometheus监控Windows

Windows Metric监控参考模型 这里以Metric采集、监控大盘、告警规则三个维度定义Windows Metric监控的参考模型,以实现对Windows方位的监控。Metric采集 Windows基础监控指标主要包含CPU、内存、磁盘、网络和进程等。CPU指标 CPU作为...

如何使用Prometheus监控Windows

Windows Metric监控参考模型 这里以Metric采集、监控大盘、告警规则三个维度定义Windows Metric监控的参考模型,以实现对Windows方位的监控。Metric采集 Windows基础监控指标主要包含CPU、内存、磁盘、网络和进程等。CPU指标 CPU作为...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

账单查询

您可以根据所需按日或按月查询站加速账单。站加速支持按流量计费、按峰值带宽计费、按增值服务计费和按实时日志条数计费查询账单。查询站加速账单,便于您及时了解其收费明细,更好的从费用分配角度进行业务决策。本文档为您介绍了...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

运维事件中心的审计事件

事件名称 事件含义 AddProblemServiceGroup 新增故障应急协同组。BillingStatistics 计费展示。CancelProblem 故障取消。CheckWebhook 校验Webhook。ConfirmIntegrationConfig 确认集成配置。Create 登录产品售卖页面进行的购买操作。...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

RDS SQL Server CPU使用高问题排查

应用负载高 现象 没有出现慢查询(或者慢查询不是问题的主要原因),QPS和CPU使用曲线变化吻合。常见于应用优化过的在线事务交易系统(比如订单系统)、高读取的热门Web网站应用等。特征 实例的QPS高,查询比较简单、执行效率高、优化...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

Quick BI电子表格查询报错“轴查询错误”

问题描述 Quick BI电子表格正常插入数据集,配置查询条件后,点击查询报错“轴查询错误”。问题原因 查询条件的数据中有不符合格式的“脏数据”。解决方案 找出并删除影响电子表格查询的“脏数据”。适用于 Quick BI

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

查看运营统计信息

在 能力调用统计 页面,您可以看到以下数据:调用总数 调用失败数 平均响应时长(ms)调用成功 应用能力使用统计 中心应用名称 应用编码 调用次数 成功 平均响应时长(ms)基础能力使用统计 中心应用名称 基础能力 健康度得分:根据...

查看监控报表

Data Cache命中 本地存储缓存命中,计算方式为缓存命中次数除总读取数据次数。Data Cache驱逐次数 自上次启动以来缓存驱逐总次数。Data Cache命中次数 本地存储缓存命中次数。Data Cache未命中次数 本地缓存未命中次数。资源组指标 ...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

资源监控

通过对 CDN 资源的监控,您可以全面了解带宽使用情况以及缓存命中等关键指标,从而进行优化和调整。功能介绍 资源监控和实时监控相比,资源监控的单次查询最大时间和可查询历史数据时间范围更大,详情请参见下方报表。支持查询的时间粒度...

API概览

故障演练 故障演练的相关API如下表。API 描述 CreateExperiment 调用CreateExperiment接口新建一个故障演练。UpdateExperiment 调用UpdateExperiment接口编辑故障演练基本信息及流程定义。ExecuteExperiment 调用ExecuteExperiment接口执行...

查询故障时间线列表

查询故障时间线列表 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/...

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细化摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

故障应急

故障管理体系是围绕故障全生命周期采取的一系列控制流程,包括故障基础数据管理(故障等级定义、应急场景监控覆盖、服务组&值班表管理、故障订阅管理),故障发现(7*24监控值班、智能基线告警),故障应急协同(故障通告及更新、故障应急...

GetExperimentTask

调用GetExperimentTask接口查询故障演练任务详情。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String...

查询故障列表

查询故障列表。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/...

什么是用户体验监控

完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能表现情况,并支持日志数据查询,帮助您快速跟踪定位故障原因,提升用户体验。...

实时Top Key统计

云数据库Redis版 集成了DAS的Key分析功能,可展示实例当前实时和历史的大Key和热Key,包括...排查Redis CPU使用高的原因,请参见 排查Redis实例CPU使用高的问题。排查Redis内存使用高的原因,请参见 排查Redis实例内存使用高的问题。

捷顺

客户价值 DAS服务让DBA可以提前洞察到数据库的运行趋势,及时做好预案,系统故障率降低了60%以上,大幅提高了客户满意度和用户体验。DAS服务自动SQL限流和自动SQL调优,帮助DBA从救火员转向数据库架构师,有更多时间和精力帮助研发优化系统...

常见问题-FAQ

网生效时间:GTM无法保证全网的最终生效时间,因受限于全国各地运营商的TTL缓存设置以及网络环境不同,所以全网生效时间取决于全国各地运营商的缓存设置时间。全局流量管理(GTM)的地址池是否可以使用域名?答:可以。GTM的地址池内可以...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 数据库自治服务 商标服务 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用