故障排查

本文介绍微服务引擎MSE在使用过程中常见问题的故障分析和排查流程。微服务注册配置中心问题排查 在浏览器中输入 XXX:8848/nacos,访问MSE的Nacos注册中心时返回404错误。具体操作,请参见 通过“XXX:8848/nacos”访问MSE的Nacos注册中心时...

更新故障时间线

PROBLEM_KEY_NODE content String Body 否 故障分析 节点内容 time String Body 否 2021-01-08 10:10:10 发生时间 problemId Long Body 否 234 故障id clientToken String Body 否 c26f36de-1ec8-496a-a828-880676c5ef81 幂等标识 返回数据...

什么是用户体验监控

ARMS 用户体验监控(Real User Monitoring,RUM)专注于对Web场景、App移动应用场景和小程序场景的监控,以用户体验为切入点,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性...

故障排查

本文介绍阿里云容器服务ACK集群在使用过程中常见问题的故障分析和排查流程。ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

什么是云拨测

数据可视化:通过直观的数据展示和报表,您可以轻松了解网络状况、性能以及故障分析。应用场景 网络性能监控:云拨测可以帮助企业和个人用户实时监控网络状况,确保业务运行的稳定性和可用性。业务可用性验证:通过模拟真实用户请求,云拨...

跟踪概览

故障诊断与运维 服务故障分析:在出现服务中断或性能下降时,可以使用跟踪日志来分析事件前后的操作,以帮助确定故障原因。配置变更追踪:记录对云资源配置的所有更改,帮助识别可能导致服务中断的配置错误。基本概念 概念 说明 跟踪 跟踪...

应用场景

故障关联分析:以应用为中心,覆盖组件、实例、主机、云资源等多维度关联分析,迅速找到异常故障点。问题分析与快速定位 在分布式场景下,服务调用错综复杂,问题分析与定位非常困难,分布式链路跟踪系统能迅速定位到有问题的服务,协助...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

功能特性

继而在风险事件发生时,将例行化、程式化、标准化的排查过程,通过故障决策自动执行,并直接反馈诊断结果。通过故障诊断平台,能够极大地缩短故障排查时间。同时,屏蔽了不同运维人员在故障排查时的经验和技能差异,实现故障的快速定位。...

设计方案

故障复盘:故障复盘是指对故障进行分析和总结,以便更好地避免故障的再次发生。在故障复盘过程中,需要对故障的起因、影响、处理过程等进行详细的记录和分析,并制定相关的措施。故障复盘也是一种学习和提高的过程,能够不断完善系统和提高...

指标拆解

例如,指标拆解可以方便的查看多个维度中的各个成员对整体的贡献,您也可以将度量值分解至一个或多个组,分析每个组的数据情况。本文为您介绍如何为指标拆解添加数据并配置样式。前提条件 已创建仪表板,请参见 新建仪表板。图表概述 ...

附录:SOFAStack 产品目录

分析服务性能:调用拓扑中的应用都可以单独进行下钻分析,可以从吞吐、错误率、响应时间等指标对应用性能进行详细分析。应用性能和架构的优化 在调用关系拓扑中能对各个应用的调用次数和耗时情况进行查看和分析,找到负载较高和负载较少的...

使用执行计划分析查询

本文介绍如何使用Stage层和算子层执行计划分析查询。Stage层执行计划 Stage层执行计划由多个Stage节点组成,数据流向自下而上,先由具有扫描算子的Stage进行数据扫描,再经过中间Stage节点的层层处理后,再由最上层的根节点将查询...

查看实例的系统日志和屏幕截图

您可以利用这些功能分析排查实例故障,例如诊断操作系统无响应、异常重启或者无法连接实例等。前提条件 实例必须处于 运行中(Running)状态才能获取系统日志和屏幕截图。背景信息 云服务器ECS的系统日志是运维诊断的重要一环。如果您需要...

CLB访问日志功能简介

CLB结合阿里云日志服务提供的访问日志功能,可帮助您大幅提升日志数据分析故障定位处理的效率。什么是CLB访问日志 CLB的访问日志功能收集了所有发送到CLB的请求的详细信息,包括请求时间、客户端IP地址、延迟、请求路径和服务器响应等。...

通用性能

告警 支持主流协议 Snmptrap、Syslog、PING(同时支持采集性能告警)告警解析能力:支持 实时计算引擎,1万记录数/秒的分析入库 故障收敛能力:支持 按照规则和拓扑压缩归并 诊断自愈能力:支持 执行预分析和自动化管控任务,设备场景做到1...

多账号操作日志统一归集与审计

日志分析及高危操作洞察 基于审计日志能够实现持续监控告警及安全分析,及时洞察可能存在的高危操作、非法操作等,并支持日常故障排查。​ 使用场景 场景一:应对企业外审要求 场景描述 企业受外部审计机构要求,必须留存180天及以上的审计...

配置CLB访问日志

CLB结合阿里云日志服务提供的访问日志功能,可帮助您大幅提升日志数据分析故障定位处理的效率。使用限制 仅CLB的七层负载均衡(HTTP/HTTPS监听)支持访问日志功能。前提条件 已创建CLB实例。具体操作,请参见 创建和管理CLB实例。已创建...

诊断决策

您可以通过诊断决策,编排故障排查的过程。对于已知的明确故障,可以根据诊断现象,编排诊断决策,进而故障发生时执行,完成故障定位。对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策 ...

概述

通过 DST,运维人员、开发人员和架构师能看清楚复杂的大规模微服务架构下的应用及服务之间的 复杂调用关系、性能指标、出错信息 与 关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运...

基本概念

故障管理 网络故障的发现、分析、定位等维护管理,包括告警信息的收集入库、规则匹配、关联分析以及告警清除等一系列流式处理过程。Netconf netconf协议一般用于网络业务配置,使用结构化可描述语言实现快速的网络设备下发。gRPC 高性能、...

订阅事件通知

数据传输服务DTS(Data Transmission Service)已接入云监控平台,您可以通过事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。背景信息 云监控...

诊断规则

通过故障诊断平台,运维人员可以将诊断过程、排查顺序进行图形化编排与设计,即故障诊断决策。而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现...

分布式链路概述

分布式链路(原 SOFAStack 中间件中的 概述)会逐步融合到业务智能可观测服务中,实现监控和链路分析一体化,方便用户对问题进行跟踪定位,对应用性能、调用链路进行实时分析。背景信息 分布式链路是面向分布式架构、微服务(比如 Spring ...

什么是业务实时监控

分布式链路:提供应用拓扑和链路查询功能,观测应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维开发工作。日志查询和日志关联...

功能架构

分布式链路 分布式链路帮助运维人员、开发人员和架构师看清楚复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

应用场景

物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测和故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

Quick BI怎样使趋势分析表的形展示默认展开或关闭

概述 Quick BI怎样使趋势分析表的形展示默认展开或关闭。详细信息 趋势分析表由趋势分析图和趋势分析明细表组成,您可以通过趋势分析图查看指标的宏观趋势,然后通过趋势分析表查看指标详情,帮助您更好的分析决策。用户可以根据自己需要...

趋势分析

趋势分析表由趋势分析图和趋势分析明细表组成,您可以通过趋势分析图查看指标的宏观趋势,然后通过趋势分析表查看指标详情,帮助您更好的分析决策。本文为您介绍如何为趋势分析表添加数据并配置样式。前提条件 已完成数据建模,数据集必须...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

功能特性

堆内(total 和 used)和堆外内存统计 堆内各个内存空间占用内存统计 垃圾回收(GC)占整个进程运行时间比例 QPS 按 1s、15s、30s、60s 的 CPU 统计 libuv 句柄,定时器统计 …… 安全提醒 npm 模块安全漏洞提醒 故障排查 热点函数分析,...

什么是云网管

观测平台(Observation Platform)基础设施运行状态维护和管理,包含性能数据和告警数据,实现对各类监控对象的异常数据判定,网络故障的发现、分析、定位等维护管理。高效采集,分钟级故障定位发现。自定义采集方式和分析过程,兼容所有...

Quick BI趋势分析表如何配置形展示

概述 本文描述了Quick BI趋势分析表如何配置形展示。详细信息 在字段配置中选择批量配置,添加形结构即可。适用于 适用产品:Quick BI 适用版本:公共云专业版

监控与日志

例如您可以根据通过捕获的流量信息分析带宽使用情况、排查网络故障、优化流量使用成本、分析异常流量等。云企业网流日志 流日志会在指定的捕获窗口捕获转发路由器之间的跨地域流量信息和边界路由器VBR(Virtual border router)连接的流量...

操作指南

DataV可视分析地图 管理数据 添加PolarDB PostgreSQL数据库 添加RDS PostgreSQL数据库 管理项目 数据源管理 图层管理 图层交互管理 其他更多操作请参见 操作指南。DataV可视分析创作间 创建数据集 可视分析数据集 自定义编辑卡片 分享...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

AIOps 解决方案专家服务内容说明

智能故障发现解决方案 基于调研与评估的结果,为客户设计智能故障发现解决方案,包含:多账号统一监控数据接入,并根据应用分组为客户设计AI算法能力用于实时故障发现,并根据分析结果智能定位根因,提供实时异常检测的稳定性方案,保障...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
检索分析服务 Elasticsearch版 云安全中心 实时数仓 Hologres 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用