可观测链路 OpenTelemetry 版
针对 PHP、C++、Go、Node.js 等多语言应用,提供端到端全链路追踪、应用监控与告警、链路拓扑、日志关联分析能力,并基于 OpenTelemetry 开源标准,兼容 Jaeger、Zipkin、SkyWalking 等开源项目数据上报。快速发现分布式应用架构下的性能瓶颈,缩短错/慢调用根因定位耗时,提高全栈开发与诊断效率。

产品优势

端到端全链路追踪
完整追溯用户终端、网关、微服务应用、云组件与基础设施间的调用轨迹,轻松实现全链路异常定位
一体化观测和全景拓扑
全景拓扑全量应用服务,并提供丰富的监控看板与完备的告警能力
全面兼容开源标准
基于 OpenTelemetry 标准,全面兼容 Jaeger、Zipkin、SkyWalking 等开源数据上报
大幅降低资源与人力成本
相较于开源自建,大幅降低搭建耗时与运维成本;按量付费,免去固定资源成本担忧

产品功能

多语言应用接入
基于 OpenTelemetry 标准,全面兼容各类开源生态,包括 Jaeger、Zipkin、SkyWalking 等。支持 Java、Go、Python、Node.js、.NET、PHP等 10+ 种语言接入,并提供全流程接入文档与 Demo。
直接上报
支持在多语言 SDK 或 Agent 中,直接通过相关协议上报链路数据。
转发上报
支持在多语言 SDK 或 Agent 中,先上报至独立的 OpenTelemetry Collector,再转发上报至服务端。
分布式调用链诊断
跟踪端到端用户请求(用户终端、网关、微服务应用、云组件与基础设施),汇总组装成分布式调用链,完整还原请求的轨迹与状态,快速定位错/慢调用根因。
调用链筛选
通过请求状态、耗时、应用名称、接口名称和主机地址等维度快速筛选调用链,查看满足条件的 Span 列表,请求数、错误数与耗时的时序变化曲线等。
调用链详情
选中一条调用链,查看链路下的所有接口、链路开始时间、总耗时、接口是否异常、以及每个接口的调用耗时。
调用链分析
支持上亿条调用链实时聚合与下钻,快速发现错、慢调用分布特征。支持散点图、全链路聚合等多种分析视图。
应用性能实时监控
实时统计应用、接口、主机地址等多维度调用情况,提供开箱即用的监控大盘与告警规则,快速发现应用性能问题。
应用概览
查看应用维度总体情况,包括请求量、耗时与错误时序曲线变化,TopN 接口状态等。
提供与依赖服务分析
查看接口维度的调用情况,支持对比分析。
数据库分析
查看数据库 SQL 调用情况,快速治理慢 SQL 等常见性能问题。
异常分析
查看 Exception 等异常信息,支持聚合统计与堆栈详情。
全景拓扑
分布式拓扑动态发现,实时绘制应用或接口上下游依赖拓扑,快速定位性能瓶颈。
智能告警
支持静态阈值、动态基线类型的告警规则、灵活匹配的通知策略与渠道、告警事件的分析与大盘等完善的告警能力,可快速对业务系统执行应急响应。

应用场景

多语言应用性能监控及全局可视化
端到端全链路追踪及问题定位
多语言应用性能监控及全局可视化
多语言类应用统一基于 OpenTelemetry 标准接入,从而对所有接入的应用进行统一的监控告警,提供应用、接口、主机地址等多维度监控能力,并提供开箱即用的默认监控大盘。同时通过调用关系动态发现与渲染全局服务拓扑。针对业务场景的自定义需求,支持根据既有数据源自定义指标监控大盘。
端到端全链路追踪及问题定位
在分布式场景下,服务调用错综复杂,问题分析与定位非常困难,分布式全链路跟踪能力能够迅速定位到有问题的服务,协助快速解决问题节点。通过完整的应用调用拓扑关系,可自动发现该服务之前的调用以及对所有中间件的调用,绘制整个系统的完整调用拓扑关系。在调用关系拓扑中,对不健康应用进行显示标识,便于快速发现有问题应用并进行分析。调用拓扑中的应用都可以单独进行下钻分析,可以从吞吐量、错误率、响应时间等指标对应用性能进行详细分析。

更多产品与服务

应用实时监控服务 ARMS
包含前端监控、应用监控、云拨测等子产品。覆盖浏览器、小程序、APP、分布式应用、容器等不同可观测环境与场景。帮助企业实现全栈性能监控与端到端追踪诊断。提高监控效率,压降运维工作量。
可观测可视化 Grafana 版
作为云原生的运维数据可视化平台,面向用户提供免运维和快速启动 Grafana 运行环境的能力,默认集成如数据库 MySQL、消息队列 RockteMQ、实时计算 Flink、Elasticsearch、可观测监控 Prometheus 版、日志服务SLS等各类阿里云服务数据源,并提供丰富的数据看板,让运维监控更加高效、精细。
可观测监控 Prometheus 版
基于开源 Prometheus 构建的全托管监控服务。无需部署与运维,默认集成常见云服务并兼容相关开源组件。提供开箱即用的 Grafana 看板和告警服务,帮助企业快速搭建监测体系。
性能测试 PTS
支持按需发起压测任务,可提供百万并发、千万 TPS 流量发起能力,100% 兼容 JMeter。提供的场景编排、API 调试、流量定制、流量录制等功能,可快速创建业务压测脚本,精准模拟不同量级用户访问业务系统,帮助业务快速提升系统性能和稳定性。

文档与工具