性能监控最佳实践

其次,由于不同系统的业务归属等问题,无法完成全链路协议栈统一,为了实现多端联动,需要由 Trace 系统提供异构协议栈的打通方案。为了实现异构协议栈的打通,Trace 系统需要支持两项能力:协议栈转换与动态配置,比如前端向下透传了 ...

Pipeline执行引擎

阻塞算子依赖操作系统的线程调度机制,线程切换开销较大(尤其在系统混布的场景中)。这一系列的问题,促使SelectDB需要适应现代多核CPU体系结构的执行引擎。如下图所示,基于多核CPU的特点,Pipeline执行引擎经过重新设计,成为由数据驱动...

服务器数据采集方案概述

应用系统在提供服务过程中,会产生日志数据、系统指标数据、审计框架数据、检测状态数据以及各类APM监控数据。针对这些数据,可以根据业务的需求和环境,选择对应的方案进行数据采集并传输到Elasticsearch服务。本文对服务器数据采集方案...

智能诊断

您可以使用智能诊断功能对任务进行全链路分析,当任务运行不符合预期时,您可以使用该功能快速定位问题。功能概述 智能诊断功能可以基于以下维度对任务进行诊断分析:全链路分析:检查上游任务运行情况:上游任务运行失败时,将阻塞当前...

功能发布记录(2022年)

新增 MSE Nacos风险管理 ZooKeeper专业版新增服务推送轨迹能力 ZooKeeper专业版新增服务推送轨迹能力,可展示从服务端到客户端推送链路上的相关信息,帮助用户清晰地观测推送功能的履约情况,从而提高问题的排查效率。新增 数据轨迹 发布...

使用ping命令丢包或不通时的链路测试方法

mtr:根据客户端操作系统环境的不同,在Windows操作系统上使用WinMTR或在Linux操作系统上执行mtr命令,设置测试目的地址为目标服务器域名或IP地址,然后进行链路测试,记录测试结果。反向链路测试(ping和mtr)。进入目标服务器操作系统...

2024年

无 修复 修复AOCS ANALYZE链路 coredump 的问题。修复冷热分层存储在无分区表名、父表包含NOT NULL约束等特殊场景转冷失败的问题。修复Agg Filter解析出现 variable not found in subplan targetlist 的问题。修复新增sortkey时出现 ...

通过Albconfig开启Xtrace实现链路追踪

阿里云提供了链路追踪服务,为分布式应用的开发者提供了完整的调用链路还原、调用请求量统计、链路拓扑等,以快速分析和诊断分布式应用架构下的性能瓶颈,提高微服务时代下的开发诊断效率。您可以为集群安装ALB Ingress Controller组件并...

诊断服务端报错问题

网页抛错是互联网应用最常见的问题之一,但其错因分析是一个难点。为应用安装ARMS探针后,就能在不改动应用代码的情况下,借助ARMS应用监控的异常自动捕捉、收集、统计和溯源等功能,准确定位应用中所有异常并进行线上诊断。问题描述 网页...

通过Zipkin上报Go应用数据

通过Zipkin为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用Zipkin为Go应用埋点...

性能测试

适用场景 性能压测可以用于以下场景:新系统上线支持:在新系统上线前,通过执行性能压测能够对系统的负载能力有较为清晰的认知,从而结合预估的潜在用户数量保障系统上线后的用户体验。技术升级验证:在系统重构过程中,通过性能压测验证...

什么是推荐全链路深度定制开发平台PAI-REC

推荐全链路深度定制开发平台PAI-REC(PAI是Platform of AI的缩写,Rec即Recommendation的简称),是适用于企业开发者自主搭建、开发、迭代、运维的一整套推荐系统平台级服务。推荐系统是一个比较复杂的系统化工程,推荐系统分为离线、在线...

微服务治理概述

无 消除变更过程中的风险 功能 使用场景 相关文档 相关视频 无损上线 在某些场景下,服务提供者需要接收大流量请求并成功返回,而刚启动的冷系统直接处理大量请求,可能会由于应用内部资源初始化不彻底从而出现请求阻塞、报错等问题。...

大数据上云及巡检服务内容说明

迁移方案设计服务范围 针对客户业务系统链路改造上阿里云计算平台的整体迁移链路技术方案设计:通过调研客户当前的业务系统链路架构、上云要求,设计满足客户要求的包括数据及任务的增量迁移/存量迁移/增全量合并/一致性校验/sql改造一...

容量规划

容量规划是指根据业务需求和系统性能,包括用户量、数据量、并发量等指标,合理规划和配置系统集群资源,以满足系统扩展、用户增长和负载增加的需求。通过容量规划可以确定系统能够承载的最大用户量和并发请求量,并提前预防系统资源不足和...

可观测性的设计原则

链路追踪 当系统出现问题时,需要能够追踪系统中每个组件的行为和交互情况。通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求...

可观测性体系概述

可观测性是一种通过分析系统外部输出结果推断及衡量系统内部状态的能力。Kubernetes可观测性体系包含监控和日志两部分,监控可以帮助开发者查看系统的运行状态,而日志可以协助问题的排查和诊断。本文介绍阿里云容器服务ACK可观测性生态...

功能特性

针对巡检后发现的问题,智能洞察可以给具体的根因分析和建议,同时支持订阅告警。事件中心 事件中心将云产品所生成的事件数据进行统一管理、存储、分析和展示,当您的应用使用了相关的产品,对应的事件会自动接入事件中心进行统一的分析...

流量防护规则适用场景

不稳定场景 在生产环境中您可能遇到过以下不稳定的情况:大促时瞬间洪峰流量使得系统超出最大负载、Load飙高、系统崩溃导致用户无法下单。“黑马”热点商品击穿缓存、数据库被打垮、挤占正常流量。调用端被不稳定第三方服务拖垮、线程池被...

节点诊断

ECSControllerManager 检查ECS实例常见问题,检查项包括ECS实例状态、网络链路、操作系统、磁盘IO等。GPUNode 检查使用GPU设备的节点,检查项包括NVIDIA模块状态、驱动配置等。Node 检查项名称 检查项说明 修复方案 集群API Server连接状态...

诊断应用卡顿问题

针对这类问题,ARMS提供持续剖析、调用链路诊断、接口监控等一套解决方案,帮助您快速准确定位应用中所有慢调用,进而解决应用卡顿问题问题分析 网站卡顿、页面加载过慢是互联网应用最常见的问题之一。排查、解决网站卡顿、页面加载过慢...

访问ECS实例异常时的问题排查和指引

本文主要介绍通过私网或本地公网访问ECS实例上相关业务时,整个链路中可能引发访问异常的关联因素及可能导致的症状、访问异常时的相关排查方案等内容。背景信息 在通过私网或本地公网访问ECS实例时可能会引发访问异常,本文介绍出现问题的...

实例诊断

当您的 全球加速 实例遇到问题时,您可通过实例诊断功能进行诊断排查。实例诊断功能支持检测 全球加速 实例的配置与运行状态,并能根据诊断的异常项提供智能修复建议。诊断内容主要包括:配置诊断、容量超限诊断、证书诊断、安全策略诊断、...

新功能发布记录

2021.08.10 标准版、高级版用户 场景业务定制 召回效果精细分析 支持根据各个召回链路、召回链路中的子链路(如用户偏好召回中的,偏好品牌召回),最终获得用户点击、转化的效果分析,从而辅助评判召回链路效果,调整实验中链路优先级。...

概述

什么需要冷启动 通常推荐系统通过协同过滤、矩阵分解或是深度学习模型来生成推荐候选集,这些召回算法一般都依赖于用户-物品行为矩阵。在真实的推荐系统中,会有源源不断的新用户、新物品加入,这些新加入系统的用户和物品由于缺乏足够...

什么是云消息队列 RocketMQ 版?

什么选择云消息队列 RocketMQ 版 云消息队列 RocketMQ 版 基于阿里云云原生优质的基础设施实现,兼容Apache RocketMQ的核心API和功能。相对于自建RocketMQ集群,云消息队列 RocketMQ 版 具有如下优势:架构先进性 全面采用存储和计算分离...

什么是应用实时监控服务ARMS?

友邦人寿 我们采用ARMS搭建根据业务价值自上而下设计的可观测系统,在采集层使用ARMS Agent采集调用链路/性能数据、Prometheus Exporter采集容器集群数据,在存储层使用阿里云Prometheus存储容器集群和应用监控数据、SLS存储日志和调用链...

压测TCP协议

Hi 参设置 在串联链路参设置 页签设置参。具体操作,请参见 接口参。检查点设置 在串联链路的 检查点设置 页签设置检查点。具体操作,请参见 检查点(断言)。控制器和定时器(可选)您可以根据不同压测场景的需求,添加控制器...

配置检查项

在进行数据开发前,可通过检查项对数据开发功能相关的约束进行检查,当检查不符合约束规范的内容时,系统会生成影响开发流程正常执行的问题事件,您可基于该事件处理暴露的问题,以保障数据开发流程可以正常执行。本文为您介绍如何查看并...

功能特性

专线备份:在客户网络中已有专线链路情况下,可增加智能接入网关作为备份上云链路。专线+Internet备份:智能接入网关支持Internet链路和专线互为备份链路,当主用链路发生故障时,自动切换至备用链路接入阿里云。说明 目前仅 SAG-1000...

创建压测场景

参设置 在串联链路参设置 页签设置参。具体操作,请参见 接口参。检查点设置 在串联链路的 检查点设置 页签设置检查点。具体操作,请参见 检查点(断言)。控制器和定时器(可选)您可以根据不同压测场景的需求,添加控制器和...

应用防护规则适用场景

AHAS自适应流控结合系统的Load、CPU使用率以及服务的入口QPS、响应时间和并发量等几个维度的监控指标,通过一定的流控策略,让系统的入口流量和系统的负载达到一个平衡,让系统尽可能运行在最大吞吐量,同时保证系统整体的稳定性。...

压测流媒体RTMP协议

参设置 在串联链路参设置 页签设置参。具体操作,请参见 接口参。检查点设置 在串联链路的 检查点设置 页签设置检查点。具体操作,请参见 检查点(断言)。控制器和定时器(可选)您可以根据不同压测场景的需求,添加控制器和...

通过Jaeger上报Go应用数据

通过Jaeger为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用Jaeger SDK和Jaeger...

通过Zipkin上报Go应用数据

通过Zipkin为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用Zipkin为Go应用埋点...

阻塞DDL

PolarDB 新增非阻塞DDL(Nonblock DDL)功能。Nonblock DDL规避了执行DDL过程中MDL锁长时间获取不成功导致的连接堆积和阻塞,有效地解决了DDL导致的锁表问题。背景信息 用户在执行DDL操作的时候,若目标表存在未提交的长事务或大查询,DDL...

通过Zipkin上报 .NET应用数据

通过Zipkin为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用ASP.NET Core/Owin...

创建压测场景

6000 参设置 在串联链路参设置 页签设置参。具体操作,请参见 接口参。检查点设置 在串联链路的 检查点设置 页签设置检查点。具体操作,请参见 检查点(断言)。控制器和定时器(可选)您可以根据不同压测场景的需求,添加控制...

游戏行业最佳实践

然而,跨境传输的网络环境复杂,高延时、链路不稳定、频繁掉线等问题成为出海的阻碍。稳定的访问体验,持续地分发游戏下载资源,成为游戏厂商出海的关键。方案优势:阿里云DCDN在全球部署3200+节点,您通过简单的配置即可实现边缘节点全球...

通过Jaeger上报.NET应用数据

通过Jaeger为应用埋点并上报链路数据至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。本文介绍如何使用OpenTracing/...
共有137条 < 1 2 3 4 ... 137 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
可观测链路 OpenTelemetry 版 智能数据建设与治理 Dataphin 应用实时监控服务 全局事务服务 (文档停止维护) 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用