节点池服务拓扑管理

因此,跨越不同分组节点的Service流量,大概率出现访问不可达、或者访问效率低下的问题。Service流量拓扑支持边缘节点应用只能由相同节点池的节点访问,或者只能由本节点访问。本文介绍Service流量拓扑管理功能以及如何配置Service流量...

ack-koordinator(ack-slo-manager)

从0.5.1版本开始,ack-koordinator自动清理已下线节点的ConfigMap,但卸载ack-koordinator后,未下线节点的ConfigMap仍保留。这些未清理的ConfigMap不会影响您其他功能的正常使用,但占用数据空间,建议您及时清理。在 组件管理 页面...

事件总线系统权限策略参考

本文描述事件总线支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问控制(RAM)产品...

快速入门

Schema详情 选择TUPLE类型会出现Schema详情,根据自己需求创建字段,允许为NULL代表如果上游没有该字段值自动置为NULL,不允许为NULL则会严格检验,字段类型不匹配写入报错。Shard数量 Shard表示对一个Topic进行数据传输的并发通道,每个...

导入Swagger API

如果需要恢复服务,可在 删除服务 区域单击目标服务后的 还原,目标服务则会出现在 发布服务 区域。注意 当使用共享实例发布Swagger API服务时,同一个服务组下最大只能发布3个服务。因此您需要选择小于等于3个服务进行发布,其他服务请先 ...

应用场景

首先是在出现问题时,问题发现与定位如果能够快速精准,最大程度减少业务上带来的损失;其次,应用的性能优化,服务能否降级,强依赖与关键路径在哪,如何做预算等在大促或者压测时能够分析链路中最早波动的点,沉淀压测资产等。场景一:...

SQL常见问题

问题描述 当使用POJO类作为UDTF返回类型,并在SQL中显式声明了UDTF返回列的别名列表(Alias Name)时,可能会出现字段错位(即使类型一致,但实际使用的字段可能与预期不符)问题。例如,如果使用如下POJO类作为UDTF的返回类型,并根据 ...

开启网格拓扑提高可观测性

健康状态可视化:网格拓扑以节点或边的颜色代表服务或请求的健康状态,帮助您快速找到出现问题的节点或请求。流量重放:流量重放允许您重放过去选中时间段内的流量状况,这使您有能力彻底检查感兴趣的时间段内的应用流量。步骤一:启用网格...

开启网格拓扑提高可观测性

健康状态可视化:网格拓扑以节点或边的颜色代表服务或请求的健康状态,帮助您快速找到出现问题的节点或请求。流量重放:流量重放允许您重放过去选中时间段内的流量状况,这使您有能力彻底检查感兴趣的时间段内的应用流量。步骤一:启用网格...

事件中心

拓扑视图 拓扑视图首先绘制出该应用的资源拓扑,包含该应用使用的ECS,该应用部署的实例Pod,该应用使用的所有RDS和Redis等中间件资源,以及该应用挂载的SLB和NAT等。之后将获取到的关联事件、操作审计、云监控事件关联到对应的拓扑...

基础版

说明 由于基础版只有一个数据节点,没有备节点作为热备份,因此当该节点意外宕机或者执行变更配置、版本升级等任务时,会出现一段时间的不可用。如果业务对数据库的可用性要求较高,不建议使用基础版,可选择其他系列(如高可用版)。基础...

什么是网络智能服务

全场景覆盖 支持在公网、混合云、跨域、同域跨VPC等各场景的观测和诊断,全面覆盖用户可能会出现的各种情况和使用场景。访问NIS 通过注册阿里云账号,您可以通过以下方式访问和管理 NIS:NIS控制台:具有交互式操作的Web服务页面,帮助您...

Java应用监控和诊断方案

以淘宝网(www.taobao.com)践行分布式架构与微服务实践的过程为例,遇到的主要挑战有:定位问题难 客服人员接到用户反馈商品购买出现问题后,交由技术人员排查解决。而微服务分布式架构中的一个网站请求通常要经过多个服务/节点后返回...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

基于IaC自动化部署事件总线

本文介绍如何应用IaC(Infrastructure as Code)理念自动化部署 事件总线EventBridge,帮助您解决大量云产品手工管理负担沉重的问题。背景信息 IaC是一种以代码来配置和管理虚拟机、网络等基础设施的实践方法。通过将基础设施代码化、版本...

版本发布说明

优化存储过程的创建和删除流程,避免出现元数据残留问题。降低REPLACE/UPSERT语句在包含GSI或UGSI的表上执行时的CPU消耗。缺陷修复 修复包含clustered index的表在创建local索引时,部分旧的执行计划没有清理的问题。修复在DRDS模式数据库...

查询网络通信距离(NCD)

但在多轨连接场景下,由于同一个GPU节点的网卡连接到不同组ASW(例如有8个上连),因此两个GPU节点之间以及不同的灵骏网卡之间可能会出现NCD不同的情况,例如:NCD(GPU1.bond0,GPU2.bond0)=1,NCD(GPU1.bond0,GPU2.bond1)=2。为帮助您更...

事件中心

拓扑视图 拓扑视图首先绘制出该应用的资源拓扑,包含该应用使用的ECS,该应用部署的实例Pod,该应用使用的所有RDS和Redis等中间件资源,以及该应用挂载的SLB和NAT等。之后将获取到的关联事件、操作审计、云监控事件关联到对应的拓扑...

集群拓扑监控

Kubernetes监控组件:ack-arms-cmonitor 安装Kubernetes组件ack-arms-cmonitor前,需先检查目标集群是否存在ARMS Addon Token,否则会出现权限不足的报错。若存在ARMS Addon Token,ARMS会进行免密授权,组件安装完成后,即可使用...

管理主备切换

其他引擎切换主备实例请参见:SQL Server主备切换 PostgreSQL自动或手动主备切换 MariaDB主备切换 影响 主备实例切换过程中会出现约30~120秒的服务不可用,请确保您的应用程序具有自动重连机制。如果您的应用程序使用的是较早版本的Druid...

V5.1.x系列实例版本说明

解决DISTINCT在部分跨库JOIN场景下会出现报错的问题。修复分库分表情况下聚合函数查询带LIMIT时返回结果不正确的问题。解决BigDecimal类型在类型转换过程会消耗大量CPU的问题。修复SHOW FULL STATS连接数不准确的问题。修复SHOW FULL STATS...

功能发布记录

在单集群模式下,开启托管模式的网格拓扑会自动填充相关参数,提升易用性。网格拓扑服务的CLB支持按量付费规格,降低费用消耗。全部 全部 全部 开启网格拓扑提高可观测性 支持自定义请求头和响应头。支持使用VirtualService和EnvoyFilter这...

任务触发与执行问题

任务执行超时 问题现象 出现 TIMEOUT 错误。问题原因 客户端处理超时。解决方法 查看超时时间是否配置太小。建议根据任务的实际执行情况设置合理的超时时间。查看客户端错误日志 common-error.log。自定义参数不存在 问题现象 出现 javax....

调用链分析

将应用数据上报至 可观测链路 OpenTelemetry...接口指标详情 相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 创建告警规则。

调用链分析

将应用数据上报至 可观测链路 ...接口指标详情 相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 应用监控告警规则。

高可用系列

升级为高可用系列 基础系列实例没有备节点作为热备份,因此当实例意外宕机或者执行变更配置、版本升级等任务时,会出现较长时间的不可用。如果业务对数据库的可用性要求较高,建议使用高可用系列。除了新购实例时选择高可用系列,您也可以...

服务管控和治理

您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。更多信息,请参见 故障注入。服务鉴权 服务提供者提供服务后,您可以通过服务鉴权功能对服务调用方进行鉴权。更多信息,请参见 服务鉴权。故障隔离 某个服务故障...

业产技融合分层协作方案

第二个问题如果回答的不好,就会出现产品技术团队每天在不断的接需求、做需求,功能在不断增加和堆叠,但是产品的竞争力却没有提高,时间长了对产品的演进危害很大。如果您的公司已经发展出独立的业务、产品、技术的独立部门,技术部门一般...

查看和管理实例连接地址和端口

从集群只读地址中移除节点,被移除节点上的连接会出现30~120秒的服务不可用,其他节点连接无影响。集群只读地址的节点配置对内网连接和外网连接同时生效。删除集群只读地址中的节点时,至少保留一个节点。操作步骤 访问 RDS实例列表,在...

可观测概述

从实际应用的角度来看,在系统中需要重视其稳定性,需要理解什么时候系统运行良好或出现问题,从而可以更快地识别错误,并实施正确的自动化及手动控制来维护系统的可用性。Service Mesh的数据平面代理位于服务之间的网络请求路径中,通过...

基础系列

重要 RDS基础系列实例只有一个数据库节点,没有备节点作为热备份,因此当该节点意外宕机或者执行重启实例、变更配置、版本升级等任务时,会出现较长时间的不可用。如果业务对数据库的可用性要求较高,不建议使用基础系列实例,可选择其他...

集群高可用架构推荐配置

节点池高可用配置 您可以基于节点的弹性伸缩、部署集、多AZ,结合K8s调度的拓扑分布约束,确保服务在不同的故障域(failure-domain)资源充足且有所隔离,从而当某一故障域出现问题时,服务仍然可以保持运行,减少单点故障的风险,提高系统...

边缘节点池管理概述

因此,跨跃不同分组节点的Service流量,大概率出现访问不可达、或者访问效率低下的问题。节点池管理方案 针对以上场景,容器服务 Edge 版 提出了如下图所示解决方案。节点池节点管理:针对节点分组抽象了节点池的概念,以节点池视角对...

事件监控

此时会出现日志查询与分析页面。说明 索引配置在1分钟之内生效。开启或修改索引后,新的索引配置只对新写入的数据生效。如果您需要设置离线归档与计算的场景,可以在Logstore上面将数据投递给 MaxCompute 或者 OSS。请参见 投递日志到...

App Level 版本介绍

修复对于Android 8.0系统下调试插件出现Crash的问题 移动应用推送 提供了可用于App生命周期外的推送服务,满足App运营和消息告警等需求 无 移动端设备网关 提供子设备的管理功能,如子设备添加删除拓扑、子设备上下线、数据上下行等 无 ...

什么是AI分布式训练通信优化库AIACC-ACSpeed

AIACC_CPU_BINDING_ENABLE=1 如果程序本身存在问题,例如负载不均衡导致性能波动,开启CPU-Affinity功能后可能会出现性能损失,所以该特性作为优化选项进行使用。Bucket-Tuning:ACSpeed默认开启Bucket-Tuning,可以对梯度的融合进行自适应...

手动接入应用至应用监控 eBPF 版

接入说明 为Kubernetes集群安装 应用监控 eBPF 版 组件即可将集群接入 应用监控 eBPF 版:安装前,需先检查目标集群是否存在ARMS Addon Token,否则会出现权限不足的报错。若存在ARMS Addon Token,ARMS会进行免密授权,组件安装完成后,...

应用概述

应用是ARMS应用监控的被监控主体,为Java应用安装探针后,ARMS即可开始监控Java应用,您可以查看应用拓扑、调用链路、异常事务、慢事务和SQL分析等一系列监控数据。应用的生命周期 从接入应用开始到删除应用结束,应用可能处于不同的状态和...

概述

注意事项 当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请务必确保应用具备重连机制;当只读节点开启了热备功能时,主备切换将在3~10秒内完成。热备节点规格需要与主节点规格保持一致。热备切换功能中的...

体验中心

场景一:版本回滚 对新版 Portal 应用进行分组发布时,在第一组服务实例发布完成后,发布人员在微服务平台的服务监控中观测到业务异常,用户登录错误率快速增长,经分析判断是新版服务出现问题,立即到 AKS 中进行回滚发布,恢复到应用的旧...
共有51条 < 1 2 3 4 ... 51 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据总线 DataHub 可观测链路 OpenTelemetry 版 高速通道 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用