监控指标说明

场景 详情 作业中某些算子存在反压 判断反压最直接的方式是使用Flink UI提供的反压检查功能,而不是通过指标判断。反压的存在会导致Source端数据发送至下游算子的速率下降,您可能会观察到sourceIdleTime周期性上升,...

主从实例读写分离部署(共享存储)

共享存储的多实例高可用方案 技术原理 在单实例方案中,采用的是故障实时监测、节点替换的方案,在节点恢复时存在一定的服务不可用周期,对于关键业务场景,需要更高级别的高可用方案,支持故障隔离、负载隔离。Hologres在 V1.1版本,支持...

指标说明

nginx_ingress_controller_success-process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他包括分配但未使用的内存,也包括换出的内存页面,但包含共享内存。process_open_fds 通过...

指标说明

nginx_ingress_controller_success-process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他包括分配但未使用的内存,也包括换出的内存页面,但包含共享内存。process_open_fds 通过...

使用Prometheus监控E-MapReduce

zk_node_status ZooKeeper节点状态:1:节点不可用。0:作为follower节点。1:作为leader节点。zk_synced_followers 同步的ZooKeeper服务数量。Kafka指标 消息队列Kafka版是阿里云提供的分布式、高吞吐、可扩展的消息队列服务。消息队列...

使用Prometheus监控E-MapReduce

zk_node_status ZooKeeper节点状态:1:节点不可用。0:作为follower节点。1:作为leader节点。zk_synced_followers 同步的ZooKeeper服务数量。Kafka指标 消息队列Kafka版是阿里云提供的分布式、高吞吐、可扩展的消息队列服务。消息队列...

配置作业资源

如果您需要对单独的算子设置资源,需要配置对应的运行参数后让每个算子有自己独立的SLOT,这样就可以直接在对应的SLOT上设置算子的资源。具体的算子资源设置步骤如下:在作业 部署详情 页签 运行参数配置 区域的 其他配置 中添加如下参数...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

列存索引中TopK算子的实现

计算下推 应用Self-sharpening Input Filter时,会将不断更新的cutoff value下推至table scan算子,作为SQL中一个新的predicate,在table scan算子获取数据时根据这个新的predicate,复用pruner对pack(或称为row group)进行过滤。...

引擎指标

指标 指标含义 说明 tag 聚合算子 aliyunes.elasticsearch.node.stats.fs.total.available.bytes Openstore混合存储元数据盘剩余可用空间。元数据盘剩余可用空间范围为0至50,000,000,000。仅内核1.9及以上版本支持该指标。重要 当元数据盘...

使用执行计划分析查询

算子层计划执行树 算子层执行计划由多个算子组成,图中的每个矩形框代表一个算子,数据流向自下而上,扫描数据过程或接收网络数据由最上游的算子(TableScan和RemoteSource)完成,扫描到的数据和接收到的网络数据经过中间算子层层处理后,...

技术架构

计算节点与存储节点之间通过理解数据库语义的智能互联协议将filter和projection等算子从计算层下推到存储层执行。为了保证事务和查询语句的低延迟,同时降低计算节点之间状态同步的延迟,计算节点和存储节点之间使用25Gb高速RDMA网络互联,...

对象存储OSS

当某个可用区不可用时,仍然能够保障数据的正常访问。OSS同城3AZ能够提供99.9999999999%(12个9)的数据持久性以及99.995%的数据可用性。您还可以针对存储空间启用跨区域复制功能。启用后,不同地域的不同存储空间之间将实现自动异步(近...

管理从集群

说明 当集群中的节点状态为 创建中 时,整个集群可能仍未创建完成,此时集群不可用。只有当集群状态为 运行中 时,集群才可以正常使用。请确认已选中正确的地域,否则无法看到您创建的集群。当您的数据量较大时,推荐您购买 PolarDB 存储包...

Hologres管控台的监控指标

只有在实例绑定了主实例之后,该指标会显示数据(0ms),当主实例有数据写入时,实例的同步延迟会出现数据波动。一般情况下,主从实例的同步延迟毫秒级,当实例偶尔出现延迟抖动时,一般情况为主实例在做DDL等元数据修改的操作,可忽略...

避免下盘

数据倾斜导致的算子下盘 数据倾斜也是一种常见的会导致算子下盘的因素,数据倾斜会导致单个Segment上的数据量和计算量远远超过其他Segment,导致可用内存不够算子下盘。对于数据倾斜的检测和消除,请参见 数据倾斜诊断。

SysOM内核层容器监控

该指标提供有关容器中因直接内存回收产生的延迟时间和次数的统计信息,包括直接内存回收延时1~5毫秒的延迟次数、5~10毫秒的延迟次数、10~100毫秒的延迟次数、100~500毫秒的延迟次数、500~1000毫秒的延迟次数、大于1000毫秒的延迟次数。...

UpdateJob

second_delay:填写固定延迟多少秒执行一次(1s~60s可选)。Calendar String 否 工作日 cron类型可以选择填写自定义日历。DataOffset Integer 否 2400 cron类型可以选择时间偏移,单位s。TimeoutEnable Boolean 否 true 超时报警开关。取值...

什么是边缘容器

边缘容器提供以容器应用为核心的高弹性、易运维的计算资源,在遍布全球的边缘节点上实现全球部署和就近调度,简化了协议处理,极大地减少了响应延迟,您无需购买服务器资源,无需关心应用的扩缩容和运维,让您更专注于应用开发本身而非底层...

服务等级目标SLO概述

阿里云 服务网格 ASM提供了开箱即用的基于服务等级目标SLO(Service Level Objectives)的监控和告警能力,能够监控应用服务之间调用的延迟和错误率特征等。本文介绍SLO的相关概念。SLO是什么?服务等级指标SLI(Service Level Indicator)...

服务等级目标SLO概述

阿里云 服务网格 ASM提供了开箱即用的基于服务等级目标SLO(Service Level Objectives)的监控和告警能力,能够监控应用服务之间调用的延迟和错误率特征等。本文介绍SLO的相关概念。SLO是什么?服务等级指标SLI(Service Level Indicator)...

UpdateJob-更新任务配置信息

更新任务配置信息。默认先调用获取任务找到对应字段进行...2022-12-26 API 内部配置变更,影响调用 变更项 变更内容 API 内部配置变更,影响调用 2022-09-28 API 内部配置变更,影响调用 变更项 变更内容 API 内部配置变更,影响调用

Query Profiling Statistics

说明 该字段并非算子执行开始结束执行时间的间隔(可能包含下层算子执行消耗的时间),而是该算子本身执行所消耗的时间。diskreadsize int8 算子从磁盘读取数据量。diskreadtime float8 算子从磁盘读取数据消耗的时间,单位为秒(s)。...

DescribeDiagnosisSQLInfo-查看SQL语句的详细信息

Children 算子结构体 递归结构 节点算子,字段结构与父节点算子结构一致,最下层节点的该值为空。示例 正常返回示例 JSON 格式 {"RequestId":"425AAA6A-63E0-1929-A1CE-3D9036CBC463","QueryID":"71403480878*","SessionID":"658*",...

监控告警与日志问题

将source算子和sink算子拆分成独立的算子,分别与其他的算子进行连接,形成新的拓扑结构,在拓扑图中即可看到数据的流向和流量。您需要在 作业运维 页面,单击目标作业名称,在 部署详情 页签 运行参数配置 区域的 其他配置 中添加分割算子...

阿里云工业大脑服务等级协议

1.3 服务不可用时间段:由于服务端错误导致服务不可用时长超过五分钟的时间段。不到五分钟的间歇服务不可用时间不会记入任何服务不可用时间。1.4 服务等级服务适用的服务区域:工业大脑产品全部区域。1.5 月度服务费用:目前工业大脑产品的...

修改数据复制方式

因此,在异步数据复制方式下,备实例不可用时不会影响主实例上的操作,而主实例不可用时可能会导致主备实例数据不一致。操作步骤 登录 云数据库专属集群控制台。在页面左上角,选择目标地域。在导航栏左侧,选择 实例列表>MySQL。找到目标...

2024-03-13版本

同城高可用 开通实时计算Flink版 资源调整 管理项目空间 修改虚拟交换机 算子探查(公测)支持对运行中的SQL作业进行中间结果查询,减少排查数据正确性的难度。算子探查(公测)免费监控服务 开通Flink工作空间时,支持选择免费监控服务,...

弱依赖降级

若依赖方出现不稳定的情况,则请求和调用依赖方的方法的响应时间变长,线程产生堆积,最终可能耗尽自身的线程数,导致应用本身不可用。在复杂链路中,若某一环不稳定,就可能会层层渲染,最终导致整个链路都不可用。针对以上情况,可以使用...

日志信息

告警日志是GTM 针对健康检查报警/恢复、地址池不可用/恢复、访问策略切换等行为记录的日志信息。什么是告警日志 告警日志是GTM 针对健康检查报警/恢复、地址池不可用/恢复、访问策略切换等行为记录的日志信息。功能说明 健康检查报警 当...

存储冗余概述

当该可用区不可用时,会导致相关数据不可访问。如果您的业务需要更高的可用性保障,建议您使用 同城冗余存储(ZRS)来存储和使用数据。同城冗余存储(ZRS)采用多可用区(AZ)内的数据冗余存储机制,将用户的数据冗余存储在同一地域...

存储冗余

当某个可用区不可用时,同城冗余存储仍然能够保障数据的正常访问。当发生断网、断电或者灾难事件导致某个机房不可用时,日志服务 仍能继续提供强一致性的服务。整个故障切换过程用户无感知、数据不丢失,满足关键业务系统对于访问快速恢复...

为什么高可用系统会触发主备切换

在MongoDB实例的运行过程中,当高可用系统监测到实例中的某个节点不可用,将触发节点切换操作并以短信或站内通知的形式通知用户。收到的通知内容【阿里云】尊敬的*:您的云数据库MongoDB实例:dds-bp*(名称:*)出现异常,高可用系统已经...

多账号企业付款管理方案

适用客户 集团型企业,各业务公司能够跟阿里云单独结算,也可做到额度限制。还能够享受到集团跟阿里云签订的整体优惠。方案架构 财务托管流程图 财务托管包含以下内容:账号的订购订单和按量账单费用,由主账号来支付。账号的资源...

名词解释

可用区内以及可用区之间内网互通,可用区内网络延时更小,如果ECS和图数据库GDB部署在相同的可用区,网络延迟更小。不同可用区之间故障隔离。GDB Graph Database的简写。实例ID 每个实例对应一个用户空间,实例是使用图数据库GDB的基本单位...

K8s内核高可用架构

2个或者2个以上Master关机,K8s管控能力不可用,已经创建并顺利运行的Pod不受影响 针对单Master部署架构(不推荐)Master关机,K8s管控能力不可用,已经创建并顺利运行的Pod不受影响 节点高可用场景说明:场景 期望 备注 1/3个master节点...

Impala概述

注意事项 如果使用Impala组件,请勿直接通过系统文件删除hive表分区目录,请使用Impala或者Hive命令删除,否则会导致该表不可用。优点 为了避免延迟,Impala没有使用MapReduce,而是使用分布式查询引擎直接访问数据,该引擎与RDBMS中的查询...

企业邮箱服务等级协议

定义 服务不可用:客户通过 SMTP、POP、IMAP或Webmail中任意一种方式收发邮件失败,时间达到一分钟,视为服务不可用。服务周期:一个服务周期为一个自然月,如客户使用企业邮箱不满一个月则以当月该客户企业邮箱的累计使用时间作为一个服务...

Warm Up(冷启动)

对于长期处于低水位状态的系统,可以使用Warm Up(冷启动)功能来避免流量骤增导致水位瞬间升高系统不可用的情况。功能原理 Warm Up,即冷启动/预热的方式。当系统长期处于低水位的情况下,若流量突然增加,可能会把系统水位瞬间拉高把系统...

告警日志

什么是告警日志 告警日志是GTM 针对健康检查报警/恢复、地址池集合不可用/恢复、主备地址池切换等行为记录的日志信息。功能说明 健康检查报警 当健康检查发现地址池集合中的地址出现异常时,会记录在日志信息里。记录内容包括:异常时间、...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云消息队列 RocketMQ 版 负载均衡 DDoS防护 视频直播 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用