企业级状态后端存储介绍

GeminiStateBackend是一款面向流计算场景的KV存储引擎,作为实时计算Flink版产品的默认状态存储后端(StateBackend)。本文为您介绍企业级状态后端存储GeminiStateBackend的核心设计,以及其与RocksDBStateBackend的性能对比情况。整体介绍...

可观测监控 Prometheus 版无法重新安装出现报错...

问题描述 卸载可观测监控 Prometheus 版后,重新安装可观测监控 Prometheus 版时,出现以下报错信息。rendered manifests contain a resource that already exists.Unable to continue with install:existing resource conflict:kind:...

数据集成相关

用户在中国,但是使用海外的Grafana工作区,通常首次加载时会出现卡顿。使用的数据源本身数据查询返回慢,可以尝试优化查询语句。表格(Table)配置无Column Styles 可以通过Overrides实现自定义。具体操作,请参见 Grafana官方文档。企业...

什么是调用链

出现问题时,如请求超时、错误或异常,很难快速定位问题所在。调用链可以帮助运维人员解决以下问题:故障排查:当请求失败或出现错误时,调用链可以显示整个请求的路径和每个服务的执行情况,从而帮助运维人员快速定位问题所在。性能优化...

实践教程

ARMS产品 文档 应用监控 调用链采样模式选择 诊断服务端报错问题 诊断应用卡顿问题 业务日志关联调用链的TraceId信息 通过错/慢调用链排查应用产生异常的原因 添加并使用标签 跨账号统一应用监控 其他更多操作请参见 应用监控最佳实践。...

提供服务

将应用数据上报至 可观测链路 OpenTelemetry 版 后,...相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 应用监控告警规则。

如何排查手动安装探针失败的问题

如果JDK版本为1.8.0_25或者1.8.0_31,可能会出现无法安装探针的情况,建议您升级对应的JDK版本。关于ARMS应用监控对JDK版本的支持情况,请参见 ARMS应用监控支持的Java组件和框架。如果应用启动之后ArmsAgent目录下无log子目录,是由于...

常见问题

本文为您介绍数据集成任务常见问题。资源组操作及网络连通 在做离线同步时,我们需要先了解哪些DataWorks及其网络能力?同步ECS自建的数据库的数据时,如何保障数据库与DataWorks的网络连通?数据库和DataWorks不在同一个地域(Region)下...

使用前须知

帮助您在加速域名访问出现异常时,快速定位是由于CDN服务本身出现的访问问题,例如源站访问出现故障,节点不可用等,还是由于终端用户的网络故障或地域特性等问题。CDN用户分析 统计用户访问信息,例如访问次数最高的用户等。帮助您更好的...

诊断服务端报错问题

步骤二:查看关于应用异常的统计信息 为应用安装ARMS探针后,ARMS收集和展示选定时间内应用的总请求量、平均响应时间、错误数、实时实例数、FullGC次数、慢SQL次数、异常次数和慢调用次数,以及这些指标和上一天的环比、上周的同比升降...

应用概览

将应用数据上报至 可观测链路 OpenTelemetry 版 后,可观测链路 OpenTelemetry 版 即可开始监控应用,您可以在 应用概览 页面了解应用的请求数、错误数、耗时等信息。前提条件 已将应用数据上报至 可观测链路 OpenTelemetry 版,具体操作,...

常见问题

报错问题 问题现象 Async-Profiler进行内存剖析需要依赖JDK的符号信息,如果JDK内无符号信息,则遇到如下问题:[ERROR]Failed to start Continuous Profile Collector java.lang.RuntimeException:java.lang.IllegalStateException:No ...

Flink SQL中Changelog事件乱序处理原理

当消息的DELETE事件与其ADD事件之间的时间间隔超过配置的TTL时会出现这种情况,此时,Flink会在日志中产生一条如下警告信息。int index=findremoveFirst(values,row);if(index=-1){ LOG.info(STATE_CLEARED_WARN_MSG);return;} 您可以根据...

产品优势

实时报警和监测功能 崩溃分析支持实时报警功能,当应用出现崩溃时,开发者能够即时收到通知,通过控制台站内信,以及指定联系人的电子邮件、手机短信、钉钉群机器人等多种方式,推送告警信息。帮忙开发者及时采取措施解决问题,最大限度地...

作业启动

请谨慎启动存在不兼容情况的作业,因为启动后可能会出现启动失败或者运行结果等不符合预期的问题。详情请参见 Flink State兼容性参考。操作步骤 进入作业启动界面。具有owner角色的成员登录Flink开发控制台。在页面顶部,选择目标项目空间...

实时同步能力说明

DataWorks为您提供的实时数据同步功能,方便您使用单表或整库同步方式,将源端数据库中部分或全部表的数据变化实时同步至目标数据库中,实现目标库实时保持和源库的数据对应。使用限制 实时同步不支持在数据开发界面运行任务,您需要保存、...

数据同步模版

Flink CDC支持数据的实时同步和表结构变更的自动同步。您可以使用数据同步模版帮您快速生成数据同步的Flink SQL作业代码。本文为您介绍如何使用多库多表同步或者分库分表合并模版实现数据同步。背景信息 Flink全托管支持多库多表同步和分库...

2022-03-04版本

在作业探查页签中,新增日志分页的能力,避免作业长期运行导致日志过大页面无法打开的问题。支持动态修改日志级别。在不重启作业的前提下,可以在作业探查页签中,动态修改运行中的TM的日志级别,以满足您定位问题的需求。支持查看失败的...

SmartMetrics Holiday功能

但在某些场景下,指标会出现一些突增或突降,但并不需要告警。例如在双十一期间,电商App的访问量会发生突增,服务器的CPU水位也会上涨,但这属于意料之中,不需要产生告警。在时序预测领域,这种不常见但可预料的指标异常现象被称为...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

实现Nginx Ingress Controller组件的链路追踪

可观测链路 OpenTelemetry 版 可以对链路信息进行实时聚合计算和持久化,形成链路明细、实时拓扑等监控数据,以便您进行Nginx Ingress Controller组件的问题排查与诊断。前提条件 开通可观测链路 OpenTelemetry 版服务并授权 创建...

调用链采样配置最佳实践

基于重保角度考虑,特定时间段全采样 运维过程中也经常面临重大事件保障的场景,比如大促、新版本压测等,需要针对某一类标签的数据甚至全部应用开启全量数据采集和存储,以便出现问题或者故障时,可以快速定位,甚至影响审计和定责。...

均衡分片(Rebalance)

分片分布不均衡示例:如下图有Worker节点没有分片时,监控信息会出现如下类似情况,有Worker节点的负载远低于其他Worker。使用如下SQL查询Worker加载分片元数据情况:SELECT DISTINCT worker_id FROM hologres.hg_worker_info;返回结果:...

实例升级

否则可能会出现数据丢失。DataWorks数据集成任务和Blink任务无需暂停任务,升级期间会触发Failover,根据Failover策略自动恢复,建议Failover重试次数配置为10次以上。支持小版本升级:例如从1.3.25升级至1.3.36。支持大版本升级:例如从1....

添加实时数仓Hologres数据源

本文档介绍如何在DataV中添加并使用实时数仓Hologres数据源。前提条件 已准备好待添加的实时数仓Hologres数据源。添加实时数仓Hologres数据源操作步骤 登录 DataV控制台。在 工作台 页面,单击 数据准备>数据源,进入 数据源 页面,单击 ...

Arthas诊断

Arthas是诊断Java领域线上问题的利器,利用字节码增强技术,可以在不重启JVM进程的情况下,查看程序的运行情况。ARMS 100%集成Arthas的所有能力,且相比自行挂载使用有如下优势:不依赖JDK环境,您无需下载安装Arthas,可按需批量一键开启/...

LiveTail

功能优势 监控日志的实时信息,按关键词过滤日志。结合采集配置,对采集的日志进行索引区分。对字段做分词处理,以便查询包含分词的上下文日志。根据单条日志追踪到对应日志文件进行实时监控,无需连接线上机器。操作步骤 重要 仅通过...

Arthas诊断

Arthas是诊断Java领域线上问题的利器,利用字节码增强技术,可以在不重启JVM进程的情况下,查看程序的运行情况。ARMS 100%集成Arthas的所有能力,且相比自行挂载使用有如下优势:不依赖JDK环境,您无需下载安装Arthas,可按需批量一键开启/...

升级策略

在通知策略中添加升级策略后,系统以您指定的通知方式向处理人发送告警信息,以提醒处理人采取必要的问题解决措施。前提条件 已创建通知对象。具体操作,请参见 通知对象概述。新建升级策略 登录 ARMS控制台,在左侧导航栏选择 告警管理>...

应用实时监控服务系统权限策略参考

本文描述应用实时监控服务支持的所有系统权限策略及其对应的权限描述,供您授权 RAM 身份时参考。什么是系统权限策略 权限策略是用语法结构描述的一组权限的集合,可以精确地描述被授权的资源集、操作集以及授权条件。阿里云访问控制(RAM...

本地运行和调试包含连接器的作业

背景信息 当您在Inteillij IDEA中运行和调试Flink作业,如果其包含了阿里云实时计算Flink版的商业版连接器依赖,可能遇到无法找到连接器有关类的运行错误。例如,运行含有 大数据计算服务MaxCompute 连接器的作业时出现如下异常:Caused ...

应用列表

详细状态信息字段 Span应该包含statusMessage字段,记录详细的调用结果信息,便于问题的定位。事件 事件记录字段 Span应该包含event字段,在遇到一些异常情况或处理重要请求时,可附加事件和日志信息,便于问题的定位。治理相关 调用数膨胀...

开通实时计算Flink版

flink-sessionclusters:Session集群的HA信息和系统检查点信息会被存储到该目录。重要 Flink工作空间创建成功后,不可修改 OSS存储。选择Bucket时,请务必参见 注意事项。flink-test-oss 监控服务 监控服务 您可以选择 免费监控服务 或 ...

应用无法正常启动怎么办?

请执行以下命令查看ack-onepilot的日志信息来排查问题。k logs-f ack-onepilot-ack-onepilot-XXXX-XXXX-n ack-onepilot 说明 XXXX-XXXX为随机信息,您可通过执行命令 k get pod-n ack-onepilot 来获取。

数据实时入仓实践

常见问题 Flink相关问题 问题一:问题现象:提示出现报错信息“Checkpoint xxx expired before completing”。问题原因:Checkpoint流程超时,通常由于Checkpoint过程中写入的分区数过多。解决措施:建议调整Flink Checkpoint时间,增加其...

ManageRecordingRule-修改聚合规则

用于出现错误后排查问题。CD782AEC-A676-529F-8F26-0ED0FF0EF1EA Data string 操作结果信息。success Code integer 状态码。200 为成功,其他状态码为异常。200 Message string 返回结果的提示信息。success 示例 正常返回示例 JSON 格式 {...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口...相关文档 为避免在出现问题后被动诊断错误原因,您还可以使用ARMS的告警功能针对一个接口或全部接口创建告警,即可在出现问题时向运维团队发送通知。如何创建告警,请参见 应用监控告警规则。

设置可维护时间窗口

注意事项 如果开启了小版本自动升级,实时数仓Hologres会在您设置的可维护时间窗口内自动进行实时数仓Hologres小版本升级,在小版本升级过程中可能会出现Query失败的情况,请尽量将可维护时间窗口设置为业务低峰期。默认可维护时间窗口为 ...

MySQL分库分表实践

背景信息 实际业务场景下数据同步通常不能通过一个或多个简单离线同步或者实时同步任务完成,而是由多个离线同步、实时同步和数据处理等任务组合完成,这就导致数据同步场景下的配置复杂度非常高。尤其是在MySQL分库分表的场景下,上游的...

Table Resharding

因此当表的Resharding任务异常时,原表会仍处于只读状态,且数据库中会出现名为<initial_table_name>_xxxxxxxx 的临时表。此时需要选择如下情况之一进行操作:继续运行 如果由于误操作导致Resharding任务中断,或由于OOM等原因导致...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 应用实时监控服务 云安全中心 云原生数据仓库AnalyticDB MySQL版 实时计算 Flink版 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用