flink cdc的 参数是直接从指定时间开始读取 binlog 的还是从最早开始然后按时间过滤的?

flink cdc的scan.startup.timestamp-millis 参数是直接从指定时间开始读取 binlog 的还是从最早开始然后按时间过滤的?测试下来感觉像后者,因为很久才读出数来.有没有参数可以提高效率的,增量后并行度为 1 时,读取真的好慢.

java flink + kafka,后端状态放hdfs后,每次重启服务,又从最早的消息开始消费问题

java flink + kafka,后端状态放hdfs后,每次重启服务,又从最早的消息开始消费,不是每次会提交检查点到hdfs吗,重启后,不应从最新的检查点开始处理么?

实时数据分析:使用Flink实时发现最热Github项目

1 课时 |
404 人已学 |
免费

实时数据接入:5分钟上手 Flink MySQL 连接器

1 课时 |
204 人已学 |
免费

大数据知识图谱系列—基于ELK+Flink日志全观测最佳实践

1 课时 |
174 人已学 |
免费
开发者课程背景图

flinkcdc为什么从savepoint启动后发现新加的表是从最新的binlog开始同步数据的?

我现在在做flink cdc2doris的操作目前出现了以下问题:1、原先同步10张表,都是先全量再增量同步的(scan.startup.mode=initial),现在新加两张表,配置从最早的binlog开始同步(scan.startup.mode=earliest-offset),从savepo...

Flink CDC这个参数是指从现在数据库里存在的,最早的一个binlog开始读 是吗?

Flink CDC这个参数是指从现在数据库里存在的,最早的一个binlog开始读 是吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

热门帮助文档

社区圈子

阿里云实时计算Flink
阿里云实时计算Flink
一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。
199201+人已加入
加入
相关电子书
更多
基于 Flink SQL + Paimon 构建流式湖仓新方
基于 Flink CDC 打造 企业级实时数据集成方案
李劲松|Flink Table Store 典型应用场景
立即下载 立即下载 立即下载