阿里云AnalyticDB基于Flink CDC+Hudi实现多表全增量入湖实践

阿里云AnalyticDB基于Flink CDC+Hudi实现多表全增量入湖实践

湖仓一体(LakeHouse)是大数据领域的重要发展方向,提供了流批一体和湖仓结合的新场景。阿里云AnalyticDB for MySQL基于 Apache Hudi 构建了新一代的湖仓平台,提供日志、CDC等多种数据源一键入湖,在离线计算引擎融合分析等能力。本文将主要介绍AnalyticDB fo...

飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践

飞书深诺基于Flink+Hudi+Hologres的实时数据湖建设实践

01 背景介绍 飞书深诺集团致力于在出海数字营销领域提供全链路服务产品,满足不同企业的全球化营销需求。在广告效果监控和游戏运营业务场景中,为了及时响应广告投放成效与消耗方面的问题和快速监测运营动作效果,实时或准实时数据处理提供了至关重要的技术支撑。 通过对各个业务线实时需求的调研了解到,当前实时数据...

实时数据分析:使用Flink实时发现最热Github项目

1 课时 |
404 人已学 |
免费

实时数据接入:5分钟上手 Flink MySQL 连接器

1 课时 |
204 人已学 |
免费

大数据知识图谱系列—基于ELK+Flink日志全观测最佳实践

1 课时 |
174 人已学 |
免费
开发者课程背景图
【湖仓一体】阿里云AnalyticDB MySQL基于Flink CDC+Hudi实现多表全增量入湖实践

【湖仓一体】阿里云AnalyticDB MySQL基于Flink CDC+Hudi实现多表全增量入湖实践

【先打一波小广告】阿里云AnalyticDB MySQL升级为湖仓一体架构,支持高吞吐离线处理和高性能在线分析,可无缝替换CDH/TDH/Databricks/Presto/Spark/Hive等。1.目前湖仓版开放了线上训练营,参加实验免费赢耳机/充电宝/卫衣等好礼,报名链接:https://de...

阿里云全托管flink-vvp平台hudi connector实践(基于emr集群oss-hdfs存储)

阿里云全托管flink-vvp平台hudi connector实践(基于emr集群oss-hdfs存储)

1. 上游数据准备上游数据以mysql为例作为hudi入湖的上游应用表,详细的建表、插入及更新语句如下drop table if exists `sunyf_db`.`flink_test_02_hudi`; create table if not EXISTS `sunyf_db`.`flink_...

《Apache Flink 案例集(2022版)》——1.数据集成——37手游-基于 Flink CDC + Hudi 湖仓一体方案实践

《Apache Flink 案例集(2022版)》——1.数据集成——37手游-基于 Flink CDC + Hudi 湖仓一体方案实践

作者:徐润柏 用户背景 37手游着重强化自身游戏运营能力、市场推广能力、广告设计能力,提出了立体化、AI智能化营销的“流量经营”策略。37手游秉承“创新点亮梦想,分享成就未来”和“相信创造奇迹”的文化理念,强调创新、分享、自信、梦想和追求的经营理念。 业务需求37手游的原有技术架...

[帮助文档] 如何实现Flink+DLF数据入湖与分析_数据湖构建(DLF)

数据湖构建(DLF)可以结合阿里云实时计算Flink版(Flink VVP),以及Flink CDC相关技术,实现灵活定制化的数据入湖。并利用DLF统一元数据管理、权限管理等能力,实现数据湖多引擎分析、数据湖管理等功能。本文为您介绍Flink+DLF数据湖方案具体步骤。

实时数据湖 Flink Hudi 实践探索

实时数据湖 Flink Hudi 实践探索

导读:首先做个自我介绍,我目前在阿里云云计算平台,从事研究 Flink 和 Hudi 结合方向的相关工作。目前,Flink + Hudi 的方案推广大概已经有了一年半的时间,在国内流行度也已比较高,主流的公司也会尝试去迭代他们的数仓方案。所以,今天我介绍的主题是 Flink 和 Hudi 在...

Flink CDC + Hudi 海量数据入湖在顺丰的实践

Flink CDC + Hudi 海量数据入湖在顺丰的实践

本文整理自顺丰大数据研发工程师覃立辉在 5月 21 日 Flink CDC Meetup 的演讲。主要内容包括:顺丰数据集成背景Flink CDC 实践问题与优化未来规划点击查看直播回放 & 演讲PDF一、顺丰数据集成背景顺丰是快递物流服务提供商,主营业务包含了时效快递、经济快递、同城配送以...

37 手游基于 Flink CDC + Hudi 湖仓一体方案实践

37 手游基于 Flink CDC + Hudi 湖仓一体方案实践

本文作者是 37 手游大数据开发徐润柏,介绍了 37 手游为何选择 Flink 作为计算引擎,并如何基于 Flink CDC + Hudi 构建新的湖仓一体方案,主要内容包括:Flink CDC 基本知识介绍Hudi 基本知识介绍37 手游的业务痛点和技术方案选型37 手游湖仓一体介绍Flink C...

Flink + Hudi 在 Linkflow 构建实时数据湖的生产实践

Flink + Hudi 在 Linkflow 构建实时数据湖的生产实践

可变数据的处理一直以来都是大数据系统,尤其是实时系统的一大难点。在调研多种方案后,我们选择了 CDC to Hudi 的数据摄入方案,目前在生产环境可实现分钟级的数据实时性,希望本文所述对大家的生产实践有所启发。内容包括:背景CDC 和数据湖技术挑战效果未来计划总结一、背景Linkflow 作为客户...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云实时计算Flink
阿里云实时计算Flink
一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。
199201+人已加入
加入
相关电子书
更多
ACE 区域技术发展峰会:Flink Python Table API入门及实践
基于Kubernates的流处理平台实践 ——Flink为例
开发者专场-瓦力 探索实时计算新架构-Apache Flink 的云原生部署架构和实践最终版
立即下载 立即下载 立即下载