数据湖实操讲解【OSS 访问加速】第七讲:Flink 高效 sink 写入 OSS

数据湖实操讲解【OSS 访问加速】第七讲:Flink 高效 sink 写入 OSS

本期导读 :【OSS 访问加速】第七讲主题:Flink 高效 sink 写入 OSS讲师:重湖,阿里巴巴计算平台事业部 EMR 高级工程师内容框架:背景介绍功能介绍如何配置如何使用直播回放链接:(7/8讲)https://developer.aliyun.com/live/246851...

Flink + Hudi 在 Linkflow 构建实时数据湖的生产实践

Flink + Hudi 在 Linkflow 构建实时数据湖的生产实践

可变数据的处理一直以来都是大数据系统,尤其是实时系统的一大难点。在调研多种方案后,我们选择了 CDC to Hudi 的数据摄入方案,目前在生产环境可实现分钟级的数据实时性,希望本文所述对大家的生产实践有所启发。内容包括:背景CDC 和数据湖技术挑战效果未来计划总结一、背景Linkflow 作为客户...

实时数据分析:使用Flink实时发现最热Github项目

1 课时 |
404 人已学 |
免费

实时数据接入:5分钟上手 Flink MySQL 连接器

1 课时 |
204 人已学 |
免费

大数据知识图谱系列—基于ELK+Flink日志全观测最佳实践

1 课时 |
174 人已学 |
免费
开发者课程背景图
Apache Flink Meetup · 上海站,超强数据湖干货等你!

Apache Flink Meetup · 上海站,超强数据湖干货等你!

你是否有过流批技术栈不统一的抓狂?你是否有过流批数据对不上的烦恼?你是否有过,海量数据更新时效性跟不上的无奈?Apache Flink 社区 2021 首场 Meetup 来啦!4月17日 | 上海 | 线下来一场 Flink x 数据湖的干货体验之旅~本次 Meetup 邀请了来自阿里巴巴、腾讯、...

Flink 如何实时分析 Iceberg 数据湖的 CDC 数据

Flink 如何实时分析 Iceberg 数据湖的 CDC 数据

本文由李劲松、胡争分享,社区志愿者杨伟海、李培殿整理。主要介绍在数据湖的架构中,CDC 数据实时读写的方案和原理。文章主要分为 4 个部分内容:常见的 CDC 分析方案为何选择 Flink + Iceberg如何实时写入读取未来规划一、常见的 CDC 分析方案我们先看一下今天的 topic 需要设计...

Apache Flink 在实时金融数据湖的应用

Apache Flink 在实时金融数据湖的应用

本文由中原银行大数据平台研发工程师白学余分享,主要介绍实时金融数据湖在中原银行的应用。主要内容包括: 1、背景概况 2、实时金融数据湖体系架构 3、场景实践 一、背景概况 首先简单介绍一下中原银行,它位于河南省郑州市,是河南省唯一的省级法人银行,是河南省最大的城市商业银行。2017 年 7 月 19...

基于 Flink+Iceberg 构建企业级实时数据湖

基于 Flink+Iceberg 构建企业级实时数据湖

Apache Flink 是大数据领域非常流行的流批统一的计算引擎,数据湖是顺应云时代发展潮流的新型技术架构。那么当 Apache Flink 遇见数据湖时,会碰撞出什么样的火花呢?本次分享主要包括以下核心内容: 数据湖的相关背景介绍; 经典业务场景介绍; 为什么选择 Apache Iceberg;...

网易:Flink + Iceberg 数据湖探索与实践

网易:Flink + Iceberg 数据湖探索与实践

导读:今天主要和大家交流的是网易在数据湖 Iceberg 的一些思考与实践。从网易在数据仓库建设中遇到的痛点出发,介绍对数据湖 Iceberg 的探索以及实践之路。 主要内容包括: 数据仓库平台建设的痛点 数据湖 Iceberg 的核心原理 数据湖 Iceberg 社区现状 网易数据湖 Iceber...

数据湖有新解!Apache Hudi 与 Apache Flink 集成

数据湖有新解!Apache Hudi 与 Apache Flink 集成

作者:王祥虎(Apache Hudi 社区) Apache Hudi 是由 Uber 开发并开源的数据湖框架,它于 2019 年 1 月进入 Apache 孵化器孵化,次年 5 月份顺利毕业晋升为 Apache 顶级项目。是当前最为热门的数据湖框架之一。 1. 为何要解耦 Hudi 自诞生至今一直使...

OSS数据湖实践——EMR + Flink + OSS案例

OSS数据湖实践——EMR + Flink + OSS案例

本文介绍使用Flink大数据分析引擎,基于EMR,利用OSS云存储数据,实现一个分析案例。前提条件• 已注册阿里云账号,详情请参见注册云账号。• 已开通E-MapReduce服务和OSS服务。• 已完成云账号的授权,详情请参见角色授权。• 已创建Haoop集群,且带有spark组件。• 相关更多配置...

想请问下,flink+数据湖的架构,目前大家是都选择了iceberg吗? #Flink

想请问下,flink+数据湖的架构,目前大家是都选择了iceberg吗? #Flink

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云实时计算Flink
阿里云实时计算Flink
一套基于Apache Flink构建的一站式、高性能实时大数据处理平台,广泛适用于流式数据处理、离线数据处理、DataLake计算等场景。
199201+人已加入
加入
相关电子书
更多
基于 Flink SQL + Paimon 构建流式湖仓新方
基于 Flink CDC 打造 企业级实时数据集成方案
李劲松|Flink Table Store 典型应用场景
立即下载 立即下载 立即下载