Apache构建数据湖实践的相关内容

Apache Hudi在Linkflow构建实时数据湖的生产实践

1. 背景 Linkflow 作为客户数据平台（CDP），为企业提供从客户数据采集、分析到执行的运营闭环。每天都会通过一方数据采集端点（SDK）和三方数据源，如微信，微博等，收集大量的数据。这些数据都会经过清洗，计算，整合后写入存储。使用者可以通过灵活的报表或标签对持久化的数据进行分析和计算，结果又...

字节跳动基于Apache Hudi构建EB级数据湖实践

接下来将分为场景需求、设计选型、功能支持、性能调优、未来展望五部分介绍Hudi在字节跳动推荐系统中的实践。 ...

Apache RocketMQ：如何从互联网时代演进到云

1 课时 |

154 人已学 |

加入学习

Apache Flink 入门到实战 - Flink开源社区出品

16 课时 |

1392 人已学 |

加入学习

Apache Flink 入门

9 课时 |

4826 人已学 |

加入学习

字节跳动基于Apache Hudi构建实时数据湖平台实践

一篇关于字节跳动基于 Apache Hudi 的实时数据湖平台的分享。 ...

Uber基于Apache Hudi构建PB级数据湖实践

1. 引言从确保准确预计到达时间到预测最佳交通路线，在Uber平台上提供安全、无缝的运输和交付体验需要可靠、高性能的大规模数据存储和分析。2016年，Uber开发了增量处理框架Apache Hudi，以低延迟和高效率为关键业务数据管道赋能。一年后，我们开源了该解决方案，以使得其他有需要的组织也可以利...

Apache Hudi 在 B 站构建实时数据湖的实践

本文作者喻兆靖，介绍了为什么 B 站选择 Flink + Hudi 的数据湖技术方案，以及针对其做出的优化。主要内容为：传统离线数仓痛点数据湖技术方案Hudi 任务稳定性保障数据入湖实践增量数据湖平台收益社区贡献未来的发展与思考GitHub 地址 https://github.com/apache/...

共有5条

< 1 >

跳转至： GO

更新时间 2024-03-17 09:08:10

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

社区圈子

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区，定期推送精彩案例，问答区数个 Spark 技术同学每日在线答疑，只为营造 Spark 技术交流氛围，欢迎加入！

4459+人已加入

加入

Apache Hudi在Linkflow构建实时数据湖的生产实践

字节跳动基于Apache Hudi构建EB级数据湖实践

Apache RocketMQ：如何从互联网时代演进到云

Apache Flink 入门到实战 - Flink开源社区出品

Apache Flink 入门

字节跳动基于Apache Hudi构建实时数据湖平台实践

Uber基于Apache Hudi构建PB级数据湖实践

Apache Hudi 在 B 站构建实时数据湖的实践

Apache实践相关内容

Apache您可能感兴趣