最佳实践 | 通过Apache Hudi和Alluxio建设高性能数据湖

最佳实践 | 通过Apache Hudi和Alluxio建设高性能数据湖

T3出行的杨华和张永旭描述了他们数据湖架构的发展。该架构使用了众多开源技术,包括Apache Hudi和Alluxio。在本文中,您将看到我们如何使用Hudi和Alluxio将数据摄取时间缩短一半。此外,数据分析人员如何使用Presto、Hudi和Alluxio让查询速度提高了10倍。我们基于数据编...

Flink CDC + Hudi + Hive + Presto构建实时数据湖最佳实践

Flink CDC + Hudi + Hive + Presto构建实时数据湖最佳实践

1. 测试过程环境版本说明 Flink1.13.1 Scala2.11 CDH6.2.0 Hadoop3.0.0 Hive2.1.1 Hudi0.10(master) PrestoDB0.256 Mysql5.7 2. 集群服务器基础环境 2.1 Maven和JDK环境版本 ...

大数据知识图谱系列—如何选择合适的OLAP引擎进行数据湖分析

4 课时 |
110 人已学 |
免费
开发者课程背景图

[帮助文档] DLF+EMR之统一权限的最佳实践

本文结合具体业务场景,为您介绍如何使用DLF+EMR两个产品实现数据湖上统一权限的最佳实践。

[帮助文档] EMR元数据迁移数据湖DLF的最佳实践

通过EMR+DLF数据湖方案,可以为企业提供数据湖内的统一的元数据管理,统一的权限管理,支持多源数据入湖以及一站式数据探索的能力。本方案支持已有EMR集群元数据库使用RDS或内置MySQL数据库迁移DLF,通过统一的元数据管理,多种数据源入湖,搭建高效的数据湖解决方案。

AnayticDB  MySQL降本30%的数据湖最佳实践

AnayticDB MySQL降本30%的数据湖最佳实践

【先打一波小广告】阿里云AnalyticDB MySQL升级为湖仓一体架构,支持高吞吐离线处理和高性能在线分析,可无缝替换CDH/TDH/Databricks/Presto/Spark/Hive等。1.目前湖仓版开放了线上训练营,参加实验免费赢耳机/充电宝/卫衣等好礼,报名链接:https://de...

兰姆达 x AnayticDB 降本30%的数据湖最佳实践

兰姆达 x AnayticDB 降本30%的数据湖最佳实践

1. 客户介绍上海兰姆达数据科技有限公司(简称“兰姆达数据”)是一家提供卓越的数据科学软件产品和解决方案的初创高科技公司。兰姆达核心团队专注于大数据,机器学习算法和精准营销SaaS平台。公司提供的数据科学平台主要包括:自动化机器学习平台SuperML和自助式BI工具SuperBI。在行业解...

《小红书云原生开源数据湖最佳实践》电子版地址

《小红书云原生开源数据湖最佳实践》电子版地址

《小红书云原生开源数据湖最佳实践》《小红书云原生开源数据湖最佳实践》.ppt 电子版下载地址:https://developer.aliyun.com/ebook/227 电子书: </div>

《云原生数据湖构建、分析与开发治理最佳实践》电子版地址

《云原生数据湖构建、分析与开发治理最佳实践》电子版地址

《阿里云中小企业应用-对外白皮书v1.0(公开版·可对外)》《阿里云中小企业应用-对外白皮书v1.0(公开版·可对外)》PDF 电子版下载地址:https://developer.aliyun.com/ebook/6662 电子书: </div>

Hive 数仓迁移 JindoFS/OSS 数据湖最佳实践

Hive 数仓是大多数迁移客户都会遇到的场景。在迁移过程中,不建议同时在新集群进行业务升级(比如从 Hive on MR 迁移到 Hive on Tez 或 Spark SQL等),这些业务...

作业帮基于 DeltaLake 的数据湖建设最佳实践

作业帮基于 DeltaLake 的数据湖建设最佳实践

作者:刘晋 作业帮-大数据平台技术部负责人王滨 作业帮-大数据平台技术部高级架构师毕岩 阿里云-计算平台开源大数据平台技术专家内容框架:业务背景问题&痛点解决方案基于 DeltaLake 的离线数仓未来规划致谢一、业务背景作业帮是一家以科技为载体的在线教育公司。目前旗下拥有工具类产品作业帮、...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
数据湖技术解析
数据湖统一元数据与权限
《小红书云原生开源数据湖最佳实践》
立即下载 立即下载 立即下载

数据湖最佳实践相关内容