EMR Spark-SQL性能极致优化揭秘 RuntimeFilter Plus

EMR Spark-SQL性能极致优化揭秘 RuntimeFilter Plus

作者:陆路,花名世仪,阿里巴巴计算平台事业部EMR团队高级开发工程师,大数据领域技术爱好者,对Spark、Hive等有浓厚兴趣和一定的了解,目前主要专注于EMR产品中开源计算引擎的优化工作。 背景介绍 TPC-DS 测试集采用星型和雪花型等多维数据模型,包含 7 张事实表和 17 张维度表,以 st...

EMR Spark-SQL性能极致优化揭秘 概览篇

EMR Spark-SQL性能极致优化揭秘 概览篇

作者:林学维,阿里云智能EMR团队技术专家,目前主要专注于EMR产品中开源计算引擎的优化工作 引子 最近阿里云 E-MapReduce 团队在 TPCDS-Perf 榜单中提交了最新成绩,相比第二名(其实也是 EMR 团队于 2019 年提交的记录),无论从性能还有性价比都取得了 2 倍+的优秀成绩...

企业运维训练营之大数据EMR原理与实践

8 课时 |
2696 人已学 |
免费

EMR Studio 大数据处理最佳实践课程

2 课时 |
139 人已学 |
免费

阿里云 EMR on ACK 实战

4 课时 |
156 人已学 |
免费
开发者课程背景图

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
阿里云EMR 2.0:重新定义新一代开源大数据平台
EMR StarRocks 白皮书
生命密码-基因数据的EMR实践
立即下载 立即下载 立即下载