Apache Spark 系列技术直播 - Spark SQL 实践与优化

直播回看点我 Apache Spark 系列技术直播 Spark SQL 实践与优化 内容简介: SparkSQL介绍 基本原理 支持的DataSource介绍 Hue/Zepplin/Livy周边跟SparkSQL的集成使用等 SparkSQL优化 SparkSQL Catalyst优化 AE优化...

Apache Kudu & Apache Spark SQL for Fast Analytics on Fast Data

在SPARK SUMMIT 2017上,Mike Percy Software Engineer at Cloudera Apache Kudu PMC member分享了题为《Apache Kudu & Apache Spark SQL for Fast Analytics on Fast...

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第一阶段

33 课时 |
283 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第二阶段

28 课时 |
248 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第三阶段

25 课时 |
92 人已学 |
免费
开发者课程背景图

Hivemall: Scalable machine learning library for Apache Hive/Spark/Pig

在Hadhoop summit 2016上,esearch Engineer, Treasure Data Makoto YUI和Research Engineer, NTT Takashi Yamamuro分享了题为《Hivemall: Scalable machine learning libr...

nabling Apache Zeppelin* and Spark* for Data Science in the Enterprise

在Hadhoop summit 2016上,Bikas Saha分享了题为《nabling Apache Zeppelin and Spark for Data Science in the Enterprise》,就让大数据触手可及,目前企业面临的问题,Apache Zeppelin企业做好准备,...

A Container-based Sizing Framework for Apache Hadoop/Spark Clusters

在Hadhoop summit 2016上,Akiyoshi SUGIKI, Phyo Thandar Thant,Hokkaido University分享了题为《A Container-based Sizing Framework for Apache Hadoop/Spark Clusters...

"基于 Apache* Spark* 的大规模 分布式机器学习实践"

"作为年度科技盛会,以“飞天•进化 Apsara Evolution”为主题的2016年云栖大会在杭州云栖小镇隆重召开。全球数万多名IT从业人员奔赴现场,共同描绘云计算发展趋势和蓝图,展现云计算、大数据、人工智能蓬勃发展的生态全景。 在云栖大会期间,Zhichao Li,Senior Softwar...

Apache Kylin Speed Up Cubing with Spark

Luke Han and Shaofeng Shi在Spark Summit 2017上做了主题为《Apache Kylin Speed Up Cubing with Spark》的演讲,就什么是Apache Kylin,MapReduce的挑战,通过Spark加速等进行了深入的分享。 https:...

Apache Spark的部署环境的小记

Spark的单机版便于测试,同时通过SSH用Spark的内置部署脚本搭建Spark集群,使用Mesos、Yarn或者Chef来部署Spark。对于Spark在云环境中的部署,比如在EC2(基本环境和ECMR)上的部署。     请移步,见我的下面博客 Spark运行模式概述   ...

Apache Flink vs Apache Spark——感觉二者是互相抄袭啊 看谁的好就抄过来 Flink支持在runtime中的有环数据流,这样表示机器学习算法更有效而且更有效率

Apache Flink是什么   Flink是一款新的大数据处理引擎,目标是统一不同来源的数据处理。这个目标看起来和Spark和类似。没错,Flink也在尝试解决 Spark在解决的问题。这两套系统都在尝试建立一个统一的平台可以运行批量,流式,交互式,图处理,机器学习等应用。所以,Flink和Sp...

实用 | 从Apache Kafka到Apache Spark安全读取数据

引言 随着在CDH平台上物联网(IoT)使用案例的不断增加,针对这些工作负载的安全性显得至关重要。本篇博文对如何以安全的方式在Spark中使用来自Kafka的数据,以及针对物联网(IoT)使用案例的两个关键组件进行了说明。 Cloudera Distribution of Apache Kafka ...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

Apache Spark 中国技术社区
Apache Spark 中国技术社区
阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!
4459+人已加入
加入
相关电子书
更多
Apache Spark: Cloud and On-Prem
Hybrid Cloud and Apache Spark
\"基于 Apache* Spark* 的大规模 分布式机器学习实践\"
立即下载 立即下载 立即下载