生态 | Apache Hudi集成Apache Zeppelin

生态 | Apache Hudi集成Apache Zeppelin

1. 简介 Apache Zeppelin 是一个提供交互数据分析且基于Web的笔记本。方便你做出可数据驱动的、可交互且可协作的精美文档,并且支持多种语言,包括 Scala(使用 Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、...

Apache Zeppelin 番外篇——参与开源的得与失

Apache Zeppelin 番外篇——参与开源的得与失

背景经常在公司做一些业务开发,公司里面由于各种人员流动等问题,导致代码质量也是参差不齐,最终问题就是很难维护,前期还想着能够优化代码,但是大部分时间都是需求都是倒排期,所以也导致不再想进行代码优化,有了能跑就行的想法,因此就是基本上在原来的代码上缝缝补补,所以越来越对这种代码无感但是觉得长期这样下去...

Apache RocketMQ:如何从互联网时代演进到云

1 课时 |
154 人已学 |
免费

Apache Flink 入门到实战 - Flink开源社区出品

16 课时 |
1392 人已学 |
免费

Apache Flink 入门

9 课时 |
4826 人已学 |
免费
开发者课程背景图
Apache Zeppelin系列教程第十篇——SQL Debug In Zeppelin

Apache Zeppelin系列教程第十篇——SQL Debug In Zeppelin

SQL Debug介绍首先介绍下什么是SQL Debug?但是经常有这样一个需求,一大段sql 跑出来之后,发现不是自己想要的结果?比如:demo 1: select id,name from ( select id,name from table1 union all select id,name...

Apache Zeppelin系列教程第九篇——Zeppelin NoteBook数据缓存

Apache Zeppelin系列教程第九篇——Zeppelin NoteBook数据缓存

背景在使用Zeppelin JDBC Intercepter 对于Hive 数据进行查询过程中,如果遇到非常复杂的sql,查询效率是非常慢比如:select dt,count(*) from table group by dt做过数据开发的同学都知道,在hive sql查询过程中,hive 会被转换...

Apache Zeppelin系列教程第八篇——LRU算法在Apache Zeppelin中的应用

LRU算法介绍LRU过期策略---最近最少使用概述:LRU 是 Least Recently Used 的缩写,即最近最少使用,是内存管理的一种页面置换算法。算法的核心是:如果一个数据在最近一段时间内没有被访问到,那么它在将来被访问的可能性也很小。换言之,当内存达到极限时,应该把内存中最久没有被访问...

Apache Zeppelin系列教程第七篇——运行paragraph的整个流程分析

Apache Zeppelin系列教程第七篇——运行paragraph的整个流程分析

Zeppelin运行paragraph的整个流程分析前文分别讲述了,JdbcInterpreter、Interpreter、Zengine的流程,本文来主要串联起来paragraph的整个流程前端首先前端部分点运行的时候是通过websocket向后端发送请求的zeppelin-web/src/com...

Apache Zeppelin系列教程第六篇——Zengine调用Interpreter原理分析

Apache Zeppelin系列教程第六篇——Zengine调用Interpreter原理分析

前文介绍jdbc interpreter和interpreter模块交互代码,本篇文章主要分析Zengine调用Interpreter模块代码。介绍完这篇文章之后,我们即可将paragraph run的流程串起来(后面会将整个流程进行串讲)同样,来看下这个测试类zeppelin-zengine/sr...

Apache Zeppelin系列教程第五篇——Interpreter原理分析

在Apache Zeppelin系列教程第四篇——JDBCInterpreter原理分析以JDBCInterpreter为例讲解了实际jdbc的执行过程。下面是一个整体的架构图,其实就是web 向server 发送请求,然后调用zengine,再到interpreter,最后到实际的执行模块,比如上...

Apache Zeppelin系列教程第四篇——JDBCInterpreter原理分析

Apache Zeppelin系列教程第四篇——JDBCInterpreter原理分析

Interpreter 其实就是整个项目的核心,代码运行都是在里面进行执行的,首先来看下Interpreter的抽象类以jdbc-Interpreter为例,可以参考下测试代码(这个代码里面可以直接测试jdbc的sql执行过程和数据返回过程) 参数和介绍可以参考官方文档:Apache Zeppeli...

Apache Zeppelin系列教程第三篇——Note的持久化管理

Apache Zeppelin系列教程第三篇——Note的持久化管理

Note CURD分别提供http接口和websocket 接口http接口:zeppelin-server\src\main\java\org\apache\zeppelin\rest\NotebookRestApi.javawebsocket接口:zeppelin-server\src\main...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

Apache Spark 中国技术社区
Apache Spark 中国技术社区
阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!
4459+人已加入
加入
相关电子书
更多
Apache Doris 精选用户案例集
Apache RocketMQ 云原生统一消息引擎
Apache Tomcat 的云原生演进
立即下载 立即下载 立即下载
相关镜像