[帮助文档] 如何使用SparkStructuredStreaming实时处理Kafka数据

本文介绍如何使用阿里云 Databricks 数据洞察创建的集群去访问外部数据源 E-MapReduce,并运行Spark Structured Streaming作业以消费Kafka数据。

[帮助文档] 如何创建EMRSparkStreaming节点并进行数据开发_大数据开发治理平台 DataWorks(DataWorks)

EMR Spark Streaming节点用于处理高吞吐量的实时流数据,并具备容错机制,可以帮助您快速恢复出错的数据流。本文为您介绍如何创建EMR Spark Streaming节点并进行数据开发。

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第一阶段

33 课时 |
283 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第二阶段

28 课时 |
248 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第三阶段

25 课时 |
92 人已学 |
免费
开发者课程背景图

基于Spark Streaming对新闻网站项目案例分析

一、需求分析新闻网站需求:pvuv注册用户数热门板块数据处理流程:数据源 -> kafka -> spark streaming二、数据准备(1)数据格式网站日志格式 :date,timestamp,userid,pageid,section,action日志字段说明:date: 日期,...

[帮助文档] 如何配置SparkStreaming类型作业

本文介绍如何配置Spark Streaming类型的作业。

[帮助文档] 如何通过DLAServerlessSpark提交SparkStreaming作业

本文介绍DLA Serverless Spark如何提交Spark Streaming作业以及Spark Streaming作业重试的最佳实践。

[帮助文档] 如何使用DLASparkStreaming访问LogHub

本文介绍了如何使用DLA Spark Streaming访问LogHub。

Spark Streaming函数的分析与理解

Go to   http://blog.csdn.net/dabokele/article/details/52602412

Spark Streaming 1.6 流式状态管理分析

关于状态管理 在流式计算中,数据是持续不断来的,有时候我们要对一些数据做跨周期(Duration)的统计,这个时候就不得不维护状态了。而状态管理对Spark 的 RDD模型是个挑战,因为在spark里,任何数据集都需要通过RDD来呈现,而RDD 的定义是一个不变的分布式集合。在状态管理中,比如Spa...

Spark Streaming Direct Approach (No Receivers) 分析

前言 这个算是Spark Streaming 接收数据相关的第三篇文章了。 前面两篇是: Spark Streaming 数据产生与导入相关的内存分析 Spark Streaming 数据接收优化 Spark Streaming 接受数据的方式有两种: Receiver-based Approach...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

Apache Spark 中国技术社区
Apache Spark 中国技术社区
阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!
4459+人已加入
加入
相关电子书
更多
云HBaseSQL及分析 ——Phoenix&Spark
Spark Streaming At Bing Scale
From Spark Streaming to Struct
立即下载 立即下载 立即下载

apache sparkstreaming相关内容