[帮助文档] 如何使用SparkStructuredStreaming实时处理Kafka数据

本文介绍如何使用阿里云 Databricks 数据洞察创建的集群去访问外部数据源 E-MapReduce,并运行Spark Structured Streaming作业以消费Kafka数据。

[帮助文档] 如何创建EMRSparkStreaming节点并进行数据开发_大数据开发治理平台 DataWorks(DataWorks)

EMR Spark Streaming节点用于处理高吞吐量的实时流数据,并具备容错机制,可以帮助您快速恢复出错的数据流。本文为您介绍如何创建EMR Spark Streaming节点并进行数据开发。

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第一阶段

33 课时 |
283 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第二阶段

28 课时 |
248 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第三阶段

25 课时 |
92 人已学 |
免费
开发者课程背景图

[帮助文档] SparkStreamingSQL的STREAM语句

EMR-3.23.0版本开始支持STREAM语法。

Spark Streaming实时流处理项目实战笔记——实战之黑名单过滤

Spark Streaming实时流处理项目实战笔记——实战之黑名单过滤

 思路源代码窗口函数 代码实现object Black extends App { import org.apache.spark.SparkConf import org.apache.spark.streaming.{Seconds, StreamingContext} val spa...

Spark Streaming实时流处理项目实战笔记——将统计结果写入到MySQL数据库中

Spark Streaming实时流处理项目实战笔记——将统计结果写入到MySQL数据库中

思路两种方式,一种可优化(foreachRDD后,直接创建连接Mysql),一种在(foreachRDD后通过foreachPartition,通过分区获取)代码实现import java.sql.DriverManager import Spark.UpdateStateByKey....

[帮助文档] 如何通过DLAServerlessSpark提交SparkStreaming作业

本文介绍DLA Serverless Spark如何提交Spark Streaming作业以及Spark Streaming作业重试的最佳实践。

[帮助文档] 如何使用DLASparkStreaming访问LogHub

本文介绍了如何使用DLA Spark Streaming访问LogHub。

01. Spark Streaming实时流处理学习——初识实时流处理

1. 初识实时流处理 1.1. 业务现状分析 统计主站每个(指定)课程访问的客户、地域信息分布地域:ip转换客户端:useragent获取如上两个操作:采用离线(Spark/MapReduce)的方式进行统计 实现步骤课程编号、IP信息、useragent进行相应的统计分析操作:MapReduce/...

Spark Streaming实时流处理学习

目录 1.初识实时流处理 2.分布式日志收集框架Flume 3.分布式发布订阅消息系统Kafka 4.实战环境搭建 5.Spark Streaming入门 6.Spark Streaming核心概念与编程 7.Spark Streaming进阶与案例实战 8.Spark Streaming整合Flu...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

Apache Spark 中国技术社区
Apache Spark 中国技术社区
阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!
4459+人已加入
加入
相关电子书
更多
云HBaseSQL及分析 ——Phoenix&Spark
Spark Streaming At Bing Scale
From Spark Streaming to Struct
立即下载 立即下载 立即下载

apache sparkstreaming相关内容