[帮助文档] Apache Kafka Connect远程代码执行漏洞_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

2023年02月08日,Apache发布了一则安全公告,修复了Apache Kafka中存在的一个反序列化漏洞,漏洞编号为CVE-2023-25194。在攻击者可以控制Apache Kafka Connect客户端的情况下,通过SASL JAAS配置和基于SASL的安全协议,在其上创建或修改连接器,...

大数据技术变革正当时,Apache Hudi了解下?

大数据技术变革正当时,Apache Hudi了解下?

之前认为只有大公司才能负担得起大数据驱动的解决方案,该方案适用于海量数据,但价格昂贵。随着大数据技术的不断发展,现在已经发生了很大变化。 1. 大数据技术的成熟度 第一次革命与成熟度和质量有关。十年前对于大数据技术开发人员需要做出一定努力才能使一些大数据技术正常工作或与其他大基础组件协同工作。 .....

Apache RocketMQ:如何从互联网时代演进到云

1 课时 |
154 人已学 |
免费

Apache Flink 入门到实战 - Flink开源社区出品

16 课时 |
1392 人已学 |
免费

Apache Flink 入门

9 课时 |
4826 人已学 |
免费
开发者课程背景图
【大数据技术攻关专题】「Apache-Flink零基础入门」手把手+零基础带你玩转大数据流式处理引擎Flink(基础加强+运行原理)

【大数据技术攻关专题】「Apache-Flink零基础入门」手把手+零基础带你玩转大数据流式处理引擎Flink(基础加强+运行原理)

前提介绍 关于Flink服务的搭建与部署,由于其涉及诸多实战操作而理论部分相对较少,小编打算采用一个独立的版本和环境来进行详尽的实战讲解。考虑到文字描述可能无法充分展现操作的细节和流程,我们决定以视频的形式进行分析和介绍。因此,在本文中,我们将暂时不涉及具体的搭建和部署步骤。 为确保大家能够更直观地...

大数据可视化BI分析工具Apache Superset实现公网远程访问

大数据可视化BI分析工具Apache Superset实现公网远程访问

前言Superset是一款由中国知名科技公司开源的“现代化的企业级BI(商业智能)Web应用程序”,其通过创建和分享dashboard,为数据分析提供了轻量级的数据查询和可视化方案。Superset在数据处理和可视化方面具有强大的功能,能够满足企业级的数据分析需求,并为用户提供直观、灵活的数据探索和...

[帮助文档] 如何使用ApacheHDFS透明缓存加速_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

Apache HDFS透明缓存加速可以利用计算集群的闲置存储资源对远端HDFS集群进行数据缓存,避免了计算集群或服务占用核心集群过多带宽。当HDFS集群和计算集群分离,HDFS集群访问性能不及预期时,您可以通过在计算集群或靠近计算集群的地方缓存数据来进行加速。

大数据Hadoop之——Apache Hudi 数据湖实战操作(Spark,Flink与Hudi整合)

大数据Hadoop之——Apache Hudi 数据湖实战操作(Spark,Flink与Hudi整合)

一、概述Hudi(Hadoop Upserts Deletes and Incrementals),简称Hudi,是一个流式数据湖平台,支持对海量数据快速更新,内置表格式,支持事务的存储层、 一系列表服务、数据服务(开箱即用的摄取工具)以及完善的运维监控工具,它可以以极低的延迟将数据快...

【大数据】Apache Spark入门到实战 4

创建 DataFrame在 Scala 中,可以通过以下几种方式创建 DataFrame:从现有的 RDD 转换而来。例如:import org.apache.spark.sql.SparkSession val spark = SparkSession.builder.appName("Creat...

【大数据】Apache Spark入门到实战 3

CheckPointCheckPoint可以将RDD从其依赖关系中抽出来,保存到可靠的存储系统(例如HDFS,S3等), 即它可以将数据和元数据保存到检查指向目录中。因此,在程序发生崩溃的时候,Spark可以恢复此数据,并从停止的任何地方开始。CheckPoint分为两类:高可用Che...

【大数据】Apache Spark入门到实战 2

RDDRDD的概念在Spark中十分重要,上面只是简单的介绍了一下,下面详细的对RDD展开介绍。RDD是“Resilient Distributed Dataset”的缩写,从全称就可以了解到RDD的一些典型特性:Resilient(弹性):RDD之间会形成有向无环图(DAGÿ...

【大数据】Apache Spark入门到实战 1

【大数据】Apache Spark入门到实战 1

之前说到了之后工作中会接触到Spark离线任务相关的内容,也预先学习了Scala,所以这篇文章它来了。本篇文章会介绍Spark的相关概念以及原理,帮助初学者快速入门Spark。Spark是什么学习一个东西之前总要知道这个东西是什么。Spark 是一个开源的大数据处理引擎,它提供了一整套开发 API,...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

Apache Spark 中国技术社区
Apache Spark 中国技术社区
阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!
4459+人已加入
加入
相关电子书
更多
Apache Doris 精选用户案例集
Apache RocketMQ 云原生统一消息引擎
Apache Spark系列技术直播# 第七讲 【 大数据列式存储之 Parquet/ORC 】
立即下载 立即下载 立即下载
相关镜像