apache spark机制-阿里云

Spark 缓存和检查点机制

Spark 缓存和检查点是提高 Spark 性能的两个重要机制。 Spark 缓存机制 Spark 支持将RDD数据缓存在内存中，在后续的操作中直接使用缓存中的数据，避免了重复计算和频繁读写磁盘的开销。Spark 缓存机制主要包括以下几种方法： persist() 和 cache()：手动对RDD进...

Spark之Shuffle机制及其文件寻址详解

Spark之Shuffle机制及其文件寻址详解一、SparkShuffle概念Certain operations within Spark trigger an event known as the shuffle. The shuffle is Spark’s mechanism for re-...

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

33 课时 |

283 人已学 |

加入学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

28 课时 |

248 人已学 |

加入学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

25 课时 |

92 人已学 |

加入学习

跳转至： GO

更新时间 2024-04-08 11:36:37

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

社区圈子

Apache Spark 中国技术社区

阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区，定期推送精彩案例，问答区数个 Spark 技术同学每日在线答疑，只为营造 Spark 技术交流氛围，欢迎加入！

4459+人已加入

加入

Spark 缓存和检查点机制

Spark之Shuffle机制及其文件寻址详解

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第一阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第二阶段

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

Spark是基于什么来计算的机制呢？

Spark的惰性机制是什么？

Hadoop和Spark在执行机制方面有什么不同呢？

Spark的YARN模式运行机制

Spark的Standalone模式运行机制

Spark Streaming之容错机制

Spark Streaming之checkpoint机制

Flink 的 checkpoint 机制对比 spark 有到底什么不同和优势？

apache spark您可能感兴趣