云原生大数据计算服务 MaxCompute缓存的相关内容

[帮助文档] 加速OSS-HDFS透明缓存_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

本文以JindoCache支持阿里云OSS-HDFS透明缓存加速的使用方式为例，利用集群本身的存储资源缓存OSS-HDFS文件，以加速作业对OSS-HDFS的访问。

[帮助文档] 存算分离模式下借助本地缓存提升查询性能_EMR Serverless StarRocks_开源大数据平台 E-MapReduce(EMR)

EMR Serverless StarRocks 3.1.0版本正式支持存算分离模式。在该模式下计算和存储资源被解耦，极大地优化了资源利用效率和成本。为了进一步提升查询性能，该模式充分利用本地缓存技术，将热数据存储于计算节点的本地磁盘中。当查询请求命中本地缓存时，存算分离集群的查询性能与存算一体集群...

阿里云大数据工程师ACA认证（2023版）

21 课时 |

807 人已学 |

加入学习

基于MaxCompute的热门话题分析

8 课时 |

329 人已学 |

加入学习

独家揭秘当下大数据体系

4 课时 |

331 人已学 |

加入学习

大数据计算MaxCompute执行的时候会把with as内容缓存起来吗?

大数据计算MaxCompute执行的时候会把with as内容缓存起来吗?还是说可以通过配置项实现with as内容缓存?

[帮助文档] 如何使用ApacheHDFS透明缓存加速_EMR on ECS_开源大数据平台 E-MapReduce(EMR)

Apache HDFS透明缓存加速可以利用计算集群的闲置存储资源对远端HDFS集群进行数据缓存，避免了计算集群或服务占用核心集群过多带宽。当HDFS集群和计算集群分离，HDFS集群访问性能不及预期时，您可以通过在计算集群或靠近计算集群的地方缓存数据来进行加速。

[帮助文档] JindoCache统一命名空间缓存加速使用说明

JindoCache存储加速系统不仅提供了对多种数据源的缓存加速功能，还能将不同数据源统一管理，并将它们置于同一个命名空间下，从而实现统一访问。

大数据数据存储的分布式文件系统的HDFS的核心机制理解的缓存机制

在 Hdfs 中，数据被以分布式的方式存储在多个节点上，每个节点都有自己的数据副本。数据块可以分布到不同的节点上，从而实现数据的水平扩展。数据块的大小可以达到数百 GB，从而可以支持大数据量的存储和处理。在下一篇博客中，我们将进一步介绍HDFS的核心机制理解的缓存机制，希望大家能够继续关注。

「大数据系列」Ignite：基于内存分布式数据库和缓存和处理平台

Ignite™是一个以内存为中心的分布式数据库，缓存和处理平台事务性，分析性和流式工作负载，以PB级的速度提供内存速度.主要好处Ignite 使用者包括 ING, Sberbank, HomeAway, Wellington, FSB, The Glue, 24 Hour Fitness, JacT...

[帮助文档] 如何手动更新缓存的元数据

默认情况下，StarRocks会缓存Hive、Hudi、Iceberg的元数据，并以异步模式自动更新缓存的元数据，从而提高查询性能。本文为您介绍如何手动更新缓存的元数据。

《Spark与Hadoop大数据分析》——3.5　持久化与缓存

3.5　持久化与缓存 Spark 的一个独特功能是在内存中持久化 RDD。你可以使用 persist 或 cache 变换来持久化 RDD，如下所示：上述两个语句都是相同的，并且会在 MEMORY_ONLY 存储级别缓存数据。它们的区别在于：cache 是指 MEMORY_ONLY 存储级别，而 ...

《Spark与Hadoop大数据分析》一一3.5　持久化与缓存

本节书摘来自华章计算机《Spark与Hadoop大数据分析》一书中的第3章，第3.5节,作者：文卡特·安卡姆（Venkat Ankam）更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.5　持久化与缓存 Spark 的一个独特功能是在内存中持久化 RDD。你可以使用 persist 或 ...