[帮助文档] 如何在MaxCompute中如何创建外部项目,并查询Hadoop中的表数据

本文以E-MapReduce的Hive为例,为您介绍在MaxCompute中如何创建外部项目,并查询Hadoop中的表数据。

[帮助文档] 迁移Hadoop集群至DataLake集群

本文将详细阐述如何将您已有的旧版数据湖集群(Hadoop),高效地迁移至数据湖集群(DataLake),以下分别简称“旧集群”和“新集群”。迁移过程将充分考虑旧集群的版本、元数据类型以及存储方式,并针对这些因素,提供适应新集群的迁移策略与步骤。

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第一阶段

33 课时 |
283 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第二阶段

28 课时 |
248 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第三阶段

25 课时 |
92 人已学 |
免费
开发者课程背景图

[帮助文档] 基于Hadoop集群支持Delta Lake或Hudi存储机制

Delta Lake和Hudi是数据湖方案中常用的存储机制,为数据湖提供流处理、批处理能力。MaxCompute基于开源的Hadoop集群提供了支持Delta或Hudi存储机制的湖仓一体架构。您可以通过MaxCompute查询到实时数据,即时洞察业务数据变化。

[帮助文档] 如何通过MaxCompute与Hadoop构建湖仓一体

通过MaxCompute与Hadoop构建湖仓一体方案旨在实现对海量数据的统一管理、存储和分析,提供了一个既能处理结构化、半结构化数据,又能满足高并发分析需求的一体化数据平台。本文为您介绍如何通过MaxCompute与Hadoop构建湖仓一体,以及管理湖仓一体项目。

【大数据技术Hadoop+Spark】MapReduce概要、思想、编程模型组件、工作原理详解(超详细)

【大数据技术Hadoop+Spark】MapReduce概要、思想、编程模型组件、工作原理详解(超详细)

MapReduce是Hadoop系统核心组件之一,它是一种可用于大数据并行处理的计算模型、框架和平台,主要解决海量数据的计算,是目前分布式计算模型中应用较为广泛的一种。一、MapReduce核心思想MapReduce的核心思想是“分而治之”。所谓“分而治之”就是把一个复杂的问题,按照一定的“分解”方...

【大数据处理框架】Hadoop大数据处理框架,包括其底层原理、架构、编程模型、生态圈

Hadoop是一个开源的大数据处理框架,它包含了底层的分布式文件系统和分布式计算资源管理系统,以及高级的数据处理编程接口。底层原理Hadoop是一个开源的大数据处理框架,它的底层原理是基于分布式计算和存储的。首先,我们来了解一下HDFS。HDFS是Hadoop的核心组件之一,它是一个分布式文件系统,...

[帮助文档] 如何管理SmartDataHadoop回收站

Hadoop回收站是Hadoop文件系统的重要功能,可以恢复误删除的文件和目录。本文为您介绍Hadoop回收站的使用方法。

《Hadoop与大数据挖掘》——2.4 Hadoop编程开发

本节书摘来自华章计算机《Hadoop与大数据挖掘》一书中的第2章,第2.4节,作者 张良均 樊哲 位文超 刘名军 许国杰 周龙 焦正升,更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.4 Hadoop编程开发 Hadoop框架最核心的设计就是HDFS和MapReduce。HDFS为海量的...

《Hadoop与大数据挖掘》一2.6.3 Hadoop TF-IDF编程实现

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.6.3节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.6.3 Hadoop TF-IDF编程实现 这里给出的TF-IDF算法的测试数据使用的是Avro格...

《Hadoop与大数据挖掘》一2.6.2 Hadoop TF-IDF编程思路

本节书摘来华章计算机《Hadoop与大数据挖掘》一书中的第2章 ,第2.6.2节,张良均 樊 哲 位文超 刘名军 许国杰 周 龙 焦正升 著 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.6.2 Hadoop TF-IDF编程思路 这里不再给出TF-IDF的单机算法实现,而直接给出其H...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

大数据
大数据
大数据计算实践乐园,近距离学习前沿技术
188891+人已加入
加入
相关电子书
更多
Why is my Hadoop* job slow
海量结构化和非结构化大数据Hadoop集群规划
海量结构化和非结构化大数据Hadoop集群规划
立即下载 立即下载 立即下载
相关实验场景
更多