六六云原生大数据计算服务 MaxCompute spark 的相关内容

[帮助文档] 创建工作空间

工作空间是Serverless Spark的基本单元，用于管理任务、成员、角色和权限。所有的任务开发都需要在具体的工作空间内进行。因此，在开始任务开发之前，您需要先创建工作空间。本文将为您介绍如何在EMR Serverless Spark页面快速创建工作空间。

[帮助文档] Spark SQL任务快速入门

EMR Serverless Spark支持通过SQL代码编辑和运行任务。本文带您快速体验Spark SQL任务的创建、启动和运维等操作。

阿里云大数据工程师ACA认证（2023版）

21 课时 |

807 人已学 |

加入学习

基于MaxCompute的热门话题分析

8 课时 |

329 人已学 |

加入学习

独家揭秘当下大数据体系

4 课时 |

331 人已学 |

加入学习

[帮助文档] RAM用户授权

当RAM用户（子账号）进行EMR Serverless Spark操作，例如创建、查看或删除工作空间等操作时，必须具有相应的权限。本文为您介绍如何进行RAM授权。

[帮助文档] PySpark任务开发入门

您可以自行编写并构建包含业务逻辑的Python脚本，上传该脚本后，即可便捷地创建和执行PySpark任务。本文通过一个示例，为您演示如何进行PySpark任务的开发与部署。

[帮助文档] 阿里云账号角色授权

使用EMR Serverless Spark前，需要授予您的阿里云账号AliyunServiceRoleForEMRServerlessSpark和AliyunEMRSparkJobRunDefaultRole系统默认角色。本文为您介绍角色授权的基本操作。

小六六学大数据之 Spark（二）（下）

Spark 运行流程Spark中的基本概念（1）Application：表示你的应用程序（2）Driver：表示main()函数，创建SparkContext。由SparkContext负责与ClusterManager通信，进行资源的申请，任务的分配和监控等。程序执行完...

小六六学大数据之 Spark（二）（上）

前面的Scala 和Spark的基础都差不多了，下面是前面的今天我们继续来学校SparkRDD的概述什么是RDD？RDD（Resilient Distributed Dataset）叫做弹性分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合。RDD具有...

小六六学大数据之 Spark（一）

Spark简介Spark是加州大学伯克利分校AMP实验室（Algorithms, Machines, and People Lab）开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目，8个月后成为Apache顶级项目，速度之快足见过人之处，Spark以其先进的设计理念，...

共有8条

< 1 >

跳转至： GO

更新时间 2023-08-08 20:03:24

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

产品推荐

热门帮助文档

社区圈子

阿里巴巴大数据计算

阿里大数据官方技术圈

347749+人已加入

加入

[帮助文档] 创建工作空间

[帮助文档] Spark SQL任务快速入门

阿里云大数据工程师ACA认证（2023版）

基于MaxCompute的热门话题分析

独家揭秘当下大数据体系

[帮助文档] RAM用户授权

[帮助文档] PySpark任务开发入门

[帮助文档] 阿里云账号角色授权

小六六学大数据之 Spark（二）（下）

小六六学大数据之 Spark（二）（上）

小六六学大数据之 Spark（一）

产品推荐

云原生大数据计算服务 MaxComputespark相关内容

云原生大数据计算服务 MaxCompute更多spark相关

云原生大数据计算服务 MaxCompute您可能感兴趣