[帮助文档] 管理SQL Compute
Compute是指EMR Serverless Spark工作空间中可用的计算资源。您需要访问Compute来运行SQL查询和进行数据科学分析。 本文主要为您介绍如何创建SQL Compute。
[帮助文档] Spark SQL任务快速入门
EMR Serverless Spark支持通过SQL代码编辑和运行任务。本文带您快速体验Spark SQL任务的创建、启动和运维等操作。
[帮助文档] 开发SparkSQL任务
本文为您介绍SQL任务开发的配置项说明和操作步骤。
[帮助文档] 使用DataWorks周期性执行SQL Server任务
DataWorks的SQL Server节点可进行SQL Server任务的开发和周期性调度,以及与其他作业的集成操作。本文为您介绍使用SQL Server节点进行任务开发的主要流程。
黑马程序员-大数据入门到实战-分布式SQL计算 Hive 语法与概念
1. 数据库操作创建数据库create database if not exists myhive;查看数据库详细信息desc database myhive;数据库本质上就是在HDFS之上的文件夹默认数据库的存放路径是HDFS的:/user/hive/warehouse内创建数据库并指定hdfs存...
黑马程序员-大数据入门到实战-分布式SQL计算 Hive 入门
1. Apache Hive 概述分布式SQL计算定义以分布式的形式,执行SQL语句,进行数据统计分析Apache Hive功能将SQL语句翻译成MapReduce程序,提供用户分布式SQL计算能力2. 模拟实现Hive功能元数据管理SQL解析器3. Hive基础架构元数据管理SQL解析器:完成SQ...
大数据Spark分布式SQL引擎
1 Spark SQL CLI回顾一下,如何使用Hive进行数据分析的,提供哪些方式交互分析???方式一:交互式命令行(CLI)1.bin/hive,编写SQL语句及DDL语句方式二:启动服务HiveServer2(Hive ThriftSer...
[帮助文档] 数据查询DQL和数据操作DML的架构设计核心要点_云原生大数据计算服务 MaxCompute(MaxCompute)
为了方便用户操作Transactional Table 2.0,MaxCompute计算引擎对SQL全套的数据查询DQL语法和数据操作DML语法进行了支持,并且SQL引擎内核模块包括Compiler、Optimizer、Runtime等都做了专门适配开发以支持相关功能和优化。本文为您介绍数据查询DQ...
颠覆大数据分析之Shark:分布式系统上的SQL接口
内存计算已经成为了海量数据分析的一个重要范式。这一点可以从两个方面来进行理解。一方面,尽管当要查询的数据达到了PB级,但是由于时间和空间的局限性,在一个集群环境上仅需64GB的缓存就能够满足绝大多数的查询(95%)。Ananthanarayanan等人在一次研究中发现了这点。另一方面,由于机器学习算...
《Spark大数据分析:核心概念、技术及实践》一1.6 分布式SQL查询引擎
本节书摘来自华章出版社《Spark大数据分析:核心概念、技术及实践》一书中的第1章,第1.6节,作者[美] 穆罕默德·古勒(Mohammed Guller),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.6 分布式SQL查询引擎 如前所述,SQL是最常用来查询和...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。