大数据分布式SQL 的相关内容

[帮助文档] 管理SQL Compute

Compute是指EMR Serverless Spark工作空间中可用的计算资源。您需要访问Compute来运行SQL查询和进行数据科学分析。本文主要为您介绍如何创建SQL Compute。

[帮助文档] Spark SQL任务快速入门

EMR Serverless Spark支持通过SQL代码编辑和运行任务。本文带您快速体验Spark SQL任务的创建、启动和运维等操作。

如何在 PolarDB-X 中优化慢 SQL

2 课时 |

113 人已学 |

加入学习

SQL完全自学手册

61 课时 |

3601 人已学 |

加入学习

SQL Server on Linux入门教程

14 课时 |

4329 人已学 |

加入学习

[帮助文档] 开发SparkSQL任务

本文为您介绍SQL任务开发的配置项说明和操作步骤。

[帮助文档] 使用DataWorks周期性执行SQL Server任务

DataWorks的SQL Server节点可进行SQL Server任务的开发和周期性调度，以及与其他作业的集成操作。本文为您介绍使用SQL Server节点进行任务开发的主要流程。

黑马程序员-大数据入门到实战-分布式SQL计算 Hive 语法与概念

1. 数据库操作创建数据库create database if not exists myhive;查看数据库详细信息desc database myhive;数据库本质上就是在HDFS之上的文件夹默认数据库的存放路径是HDFS的：/user/hive/warehouse内创建数据库并指定hdfs存...

黑马程序员-大数据入门到实战-分布式SQL计算 Hive 入门

1. Apache Hive 概述分布式SQL计算定义以分布式的形式，执行SQL语句，进行数据统计分析Apache Hive功能将SQL语句翻译成MapReduce程序，提供用户分布式SQL计算能力2. 模拟实现Hive功能元数据管理SQL解析器3. Hive基础架构元数据管理SQL解析器：完成SQ...

大数据Spark分布式SQL引擎

1 Spark SQL CLI回顾一下，如何使用Hive进行数据分析的，提供哪些方式交互分析？？？方式一：交互式命令行（CLI）1.bin/hive，编写SQL语句及DDL语句方式二：启动服务HiveServer2（Hive ThriftSer...

[帮助文档] 数据查询DQL和数据操作DML的架构设计核心要点_云原生大数据计算服务 MaxCompute(MaxCompute)

为了方便用户操作Transactional Table 2.0，MaxCompute计算引擎对SQL全套的数据查询DQL语法和数据操作DML语法进行了支持，并且SQL引擎内核模块包括Compiler、Optimizer、Runtime等都做了专门适配开发以支持相关功能和优化。本文为您介绍数据查询DQ...

颠覆大数据分析之Shark：分布式系统上的SQL接口

内存计算已经成为了海量数据分析的一个重要范式。这一点可以从两个方面来进行理解。一方面，尽管当要查询的数据达到了PB级，但是由于时间和空间的局限性，在一个集群环境上仅需64GB的缓存就能够满足绝大多数的查询（95%）。Ananthanarayanan等人在一次研究中发现了这点。另一方面，由于机器学习算...