Catalog概述

例如,执行 CREATE DATABASE 和 CREATE TABLE 语句创建的数据库和数据表都由Internal Catalog管理。每个StarRocks集群都有且只有一个Internal Catalog名为 default_catalog。External Catalog:外部数据目录,用于管理外部数据源的访问信息...

DataX Writer

是 无 database StarRocks数据库的名称。是 无 table StarRocks表的名称。是 无 loadUrl StarRocks FE的地址,用于Stream Load,可以为多个FE地址,格式为 fe_ip:fe_http_port 。是 无 column 目的表需要写入数据的字段,字段之间用英文...

Paimon与Spark集成

CREATE DATABASE paimon.test_db;USE paimon.test_db;创建Paimon表。CREATE TABLE test_tbl(uuid int,name string,price double)TBLPROPERTIES('primary-key'='uuid');向Paimon表中写入数据。INSERT INTO test_tbl VALUES(1,'apple',3.5),...

配置自建RDS

DataLake和Custom集群在创建过程中会自动根据所提供的数据库连接参数初始化Hive Meta数据库,因此无需执行该步骤。步骤一:元数据库准备 创建数据库。具体操作,请参见 创建数据库 中的创建数据库。创建普通用户并授权读写权限。具体操作,...

AI开源项目

阿里云开源的AI及大数据相关开源项目,如用于全自动分布式深度学习系统TePDist、NLP 开发和应用工具包EasyNLP等,您可以根据需要选择AI及大数据开源项目。PAI相关的开源项目信息请前往 阿里云大数据&AI开源项目。

使用Hive查询JindoFS上的数据

例如,创建名为database_on_jindofs,location为 jfs:/emr-jfs/warehouse/database_on_jindofs 的Hive数据库。CREATE DATABASE database_on_jindofs LOCATION 'jfs:/emr-jfs/hive/warehouse/database_on_jindofs';修改Database的Location到...

JindoTable使用说明

jindo table-showPartition-t db1.t1-p date=2020-10-12-listTables 语法 jindo table-listTables[-db][dbName]功能 展示指定数据库中的所有表。不指定[-db]时默认展示default库中的表。示例:展示default库中的表。jindo table-listTables...

JindoTable使用说明

jindo table-showPartition-t db1.t1-p date=2020-10-12-listTables 语法 jindo table-listTables[-db][dbName]功能 展示指定数据库中的所有表。不指定[-db]时默认展示default库中的表。示例:展示default库中的表。jindo table-listTables...

JindoTable使用说明

jindo table-showPartition-t db1.t1-p date=2020-10-12-listTables 语法 jindo table-listTables[-db][dbName]功能 展示指定数据库中的所有表。不指定[-db]时默认展示default库中的表。示例:展示default库中的表。jindo table-listTables...

JindoTable使用说明

jindo table-showPartition-t db1.t1-p date=2020-10-12-listTables 语法 jindo table-listTables[-db][dbName]功能 展示指定数据库中的所有表。不指定[-db]时默认展示default库中的表。示例:展示default库中的表。jindo table-listTables...

JindoTable使用说明

jindo table-showPartition-t db1.t1-p date=2020-10-12-listTables 语法 jindo table-listTables[-db]功能 展示指定数据库中的所有表。不指定[-db]时默认展示default库中的表。示例:展示default库中的表。jindo table-listTables 列出...

JindoTable使用说明

jindo table-showPartition-t db1.t1-p date=2020-10-12-listTables 语法 jindo table-listTables[-db]功能 展示指定数据库中的所有表。不指定[-db]时默认展示default库中的表。示例:展示default库中的表。jindo table-listTables 列出...

JindoTable使用说明

jindo table-showPartition-t db1.t1-p date=2020-10-12-listTables 语法 jindo table-listTables[-db]功能 展示指定数据库中的所有表。不指定[-db]时默认展示default库中的表。示例:展示default库中的表。jindo table-listTables 列出...

JindoTable使用说明

jindo table-showPartition-t db1.t1-p date=2020-10-12-listTables 语法 jindo table-listTables[-db]功能 展示指定数据库中的所有表。不指定[-db]时默认展示default库中的表。示例:展示default库中的表。jindo table-listTables 列出...

产品概述

EMR还可以与阿里云其他的云数据存储系统和数据库系统(例如,阿里云OSS和RDS等)进行数据传输。阿里云EMR提供了on ECS、on ACK和Serverless形态,以满足不同用户的需求。形态 描述 EMR on ECS EMR负责将开源Hadoop生态的组件安装部署在ECS...

产品简介

EMR还可以与阿里云其他的云数据存储系统和数据库系统(例如,阿里云OSS和RDS等)进行数据传输。产品介绍 阿里云EMR提供了on ECS、on ACK和Serverless形态,以满足不同用户的需求。形态 描述 EMR on ECS EMR负责将开源Hadoop生态的组件安装...

HBase版本选择

数据库HBase标准版 HBase标准版使用的是社区的开源HBase分支,并在此基础上定制部分能力,同时优化了稳定性和运维能力。这些能力主要来源包括:内部分支(增强版)的优化。开源新版本中的patch。测试及生产中发现的bug修复、体验优化。...

快速使用EMR Notebook

EMR Notebook提供了全托管的兼容开源Jupyter的Notebook服务,同时内置了SQL Editor的功能。支持SparkSQL、Hive、StarRocks、PySpark等应用程序的开发和运行。本文以Hive查询为例,为您介绍如何使用EMR Notebook。前提条件 已完成系统角色...

TSDB开源生态概述

时间序列数据库TSDB以其强大的功能和兼容性,对于当前的一些开源解决方案实现了较好的适配。以下是TSDB与一些开源组件或开源项目对接的方法。Grafana如何对接TSDB Quick BI如何接入TSDB

Workflow商业化发布

EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。产品文档 ...

Hive概述

Hive是一个基于Hadoop的数据仓库框架,在大数据业务场景中,主要用来进行数据提取、转化和加载(ETL)以及元数据管理。背景信息 E-MapReduce(简称EMR)版本中,Hadoop、Hive版本和EMR集群的配套情况,请参见 版本概述。Hive结构 名称 说明...

SQL Editor

SQL Editor 界面总览 区域 描述 ① 查看Catalog及其下的数据库和表,并且通过下拉列表可以切换不同Catalog。② 单击 图标,创建SQL查询。首次进入SQL Editor,也可以单击 图标。③ 单击 运行,运行整个SQL脚本或批处理,即执行SQL编辑器...

Kafka兼容说明

例如数据库default中一个名为t1的流表,对应的Kafka Topic的名称为-LINSTREAM-default.t1。重要 如果Database或流表名称中含有下划线(_),则需要将下划线替换为短横线(-)。将流表中的数据写入Kafka Topic。具体操作,请参见 通过开源...

Delta Lake概述

Delta数据湖方案如下:在大数据存储层之上提供了数据管理层,该数据管理层等同于数据库中的元数据管理,其元数据随着数据一起存放并对用户可见(例如 图 1 所示)。Delta基于元数据管理引入了ACID,解决了因数据导入失败而产生脏数据和数据...

什么是云原生多模数据库Lindorm

本文介绍 云原生多模数据库 Lindorm 的产品概要。产品介绍 Lindorm是面向物联网、互联网、车联网等设计和优化的云原生多模超融合数据库,支持宽表、时序、文本、对象、流、空间等多种数据的统一访问和融合处理,并兼容SQL、HBase/Cassandra...

添加开源Elastic Search数据

通过开源Elastic Search和DataV结合使用,可以实现数据分析和搜索结果的大屏展示。本文介绍在DataV中添加并使用开源Elastic Search数据源的方法。前提条件 已准备好待添加的开源Elastic Search数据源。添加开源Elastic Search数据源 登录 ...

添加开源Elastic Search数据

通过开源Elastic Search和DataV结合使用,可以实现数据分析和搜索结果的大屏展示。本文介绍在DataV中添加并使用开源Elastic Search数据源的方法。前提条件 已准备好待添加的开源Elastic Search数据源。添加开源Elastic Search数据源 登录 ...

引擎简介

云原生多模数据库 Lindorm 消息引擎是Lindorm面向IoT、车联网、日志等流式数据提供的数据接入服务,支持业务原始数据高吞吐写入,并基于流引擎的实时处理能力,业务只需做简单开发,即可快速实现数据的ETL并入库到Lindorm宽表引擎。...

应用场景

阿里云开源数据平台E-MapReduce(简称EMR)具有广泛的应用场景。本文为您介绍EMR的主要应用场景。数据湖场景 DataLake集群类型提供了数据湖分析场景所需的服务和相关湖格式,包括Hadoop、OSS-HDFS、Hive、Spark、Presto等。通过选择OSS-...

技术支持的范围和方式

阿里云E-MapReduce(简称EMR)是云原生开源数据平台,能够为用户提供简单易集成的开源数据解决方案。EMR on ECS集群主要构建于ECS之上,集群资源归属于用户,EMR提供基于该资源的半托管云服务能力,用户对集群拥有完全的管理操作权限,...

EMR Workflow商业化公告

EMR Workflow介绍 EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行...

支持倚天云服务器

阿里云E-MapReduce支持使用倚天云服务器构建开源数据集群。适用客户 全网用户 新增功能/规格 阿里云E-MapReduce(简称EMR)支持使用倚天云服务器构建开源数据集群。与现有X86架构实例体验完全相同的情况下,具有更高的性价比,帮助用户...

EMR元数据迁移公告

阿里云EMR团队发现部分用户在EMR集群上,仍然使用本地MySQL和统一meta数据库(旧版功能)作为生产环境的Hive元数据存储。我们强烈建议您尽快迁移到数据湖构建DLF中,原因如下:本地MySQL是单机部署,无法保证服务高可用,容易造成服务中断...

EMR旧版数据开发迁移公告

2022年2月21日21点起,E-MapReduce(简称EMR)数据开发功能停止更新,进入维护状态。如果您还在使用旧版控制台的数据开发功能,请尽快迁移至EMR Worflow。本文为您介绍数据开发模块迁移至EMR Workflow的流程。EMR Workflow是一个全托管的...

EMR数据开发停止更新公告

2022年2月21日21点起,E-MapReduce(简称EMR)数据开发功能停止更新,进入维护状态,会影响创建项目、新建和运行作业、工作流、数据开发运维等功能。如果您还在使用数据开发功能,请尽快迁移到DataWorks构建数据开发平台。本文为您介绍数据...

Doris概述

Apache Doris是一个高性能、实时的分析型数据库,能够较好的满足报表分析、即席查询、数据湖联邦查询加速等使用场景。本文为您介绍Apache Doris。背景信息 关于更多Apache Doris信息,详情请参见 Doris介绍。使用场景 数据源经过各种数据...

相关的云服务

本文为您介绍典型场景下,使用开源数据平台E-MapReduce时通常会使用到的其他云服务。云服务名称 说明 云服务器ECS 使用云服务器ECS(Elastic Compute Service)作为集群的节点,每个ECS实例集群中的一个节点。专有网络VPC 专有网络VPC...

EMR Hive功能增强

本文为您介绍E-MapReduce(简称EMR)各版本对应的Hive组件版本,以及各版本中Hive相对开源增强的功能。...EMR-3.23.0之前版本 Hive 2.x 外部统一数据库保存至Hive Meta,所有使用外部Hive Meta的集群共享同一份Meta信息。

创建EMR Studio集群

集群内置MySQL:表示元数据存储在集群本地环境的MySQL数据库中。使用自建RDS:表示使用自建的阿里云RDS作为元数据库,更多信息请参见 配置独立RDS MySQL。数据开发存储 EMR Studio集群的数据都会存在OSS上,即使您的EMR Studio集群销毁了,...

EMR Serverless StarRocks服务等级协议更新

开源数据平台E-MapReduce Serverless服务等级协议》已于2024年02月02日修订,并将于2024年03月01日生效。当前服务等级协议详情,请在 服务等级协议 中查看。变更生效时间 2024年03年01日 变更范围 EMR Serverless StarRocks(标准版)...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云数据库 RDS 数据库备份 云数据库 MongoDB 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用