常见问题

目前,ClickHouse不支持查询使用DLF元数据的Hive表,只支持使用MySQL或RDS作为元数据的Hive表。因此,不建议直接使用ClickHouse查询Hive表。根据具体需求,建议如下:如果需要将Hive数据导入到ClickHouse,建议使用Apache Spark或Apache ...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。权限说明 仅支持 超级管理员、数据源管理员、板块架构师、项目管理员 角色创建数据...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。更多信息,请参见 Apache Hudi官网。权限说明 仅支持 超级管理员、数据源管理员、...

Impala概述

可以使用单个、开放和统一的元数据存储。所有数据均可立即查询,无需等待ETL(Extract-transform-load)。所有硬件均用于Impala查询以及MapReduce。仅需单个计算机池即可扩展。Impala的详细信息,请参见 Apache Impala。架构 E-MapReduce中...

DLF统一元数据

本文为您简单介绍阿里云数据湖构建,以及如何切换E-MapReduce(简称EMR)的元数据存储类型。背景信息 阿里云数据湖构建是一款全托管的快速帮助用户构建云上数据湖的服务,产品为云原生数据湖提供了统一的元数据管理、统一的权限与安全管理...

为Spark集群设置元数据

EMR on ACK支持使用数据元数据DLF(Data Lake Formation)和自建Hive Metastore元数据两种方式,为Spark集群设置元数据。本文为您介绍如何在EMR on ACK中设置Spark集群的元数据。背景信息 因为数据元数据DLF具有高可用和易维护的特点,...

Paimon与Spark集成

表明您正在使用Paimon作为数据存储格式来读取或写入数据。oss:/<yourBucketName>/warehouse/test_db.db/test_tbl:Paimon表所在路径,请根据实际情况进行替换。返回信息如下所示。uuid|name|price|+-+-+-+|1|apple|3.5|2|banana|4.0|3|...

Hive数据

示例 以下示例创建了一个名为 hive_catalog 的Hive Catalog。CREATE EXTERNAL CATALOG hive_catalog PROPERTIES("type"="hive","hudi.catalog.uris"="thrift:/xx.xx.xx.xx:9083");查看Hive表数据 您可以通过SELECT查询目标数据库中的目标表...

Dataphin离线管道中Hive输出组件配置后报错“获取...

问题原因 Hive元数据meta的mysql数据库的连接数达到了设置的最大连接数量,导致新的hive连接无法连接到meta库,从而报错获取元数据失败。解决方案 将Hive的meta mysql库的最大连接数上限调大一些,一般建议设置为1000(通常默认值是200)。...

元数据迁移

元数据迁移提供可视化的元数据迁移能力,可以帮您快速的将Hive Metastore的元数据迁移到数据湖构建(DLF)中。前提条件 支持Hive版本:2.3.x 版本。支持元数据库类型:MySQL。创建元数据迁移任务 创建迁移任务 打开 数据湖构建控制台。选择...

Hive使用扩展记录数据血缘和访问历史

hivemetastore-site.xml hive.metastore.event.listeners 监听Hive元数据变更的事件信息,用于数据血缘。开启EMR-HOOK时,参数值填写为 com.aliyun.emr.meta.hive.listener.MetaStoreListener关闭EMR-HOOK时,参数值置为空。hive....

元数据管理

选择元数据表中数据存储的位置。选择元数据表的存储格式。指定元数据表的分隔符。手动定义元数据表的列,指定列编号、列名称、是否是分区列等信息。删除元数据库 1.进入元数据管理-元数据库页面。2.找到想要删除的元数据库,点击右侧的删除...

概述

功能简介 使用智能媒体管理服务时,在授权允许的情况下,元数据管理功能可以根据您的需求分析存储在对象存储(OSS)、相册与网盘服务(PDS)等产品中的文件,采集文件元数据并将元数据索引到元数据存储引擎中,为您提供强大的文件查询、...

EMR元数据迁移到数据湖构建(DLF)

本文为您介绍如何将Hive MetaStore存储在MySQL、RDS中的元数据迁移到DLF中,并介绍如何在EMR集群中配置使用DLF作为数据湖统一元数据。适用场景 从其他大数据集群迁移到阿里云E-MapReduce产品。从阿里云EMR老集群(MySQL做元数据),整体...

EMR元数据迁移DLF最佳实践

通过EMR+DLF数据湖方案,可以为企业提供数据湖内的统一的元数据管理,统一的权限管理,支持多源数据入湖以及一站式数据探索的能力。本方案支持已有EMR集群元数据库使用RDS或内置MySQL数据库迁移DLF,通过统一的元数据管理,多种数据源入湖...

独立RDS元数据

数据库名称>为 hive元数据库 名称。数据库用户名 填写hive元数据库中账号的用户名。数据库密码 填写hive元数据库中账号的密码。Metastore初始化 1.连接RDS元数据库,首先需要打通Databricks集群与MySQL实例的VPC和vSwitch网络。详情参见 ...

更新元数据缓存

默认情况下,StarRocks会缓存 Hive、Hudi、Iceberg的元数据,并以异步模式自动更新缓存的元数据,从而提高查询性能。本文为您介绍如何 手动更新缓存的元数据。语法 REFRESH EXTERNAL TABLE[external_catalog.][db_name.][PARTITION('...

时序模型计量计费

使用时序模型时,时间线数据和时间线元数据会产生数据存储量。同时,对时间线数据和时间线元数据的读写操作会消耗读写吞吐量。本文介绍了时序模型的计费项以及计费示例。注意事项 时序模型中的分析存储功能将从2023年12月20日正式开始收费...

Airflow调度DLA Spark作业

Airflow是比较流行的开源调度工具,...关于如何访问自建Hive元数据,请参见 Hive。如果您当前使用的是Airflow调度Livy的方式,目前还是需要改造成命令行的形式。DLA Spark团队正在开发Livy兼容版本,以降低迁移成本,具体请联系 专家服务。

配置Hive输出组件

根据Hive数据存储格式不同,支持选择压缩格式不同:数据存储格式为 orc:支持选择的压缩格式包括 zlib、snappy。数据存储格式为 parquet:支持选择的压缩格式包括 snappy、gzip。数据存储格式为 textfile:支持选择的压缩格式包括 gzip、...

迁移元数据上云

元数据存储于RabbitMQ集群的内部数据库,在集群的各个节点之间自动复制。集群内各节点的元数据内容都相同。使用限制 由于RabbitMQ和 云消息队列 RabbitMQ 版 在权限管控机制等方面存在差异,rabbit_version、users、permissions、...

时序模型介绍

表格存储的时序模型是针对时间序列数据的特点进行设计,适用于物联网设备监控、设备采集数据、机器监控数据等场景,支持自动构建时序元数据索引、丰富的时序查询能力等功能。时序模型通过时序表存储时间序列数据,能提供高并发写入和查询...

通过元数据文件迁移上云

Kafka集群元数据存储于ZooKeeper上,Kafka集群各个节点从ZooKeeper中获取最新的元数据。因此,集群的各个节点的元数据被导出时都是最新且相同的。Kafka集群元数据可以被导出成一份JSON文件,然后被导入另一个Kafka集群,实现自建Kafka集群...

2023-06-21版本

无 表格存储Tablestore连接器支持写入时序数据 表格存储的时序模型针对时间序列数据的特点进行设计,支持写入Tablestore时序数据。无 Hive Catalog支持Hive 3.x版本的DLF 对于Hive 3.x版本,支持DLF作为Hive Catalog的元数据管理中心。管理...

参数配置

打开后,您可以按需为新数据动态创建分区,同时StarRocks会⾃动删除过期分区,从而确保数据的实效性。FALSE:不开启动态分区功能。max_partitions_in_one_batch 4096 批量创建分区时,分区数目的最大值。max_query_retry_time 2 FE上查询重...

在EMR集群运行TPC-DS Benchmark

说明 EMR Spark支持HDFS和OSS等多种存储介质保存的数据表,也支持数据湖构建(DLF)元数据。使用Spark Beeline ANALYZE命令获得Hive表统计信息,加快后续SQL查询速度。cd~/hive-testbench-hdp3 spark-beeline-u jdbc:hive2:/master-1-1:...

GetMetaQueryStatus

调用 GetMetaQueryStatus 接口获取指定存储空间(Bucket)的元数据索引库信息。注意事项 要获取存储空间的元数据索引库信息,您必须有 oss:GetMetaQueryStatus 权限。具体操作,请参见 为RAM用户授权自定义的权限策略。请求语法 GET/?...

数据湖构建的审计事件

GetMetaDataStorageUsages 获取元数据存储用量信息。GetMetastoreMigration 查看元数据迁移。GetMigrationWorkflowInstanceLogInfo 获取迁移工作流实例日志信息。GetPartition 获取元数据库分区。GetPartitionColumnStatistics 获取元数据...

元数据导入

Kafka集群元数据存储于ZooKeeper上,Kafka集群各个节点从ZooKeeper中获取最新的元数据。因此,集群的各个节点的元数据被导出时都是最新且相同的。Kafka集群元数据可以被导出成一份JSON文件,然后被导入另一个Kafka集群,实现自建Kafka集群...

存储网关软件版公测

元数据 元数据存储管理 下表详细列举了ossfs与云存储网关软件版元数据相关的原理对比:对比项 云存储网关软件版 ossfs 元数据缓存 云存储网关软件版采用KV数据库存储数据,它会将元数据全量缓存到缓存盘里,能够处理大规模的文件数目。...

使用Tablestore作为存储后端

JindoFS元数据服务支持不同的存储后端,本文介绍使用Tablestore(OTS)作为元数据后端时需要进行的配置。前提条件 已创建EMR集群。详情请参见 创建集群。已创建Tablestore实例,推荐使用高性能实例。详情请参见 创建实例。说明 需要开启...

使用Tablestore作为存储后端

JindoFS元数据服务支持不同的存储后端,本文介绍使用Tablestore(OTS)作为元数据后端时需要进行的配置。前提条件 已创建EMR集群。详情请参见 创建集群。已创建Tablestore实例,推荐使用高性能实例。详情请参见 创建实例。说明 需要开启...

时序模型设计

时序表结构 假设存储车辆元数据数据表名称为vehicles_timeseriesdata,表结构请参见下表。字段名称 类型 描述 measurement String 度量名称,表示时间线数据所度量的物理量或者监控指标的名称。data source String 数据源,表示产生时间...

异构数据源访问

提供以下功能:多种数据存储访问:支持多种数据存储系统,允许 AnalyticDB PostgreSQL版 数据库直接访问存储在HDFS、Hive、MySQL,PostgreSQL,PolarDB MySQL等多种外部系统中的数据。数据格式透明:支持常见的数据格式,如CSV、ORC、...

使用RocksDB作为元数据后端

JindoFS元数据服务支持不同的存储后端,默认配置RocksDB为元数据存储后端。本文介绍使用RocksDB作为元数据后端时需要进行的相关配置。背景信息 RocksDB作为元数据后端时不支持高可用。如果需要高可用,推荐配置Raft作为元数据后端,详情请...

使用RocksDB作为元数据后端

JindoFS元数据服务支持不同的存储后端,默认配置RocksDB为元数据存储后端。本文介绍使用RocksDB作为元数据后端时需要进行的相关配置。背景信息 RocksDB作为元数据后端时不支持高可用。如果需要高可用,推荐配置Raft作为元数据后端,详情请...

使用RocksDB作为元数据后端

JindoFS元数据服务支持不同的存储后端,默认配置RocksDB为元数据存储后端。本文介绍使用RocksDB作为元数据后端时需要进行的相关配置。背景信息 RocksDB作为元数据后端时不支持高可用。如果需要高可用,推荐配置Raft作为元数据后端,详情请...

使用RocksDB作为元数据后端

JindoFS元数据服务支持不同的存储后端,默认配置RocksDB为元数据存储后端。本文介绍使用RocksDB作为元数据后端时需要进行的相关配置。背景信息 RocksDB作为元数据后端时不支持高可用。如果需要高可用,推荐配置Raft作为元数据后端,详情请...

使用RocksDB作为元数据后端

JindoFS元数据服务支持不同的存储后端,默认配置RocksDB为元数据存储后端。本文介绍使用RocksDB作为元数据后端时需要进行的相关配置。背景信息 RocksDB作为元数据后端时不支持高可用。如果需要高可用,推荐配置Raft作为元数据后端,详情请...

使用RocksDB作为元数据后端

JindoFS元数据服务支持不同的存储后端,默认配置RocksDB为元数据存储后端。本文介绍使用RocksDB作为元数据后端时需要进行的相关配置。背景信息 RocksDB作为元数据后端时不支持高可用。如果需要高可用,推荐配置Raft作为元数据后端,详情请...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 对象存储 文件存储 CPFS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用