新建Paimon数据

通过新建Paimon数据源能够实现Dataphin读取Paimon的业务数据或向Paimon写入数据。本文为您介绍如何新建Paimon数据源。权限说明 仅支持具备新建数据源权限的账号进行新建。更多信息,请参见 数据源权限说明。使用限制 Paimon数据源不支持以...

EMR元数据迁移DLF最佳实践

本方案支持已有EMR集群元数据库使用RDS或内置MySQL数据库迁移DLF,通过统一的元数据管理,多种数据源入湖,搭建高效的数据湖解决方案。本文主要介绍如何将Hive Metasstore存储在MySQL/RDS中的元数据迁移到DLF中,并介绍如何在EMR集群中配置...

EMR元数据迁移到数据湖构建(DLF)

元数据迁移 准备工作 在元数据迁移之前,需要先检查元数据库远程访问权限、MySQL或RDS网络连接。登录RDS或MySQL元数据库,执行以下语句进行远程访问授权(以root账号,hivemeta库为例)。GRANT ALL PRIVILEGES ON hivemeta.*TO 'root'@'%' ...

数据备份与删除

独立部署版本:私有云独立部署,Dataphin输出PostgreSQL数据库作为元数据库元数据库采用一主一备或一主两备模式,保障元数据库稳定性;每天进行元数据库全量冷备,保留七天,过期自动删除。公有云独立部署,Dataphin元数据库采用阿里云上...

元数据管理

创建元数据库 登录 数据湖管理控制台,选择 元数据 目录下的 元数据管理。单击 新建数据库。配置元数据库参数。选择所属数据目录。输入元数据库名称。(选填)输入元数据库描述。输入元数据库的位置。创建元数据表 创建完成元数据库后,...

元数据仓库共享模型概述

元仓共享模型是基于Dataphin...访问元仓共享模型 若您需要访问元仓共享模型,可以通过集成任务将元仓中所需的元仓共享模型的数据表从元仓租户的计算源同步到开发使用的业务租户的计算源中。具体操作,请参见 元数据仓库共享模型标准访问方式。

数据湖构建的审计事件

数据湖构建已与操作审计服务集成,您可以在操作审计中查询用户操作数据湖构建产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中,满足实时审计、问题回溯分析等需求。操作审计记录了用户通过...

Database

名称 类型 描述 示例值 object 数据库对象 CreateTime integer 创建时间,Unix 时间戳秒数 1608707407 Description string 元数据库描述文本 this is a hive database LocationUri string 元数据库保存路径,例如 HDFS 路径/hdfs/hivedb/...

Dataphin元数据仓库标准模型文档中表dim_dataphin_...

概述 本文介绍Dataphin元数据仓库标准模型文档中表dim_dataphin_table查看方法。详细信息 物理表每天的增量没法直接看到,只能从元数据上每天计算差值。查看表的存储量需要在元数据仓库中查看表dim_dataphin_table,获取相关信息。此表在...

配置自建RDS

数据库名称>:步骤一:元数据库准备 中设置的数据库名称。javax.jdo.option.ConnectionUserName RDS用户名 填写 步骤一:元数据库准备 中账号的用户名。javax.jdo.option.ConnectionPassword RDS密码 填写 步骤一:元数据库准备 中账号的...

集群高可用

阿里云Cloudera CDP默认支持集群中组件HDFS NameNode、YARN ResourceManager以及Hive Metastore Server的高可用,此外对于Hive、Hue等组件用于存储元数据的元数据库MariaDB也做了主从备份,能最大限度保证服务的可用性和数据的可恢复性。...

Dataphin中SQL脚本任务在元数据库存放位置

概述 Dataphin中SQL脚本任务在元数据库存放位置。详细信息 SQL脚本存放在dataphin.od_node中。适用于 Dataphin

使用数据探索查询Iceberg表

本文为您介绍如何使用DLF数据探索查询Iceberg表。目前DLF数据探索可以直接支持Delta、Hudi、CSV、Parquet、JSON、ORC等格式的表;受限于Spark和Iceberg的底层设计,在DLF数据探索中查询Iceberg表需要指定特定的Catalog。准备工作 已开通DLF...

通过ECS实例RAM角色授权ECS访问其他云资源

} } 方式二:直接访问元数据服务器获取 某些场景,如果您没有适配Credentials工具,或需要在脚本中基于实例RAM角色来获取资源临时访问凭证,可直接在实例内部访问元数据服务器获取。说明 通过元数据服务,您无需登录控制台或调用API,在...

LockObj

名称 类型 描述 示例值 object LockObj CatalogId string 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 元数据库名称 database_test PartitionName string 分区名称,非必填 dt TableName string 元数据表名称 ...

Quick BI中元数据库中记录报表使用分析的数据

概述 本文描述Quick BI中元数据库中如何记录报表使用分析的数据。详细信息 报表使用分析的数据记录在表yunbi_report_view_day_stat中,每天凌晨4:30更新数据。适用于 Quick BI

使用星环TDH作为仓计算引擎进行仓初始化

以TDH Inceptor作为仓,或仓初始化中的元数据库配置使用TDH Incepor作为元数据库获取方式时,需要具备以下条件:已在TDH Inceptor中创建dataphin_meta的项目。仓初始化中TDH Inceptor配置的用户,需具备dataphin_meta项目的写入表及...

产品简介

产品功能架构 元数据管理,通过控制台查看和管理数据湖中元数据库和表的信息,通过 新增元数据库 的方式操作元数据,集成到第三方应用服务。并支持多版本管理、可通过元数据发现和入湖任务自动生成元数据。入湖基础操作,通过入湖任务的...

UpdateTablePartitionColumnStatisticsRequest

类型 描述 示例值 object UpdateTableColumnStatistics CatalogId string 数据库分类命名空间,默认填写主账号 Uid 1344371 ColumnStatisticsList array 字段统计信息列表 ColumnStatistics 字段统计 DatabaseName string 元数据库名称 ...

概述

参见 元数据管理 章节,定义数据湖的元数据库和表。控制台概览 控制台概览分为2个部分,左侧为主要功能区,右侧为产品主要信息,帮助用户快速上手产品。注册数据湖位置 阿里云数据湖构建采用OSS作为统一数据湖位置,用户需要注册一个OSS的...

查询授权

本文档主要为您说明如何进行查询已有的数据授权信息。...资源类型:包括元数据表、元数据库、元数据列三种类型。资源名称:指定具体的资源名称,如数据库的库名。数据权限:授权的权限名称,关于权限描述可参考 权限配置。

DeleteDatabase-删除元数据库

Uid 1344371 Name string 否 元数据库名称 database_test Cascade boolean 否 是否级联删除数据 false Async boolean 否 是否异步执行 true Cascade:true:删除 db 下的表,false:不删除 db 下的表,如果 db 还存在表,那么删除失败 返回...

元数据导出

前提条件 已有一个EMR集群,且Metastore服务配置的元数据库与导出的目标RDS库要一致。同步任务会使用EMR集群的Metastore服务,以Spark作业的方式运行在该EMR集群上实现导出。所有元数据的location路径建议都在oss上,如果location的路径为...

元数据迁移

元数据迁移提供可视化的元数据迁移能力,可以帮...验证元数据同步结果 在元数据管理-元数据库中,查询期望同步的数据库信息,可以查询到相应的数据库信息。在元数据管理-元数据表中,查询期望同步的数据表信息,可以查询到相应的数据表信息。

MSHA应用双活架构接入Helloworld

本文通过一个Helloworld示例为您介绍如何接入MSHA应用双活架构并进行功能...测试步骤 主备切换前,杭州单元内的应用:执行数据库读操作(即查询商品详情),应该访问到杭州单元数据库。执行数据库写操作(即下单),应该访问到杭州单元数据...

快速入门

数据湖构建(Data Lake Formation,DLF)产品主要使用流程如下。...创建数据源 创建数据湖的入湖来源,当前支持阿里云RDS MySQL...创建数据湖的元数据 添加元数据库 创建元数据表,指定表中数据的存储位置和存储格式 详细操作请参见 元数据管理。

CatalogSettings

名称 类型 描述 示例值 object 数据湖相关配置 Config object 配置 string 数据湖权限配置,auth.permission.check.enable 表示是否开启元数据服务端鉴权,开启后通过 API 访问元数据将被鉴权,auth.super.principal 表示设置超级用户,超级...

使用Hadoop作为仓计算引擎进行仓初始化

Dataphin元数据仓库(简称:仓),是统一管理Dataphin内部业务元数据和相应计算引擎元数据数据仓库,存在于Dataphin仓租户中(OPS租户)的一个Dataphin项目空间中,由一系列的周期性数据集成节点、SQL脚本节点、Shell节点组成。仓...

V5.2.x系列实例版本说明

V-5.2.8-15738106 日期 2020.04.25 类别 说明 修复问题 修复删操作导致元数据刷新失败的稳定性问题。V5.2.8-15432885 日期 2018.11.27 类别 说明 新增特性 支持2PC分布式事务策略。兼容分布式事务中的INSERT、REPLACE…SELECT语句。优化...

数据探索简介

数据探索是一种线上的交互式查询服务,开通即用。它是完全托管的,并且具备了高性能、弹性、易用等特点,无需申请任何资源即可直接使用。用户可以对入湖后的数据使用Spark SQL快速的进行数据探索,以便对湖内数据进行审核,质量检查,分类...

权限设置

说明 权限关闭后,访问元数据数据将不再进行权限校验,请提前做好业务评估后再关闭权限。关闭权限后影响如下:DLF的元数据管理,数据探索功能将不会再受到权限控制,无论用户是否有数据权限,只要有菜单权限即可访问任意数据。E-...

基于Delta lake的一站式数据湖构建与分析实战

数据湖作为一个集中化的数据存储仓库,支持的数据类型具有多样性,包括结构化、半结构化以及非结构化的数据,数据来源上包含数据库数据、binglog 增量数据、日志数据以及已有数仓上的存量数据等。数据湖能够将这些不同来源、不同格式的数据...

为Spark集群设置元数据

背景信息 因为数据湖元数据DLF具有高可用和易维护的特点,所以以下场景适合使用数据湖元数据:当您的EMR集群均为生产环境时,您无需维护独立的元数据库。横向使用多种大数据计算引擎时,元数据可以集中管理。例如,MaxCompute、Hologres和 ...

创建Impala数据

通过创建Impala数据源能够实现Dataphin读取Impala的业务数据或向Impala写入数据。本文为您介绍如何创建Impala数据源。背景信息 Impala是用于处理存储在Hadoop集群中大量数据的SQL查询引擎。如果您使用的是Impala,在导出Dataphin数据至...

从统一元数据库迁出到用户自建的RDS实例

为了保证更稳定的大规模Hive元数据服务,您可以从原有的统一元数据库迁出到您自建的RDS实例。前提条件 已购买RDS,详情请参见 创建RDS MySQL实例。使用限制 建议选择 MySQL 的5.7版本;系列 选择 高可用版。RDS MySQL实例须与E-MapReduce的...

DataFlow集群通过Hive Catalog连接数据元数据DLF

EMR-3.38.3及后续版本的EMR集群可以使用数据元数据DLF(Data Lake Formation)服务对集群数据进行统一管理,EMR中的Flink组件在开源Flink基础上增加了与DLF适配的功能。本文为您介绍如何在EMR集群上通过Flink SQL创建Hive Catalog连接到...

基于DLF数据入湖的MaxCompute湖仓一体实践

步骤一:创建数据湖的元数据库 登录 数据湖管理控制台,在页面上方选择地域,在 元数据>元数据管理 页面创建元数据库。具体操作请参见 创建元数据库。步骤二:DataWorks数据集成导入数据至OSS 准备入湖数据。登录 RDS管理控制台,选择地域...

API概览

本产品(数据湖构建/2020-07-10)的...GetDatabaseProfile 获取库数据概况 获取库数据概况的详细信息。GetLifecycleRule 获取库表生命周期规则 获取库表生命周期规则。ListPartitionsProfile 获取分区数据概况 获取分区数据概况的详细信息。

E-MapReduce数据迁移方案

Hive元数据同步 概述 Hive元数据,一般存在MySQL里,与一般MySQL同步数据相比,要注意两点:Location变化 Hive版本对齐 E-MapReduce支持Hive Meta DB:统一元数据库,E-MapReduce管控RDS,每个用户一个Schema 用户自建RDS 用户ECS自建MySQL...

GetMetaQueryStatus

取值范围如下:Ready:创建后准备中 元数据索引正在准备中,您无法通过元数据索引查询到数据。Stop:已暂停 Running:运行中 Retrying:创建失败后重试中 Failed:创建失败 Deleted:已删除 父节点:MetaQuery CreateTime 字符串 2021-...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 云数据库 Redis 版 云数据库 MongoDB 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用