数据库(Database)是表、索引、视图、存储过程、操作符的集合。...它会移除该数据库的元数据并且删除该数据库在磁盘上的目录及其中包含的数据,命令如下:DROP DATABASE说明:<dbname>:待删除的数据库名称。示例:DROP DATABASE mygpdb;
元数据库 Cloudera Manager、Hive和Hue等组件都需要使用数据库存储他们的元数据信息,目前元数据库部署在Utility节点和Master-1节点上,采用主备的架构,Utility节点上的元数据库作为Master,Master-1节点上的元数据库作为Slave去复制...
数据管理DMS 中管控模式为安全协同模式的实例,在采集元数据时会默认屏蔽实例的系统库。本文列举不同数据库类型默认屏蔽的实例系统库。背景信息 数据管理DMS中录入实例后,系统将自动采集实例中数据库的元数据(字典)信息。为了保护系统库...
通过创建Hive数据源能够实现Dataphin读取Hive的业务数据或向Hive写入数据。本文为您介绍如何创建Hive数据源。背景信息 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供SQL查询功能。Hive用于转化...
元数据库配置 元数据获取方式 支持元数据库和HMS(Hive Metastore Serivce)方式获取元数据。使用HMS方式获取元数据库,若集群配置认证方式为Kerberos,需上传Keytab File文件和填写Principal。Keytab File:Hive metastore的Kerberos认证...
创建Hive Catalog 完成前面的Hive元数据配置后,您可以创建Hive Catalog,支持UI与SQL命令两种方式配置Hive Catalog,推荐使用UI方式配置Hive Catalog。UI方式 进入元数据管理页面。登录 实时计算控制台,单击目标工作空间 操作 列下的 ...
在 元数据库 页签中,可以查询到期望同步的元数据库表信息。EMR集群切换元数据 引擎切换元数据 Hive 在Hive服务的 hive-site.xml 中添加如下配置,开启 自动配置更新 并保存,然后重启Hive服务。配置DLF元数据服务地址,Region替换为集群...
元数据库获取方式 参数 描述 数据库类型 根据集群中使用的元数据库类型,选择数据库。Dataphin支持选择 MySQL。支持 MySQL 的版本包括 MySQL 5.1.43、MYSQL 5.6/5.7 和 MySQL 8 版本。JDBC URL 填写目标数据库的JDBC连接地址。例如:MySQL...
详情如下:元数据库方式获取 参数 描述 数据库类型 选择Hive的元数据库类型。Dataphin支持选择 MySQL。支持MySQL数据库的版本包括 MySQL 5.1.43、MYSQL 5.6/5.7 和 MySQL 8 版本。JDBC URL 填写目标数据库JDBC的连接地址。例如:MySQL数据...
本文为您介绍Hive元数据的基本操作,包括新建库、删除库、新建表和删除表。前提条件 已创建集群,详情请参见 创建集群。新建库 进入元数据管理页面。登录 阿里云E-MapReduce控制台。在顶部菜单栏处,根据实际情况选择地域 和资源组。单击...
EMR-3.38.3及后续版本的EMR集群可以使用数据湖元数据DLF(Data Lake Formation)服务对集群数据进行统一管理,EMR中的Flink组件在开源Flink基础上增加了与DLF适配的功能。本文为您介绍如何在EMR集群上通过Flink SQL创建Hive Catalog连接到...
元数据迁移提供可视化的元数据迁移能力,可以帮您快速的将Hive Metastore的元数据迁移到数据湖构建(DLF)中。前提条件 支持Hive版本:2.3.x 版本。支持元数据库类型:MySQL。创建元数据迁移任务 创建迁移任务 打开 数据湖构建控制台。选择...
前提条件 若以TDH Inceptor作为元仓,或元仓初始化中的元数据库配置使用TDH Incepor作为元数据库获取方式时,需要具备以下条件:已在TDH Inceptor中创建dataphin_meta的项目。元仓初始化中TDH Inceptor配置的用户,需具备dataphin_meta项目...
第三步:在DLF上抽取元数据 3.1 创建元数据表 DLF中元数据库可以理解为在关系型数据库中的Database,其下一级为Table。a.在 DLF控制台 中,进入元数据库页面,创建元数据库。b.填入数据库名称。并选择刚才存有用户行为分析的 如下图所示,...
背景信息 因为数据湖元数据DLF具有高可用和易维护的特点,所以以下场景适合使用数据湖元数据:当您的EMR集群均为生产环境时,您无需维护独立的元数据库。横向使用多种大数据计算引擎时,元数据可以集中管理。例如,MaxCompute、Hologres和 ...
问题描述 Bucket元数据索引库未构建完成。问题原因 您发起了DoMetaQuery或GetMetaQueryStatus请求,但是请求的目标Bucket元数据索引库未构建完成。问题示例 例如,你发起了DoMetaQuery请求,但是请求的Bucket(oss-example)元数据索引库未...
hivemetastore-site.xml hive.metastore.event.listeners 监听Hive元数据变更的事件信息,用于数据血缘。开启EMR-HOOK时,参数值填写为 com.aliyun.emr.meta.hive.listener.MetaStoreListener关闭EMR-HOOK时,参数值置为空。hive....
通过创新建ArgoDB数据源能够实现Dataphin读取ArgoDB的业务数据或向ArgoDB写入数据。本文为您介绍如何新建ArgoDB数据源。权限说明 Dataphin仅支持 超级管理员、数据源管理员、板块架构师、项目管理员 角色创建数据源。操作步骤 在Dataphin...
开启元数据管理功能后,OSS会为Bucket创建元数据索引库并为Bucket中的所有文件(Object)建立元数据索引。元数据索引库创建完成后,OSS会继续对Bucket中新增文件进行准实时的增量追踪扫描并为增量文件建立元数据索引。注意事项 权限说明 ...
数据湖元数据是服务化高可用并且可扩展的元数据库,您无需额外购买独立的元数据库,就可以实现多个引擎计算,例如同时使用Databricks 数据洞察和E-MapReduce。多个Databricks 数据洞察集群可以共享统一元数据库。前提条件 已在 数据湖构建...
Impala为存储在Apache Hadoop中的数据,提供了高性能和低延迟的SQL查询。使用Impala,您可以通过SELECT、JOIN和聚合函数实时查询存储在HDFS或HBase中的数据。背景信息 Impala使用与Apache Hive相同的元数据、SQL语法(Hive SQL)和ODBC驱动...
为了保证更稳定的大规模Hive元数据服务,您可以从原有的统一元数据库迁出到您自建的RDS实例。前提条件 已购买RDS,详情请参见 创建RDS MySQL实例。使用限制 建议选择 MySQL 的5.7版本;系列 选择 高可用版。RDS MySQL实例须与E-MapReduce的...
前提条件 请确保您的网络连通性:您通过公网连接Quick BI与Hive数据库,请添加 Quick BI的IP地址 至数据库白名单,请参见 添加安全组规则。您通过内网连接Quick BI与Hive数据库,请搭建跳板机,并通过SSH隧道访问登录并访问数据库。已创建...
关闭元数据管理功能后,OSS会自动删除Bucket的元数据索引库,您将无法进行元数据索引。注意事项 要关闭Bucket的元数据管理功能,您必须有 oss:CloseMetaQuery 权限。具体操作,请参见 为RAM用户授权自定义的权限策略。无论Bucket是否已开启...
问题描述 Bucket不存在元数据索引库。问题原因 您发起了DoMetaQuery或GetMetaQueryStatus请求,但是请求的目标Bucket没有开启元数据管理功能。问题示例 例如,你发起了DoMetaQuery请求,但是请求的Bucket(oss-example)未开启元数据管理...
独立部署版本:私有云独立部署,Dataphin输出PostgreSQL数据库作为元数据库。元数据库采用一主一备或一主两备模式,保障元数据库稳定性;每天进行元数据库全量冷备,保留七天,过期自动删除。公有云独立部署,Dataphin元数据库采用阿里云上...
如果您希望从Bucket存储的海量Object中快速查找与指定的Object名称、ETag、存储类型、大小、最后修改时间等条件匹配的Object,您可以使用数据索引功能。通过数据索引功能,您可以在查找目标Object时指定过滤条件,对查询结果按需选择排序和...
名称 类型 描述 示例值 object 数据库对象 Description string 元数据库描述文本 this is a hive database LocationUri string 元数据库保存路径,例如可填写 HDFS 路径/hdfs/hivedb/data Name string 元数据库名称,校验长度 128,不支持...
产品功能架构 元数据管理,通过控制台查看和管理数据湖中元数据库和表的信息,通过 新增元数据库 的方式操作元数据,集成到第三方应用服务。并支持多版本管理、可通过元数据发现和入湖任务自动生成元数据。入湖基础操作,通过入湖任务的...
元数据库获取方式 参数 说明 数据库类型 请根据集群中使用的元数据库类型,选择对应的数据库类型。Dataphin支持选择 MySQL。MySQL 数据库类型支持 MySQL 5.1.43、MYSQL 5.6/5.7 和 MySQL 8 版本。JDBC URL 填写目标数据库的JDBC连接地址。...
Hive是一个基于Hadoop的数据仓库框架,在大数据业务场景中,主要用来进行数据提取、转化和加载(ETL)以及元数据管理。背景信息 E-MapReduce(简称EMR)版本中,Hadoop、Hive版本和EMR集群的配套情况,请参见 版本概述。Hive结构 名称 说明...
步骤一:创建数据湖的元数据库 登录 数据湖管理控制台,在页面上方选择地域,在 元数据>元数据管理 页面创建元数据库。具体操作请参见 创建元数据库。步骤二:DataWorks数据集成导入数据至OSS 准备入湖数据。登录 RDS管理控制台,选择地域...
UseLocalMetaDb Boolean 否 true 是否使用集群内置MySQL作为Hive元数据库。取值如下:true:使用本地Hive元数据库。false:不本地Hive元数据库。集群内置MySQL单节点,无法保证高可靠。MasterPwd String 否 pwd Master节点root密码。需要...
如果您希望从Bucket存储的海量Object中快速查找与指定的Object名称、ETag、存储类型、大小、最后修改时间等条件匹配的Object,您可以使用数据索引功能。通过数据索引功能,您可以在查找目标Object时指定过滤条件,对查询结果按需选择排序和...
名称 类型 描述 示例值 object 数据库对象 CreateTime integer 创建时间,Unix 时间戳秒数 1608707407 Description string 元数据库描述文本 this is a hive database LocationUri string 元数据库保存路径,例如 HDFS 路径/hdfs/hivedb/...
本方案支持已有EMR集群元数据库使用RDS或内置MySQL数据库迁移DLF,通过统一的元数据管理,多种数据源入湖,搭建高效的数据湖解决方案。本文主要介绍如何将Hive Metasstore存储在MySQL/RDS中的元数据迁移到DLF中,并介绍如何在EMR集群中配置...
如果您希望从Bucket存储的海量Object中快速查找与指定的Object名称、ETag、存储类型、大小、最后修改时间等条件匹配的Object,您可以使用数据索引功能。通过数据索引功能,您可以在查找目标Object时指定过滤条件,对查询结果按需选择排序和...
元数据指的是那些可以用来描述数据属性的信息数据,通过数据同步服务元数据管理功能,您可以连通数据源中的库表元数据信息,包括库名、表名、表字段等信息。可以通过元数据管理中的 绑定逻辑表 功能,将多张 schema 一致的物理表绑定成一张...
背景信息 阿里云数据湖构建是一款全托管的快速帮助用户构建云上数据湖的服务,产品为云原生数据湖提供了统一的元数据管理、统一的权限与安全管理、便捷的数据入湖能力以及一键式数据探索能力,详细信息请参见 数据湖构建产品简介。...
数据库黑名单 不需要迁移的Hive数据库,多个值之间以英⽂逗号分隔。Metastore访问并发量 访问Hive MetaStore的并发量,⽤于提⾼获取Hive元数据的速度。表黑名单 不需要迁移的Hive数据库表。单个表的格式为 dbname.tablename,多个表之间以英...