数据库名称>:步骤一:元数据库准备 中设置的数据库名称。javax.jdo.option.ConnectionUserName RDS用户名 填写 步骤一:元数据库准备 中账号的用户名。javax.jdo.option.ConnectionPassword RDS密码 填写 步骤一:元数据库准备 中账号的...
以TDH Inceptor作为元仓,或元仓初始化中的元数据库配置使用TDH Incepor作为元数据库获取方式时,需要具备以下条件:已在TDH Inceptor中创建dataphin_meta的项目。元仓初始化中TDH Inceptor配置的用户,需具备dataphin_meta项目的写入表及...
阿里云Cloudera CDP默认支持集群中组件HDFS NameNode、YARN ResourceManager以及Hive Metastore Server的高可用,此外对于Hive、Hue等组件用于存储元数据的元数据库MariaDB也做了主从备份,能最大限度保证服务的可用性和数据的可恢复性。...
在新建元数据库对话框,配置元数据库参数。单击确定,完成元数据库创建。新建大数据集群,已有数据存在在OSS中,但没有元数据信息。可以使用 元数据抽取 来识别OSS上数据的元数据信息,并存储在DLF中。步骤三:初始化数据 初始化数据一般...
元数据迁移提供可视化的元数据迁移能力,可以帮...验证元数据同步结果 在元数据管理-元数据库中,查询期望同步的数据库信息,可以查询到相应的数据库信息。在元数据管理-元数据表中,查询期望同步的数据表信息,可以查询到相应的数据表信息。
数据湖元数据是服务化高可用并且可扩展的元数据库,您无需额外购买独立的元数据库,就可以实现多个引擎计算,例如同时使用Databricks 数据洞察和E-MapReduce。多个Databricks 数据洞察集群可以共享统一元数据库。前提条件 已在 数据湖构建...
准备工作 已开通DLF,并创建了 元数据库。通过 元数据发现/入湖任务管理 或者API等方式创建了Iceberg元数据表。操作步骤 登录 数据湖构建控制台,在左侧菜单中选择 数据探索。在SQL输入框中,输入查询语句。针对Iceberg表,需要在指定的...
数据湖权限支持配置数据库、数据表、数据列、函数四种维度细粒度权限。下面针对不同的数据操作,对所需要配置的权限进行说明,并对Owner权限的定义和权限鉴定方式进行详细说明。权限设置 权限设置主要为数据目录(Catalog)开启和关闭权限...
名称 类型 描述 示例值 object LockObj CatalogId string 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 元数据库名称 database_test PartitionName string 分区名称,非必填 dt TableName string 元数据表名称 ...
可支持对元数据库、元数据表、元数据列三种粒度的权限。数据探索,为您提供一键式数据探索能力,可支持Spark 3.0 SQL语法,可以保存历史查询,预览数据,导出结果,一键生产tpc-ds测试数据集。湖管理,将为您提供对湖内数据存储的分析及...
查看运行记录和日志 单击右侧操作“运行记录”,可以查看运行的详情信息 单击查看日志,可以查看运行中的日志信息,如下 确认元数据迁移到DLF 在元数据管理-元数据库/元数据表中,可以查询到期望同步的元数据库表信息。如下 EMR集群 切换...
详情如下:元数据库方式获取 参数 描述 数据库类型 选择Hive的元数据库类型。Dataphin支持选择 MySQL。支持MySQL数据库的版本包括 MySQL 5.1.43、MYSQL 5.6/5.7 和 MySQL 8 版本。JDBC URL 填写目标数据库JDBC的连接地址。例如:MySQL数据...
比如,定义的前缀为“abc_”,那么来源库名在数据湖中的元数据库就会自动加上此前缀,如"abc_my_db",“abc_test_table”等等,此时体现在OSS路径就会是“oss:/zhangsan/my_folder/abc_my_db/abc_test_table”。分区信息 设置数据入湖存储时...
参见 元数据管理 章节,定义数据湖的元数据库和表。控制台概览 控制台概览分为2个部分,左侧为主要功能区,右侧为产品主要信息,帮助用户快速上手产品。注册数据湖位置 阿里云数据湖构建采用OSS作为统一数据湖位置,用户需要注册一个OSS的...
在 元数据库 页签中,可以查询到期望同步的元数据库表信息。EMR集群切换元数据 引擎切换元数据 Hive 在Hive服务的 hive-site.xml 中添加如下配置,开启 自动配置更新 并保存,然后重启Hive服务。配置DLF元数据服务地址,Region替换为集群...
类型 描述 示例值 object UpdateTableColumnStatistics CatalogId string 数据库分类命名空间,默认填写主账号 Uid 1344371 ColumnStatisticsList array 字段统计信息列表 ColumnStatistics 字段统计 DatabaseName string 元数据库名称 ...
在 表管理 页面的中间区域,单击已创建的元数据库。单击右上角的 新建表。在 新建表 对话框中,配置各项参数。配置项 操作 表名 表名称。字段分隔符 从 字段分隔符 中选择分隔符或者自定义。外部表 默认不选中。需要创建外部表时,执行以下...
本文档主要为您说明如何进行查询已有的数据授权信息。...资源类型:包括元数据表、元数据库、元数据列三种类型。资源名称:指定具体的资源名称,如数据库的库名。数据权限:授权的权限名称,关于权限描述可参考 权限配置。
名称 类型 描述 示例值 object Partition CreateTime integer 创建时间,Unix 时间戳秒数 1608730999 DatabaseName string 元数据库名称 database_test LastAccessTime integer 上一次访问分区的时间 1608730999 LastAnalyzedTime integer ...
前提条件 已有一个EMR集群,且Metastore服务配置的元数据库与导出的目标RDS库要一致。同步任务会使用EMR集群的Metastore服务,以Spark作业的方式运行在该EMR集群上实现导出。所有元数据的location路径建议都在oss上,如果location的路径为...
名称 类型 描述 示例值 object Partition DatabaseName string 元数据库名称 database_test LastAccessTime integer 上一次访问分区的时间,Unix 时间戳秒数 1608730999 LastAnalyzedTime integer 上一次执行统计运算的时间,Unix 时间戳秒...
数据库类型:根据集群中使用的元数据库类型,选择数据库类型。支持选择 MySQL、PostgreSQL、Inceptor。版本:数据库类型为 MySQL,需选择对应版本。支持 MySQL5.1.43、MySQL5.6/5.7 和 MySQL8.0 版本。JDBC URL:填写对应元数据库的链接...
各同步模式需配置不同参数:hms:Hive元数据库的thrift地址、同步到Hive的数据库名称。重要 如果选择hms,则hive需开启metastore server。jdbc:Hive元数据库的jdbc地址、Hive元数据库的用户名、Hive元数据库的密码、同步到Hive的数据库...
各同步模式需配置不同参数:hms:Hive元数据库的thrift地址、同步到Hive的数据库名称。重要 如果选择hms,则hive需开启metastore server。jdbc:Hive元数据库的jdbc地址、Hive元数据库的用户名、Hive元数据库的密码、同步到Hive的数据库...
数据库类型 根据集群中使用的元数据库类型,选择数据库类型。支持选择 ArgoDB。JDBC URL 填写 ArgoDB 元数据库的链接地址。格式为:jdbc:hive2:/hsot:port/dbname。认证方式 支持3种认证方式,无认证、LDAP、Kerberos。Kerberos认证方式还...
前提条件 若以TDH Inceptor作为元仓,或元仓初始化中的元数据库配置使用TDH Incepor作为元数据库获取方式时,需要具备以下条件:已在TDH Inceptor中创建dataphin_meta的项目。元仓初始化中TDH Inceptor配置的用户,需具备dataphin_meta项目...
数据湖构建(Data Lake Formation,DLF)产品主要使用流程如下。...创建数据源 创建数据湖的入湖来源,当前支持阿里云RDS MySQL...创建数据湖的元数据 添加元数据库 创建元数据表,指定表中数据的存储位置和存储格式 详细操作请参见 元数据管理。
CatalogId string 数据库分类命名空间,默认填写主账号 Uid 1344371 ClassName string 包含了函数实现的 Java 类名 com.xxx.xxxxFunction CreateTime integer 创建时间,Unix 时间戳秒数 1608863962 DatabaseName string 元数据库名称 ...
元数据库获取方式 参数 说明 数据库类型 请根据集群中使用的元数据库类型,选择对应的数据库类型。Dataphin支持选择 MySQL。MySQL 数据库类型支持 MySQL 5.1.43、MYSQL 5.6/5.7 和 MySQL 8 版本。JDBC URL 填写目标数据库的JDBC连接地址。...
数据库类型 选择ArgoDB的元数据库类型。系统目前支持ArgoDB。JDBC URL 填写对应元数据库的连接地址,格式为 jdbc:postgresql:/<host>:<port>/<database name>。用户名、密码 填写登录元数据库的用户名和密码。说明 为保证任务正常执行,请...
均采用 JSON 格式 CatalogId string 否 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 否 元数据库名称 database_test PartitionInput PartitionInput 否 更新后的分区信息,和 CreatePartition 相同 ...
参数 描述 数据库类型 请根据集群中使用的元数据库类型,选择数据库类型。Dataphin支持选择MySQL和PostgreSQL。JDBC URL 填写对应元数据库的链接地址:MySQL:格式为 jdbc:mysql:/host[,failoverhost.]port/dbname?propertyName1][=...
JSON 格式 CatalogId string 否 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 否 元数据库名称 database_test TableInput TableInput 否 元数据表对象,注意仅需填写 TableName 即可 TableName string 否 元数据表...
已开通DLF,并创建了 元数据库。通过 元数据发现/入湖任务管理 或者API等方式创建了元数据表。运行查询 登录 数据湖构建控制台,在左侧菜单中选择 数据探索。左侧数据库/表区域,会列举出当前账户下所有元数据库和元数据表。您可以在此区域...
参见 数据湖元数据管理 统一meta数据库:表示元数据存储在集群本地环境的MySQL数据库中 独立RDS MySQL:表示使用自建的阿里云RDS作为元数据库,更多信息请参见 共享独立RDS元数据库 设置高级信息。高级信息包括如下两方面:Spark设置 参数 ...
元数据库名称前缀:元数据库是根据来源库名自动建立,但是可以手工指定元数据库的名称前缀。指定的前缀,将会应用到所有库中。数据湖格式:选择 Hudi。分区信息 设置数据入湖存储时的分区,后续入湖同步写入数据时,根据来源端数据的写入...
均采用 JSON 格式 CatalogId string 否 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 否 元数据库名称 database_test IfNotExists boolean 否 如果相同名字的表已经存在,是否忽略异常 true TableInputs array 否 ...
第三步:在DLF上抽取元数据 3.1 创建元数据表 DLF中元数据库可以理解为在关系型数据库中的Database,其下一级为Table。a.在 DLF控制台 中,进入元数据库页面,创建元数据库。b.填入数据库名称。并选择刚才存有用户行为分析的 如下图所示,...
CatalogId string 否 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 否 元数据库名称 database_test SkipArchive boolean 否 默认情况下,更新元数据表会创建一个新的归档版本,但如果 skipArchive 设置 true 则...
元数据库方式 数据库类型:仅支持MySQL数据库类型,支持的版本包括 MySQL5.1.43、MySQL5.6/5.7、MySQL8。JDBC URL:填写元数据库的JDBC URL地址。连接格式 jdbc:mysql:/host:port/dbname。用户名、密码:填写访问元数据库的用户名和密码。...