Hive统一元数据

EMR-2.4.0及后续版本,E-MapReduce(简称EMR)支持统一的高可靠的Hive元数据库。背景信息 因为元数据库需要使用公网IP来连接,所以集群必须要有公网IP,同时请不要随意的切换公网IP地址,防止对应的数据库白名单失效。如果是本地的元数据库...

配置自建RDS

schematool-initSchema-dbType mysql 待初始化成功后,则可以使用自建的RDS作为Hive的元数据库。说明 在初始化之前,Hive的Hive MetaStore、HiveServer2和Spark的ThriftServer可能会出现异常,待初始化之后会恢复正常。

创建Hudi数据

各同步模式需配置不同参数:hms:Hive元数据库的thrift地址、同步到Hive的数据库名称。重要 如果选择hms,则hive需开启metastore server。jdbc:Hive元数据库的jdbc地址、Hive元数据库的用户名、Hive元数据库的密码、同步到Hive的数据库...

创建Hudi数据

各同步模式需配置不同参数:hms:Hive元数据库的thrift地址、同步到Hive的数据库名称。重要 如果选择hms,则hive需开启metastore server。jdbc:Hive元数据库的jdbc地址、Hive元数据库的用户名、Hive元数据库的密码、同步到Hive的数据库...

元数据导出

RunOptions 运行时参数 参数名称 是否必选 参数说明 schema 必选 hive元数据库的名称。说明 MySQL connectionUrl中的库名要与schema保持一致,修改时要同时修改。batchSize 必选 批量调用 DLF SDK 的批次大小,最大不能超过 500,太大可能...

独立RDS元数据库

数据库名称>为 hive元数据库 名称。数据库用户名 填写hive元数据库中账号的用户名。数据库密码 填写hive元数据库中账号的密码。Metastore初始化 1.连接RDS元数据库,首先需要打通Databricks集群与MySQL实例的VPC和vSwitch网络。详情参见 ...

HDFS数据

类型分类 数据库数据类型 整数类 TINYINT、SMALLINT、INT和BIGINT 浮点类 FLOAT和DOUBLE 字符串类 CHAR、VARCHAR和STRING 布尔类 BOOLEAN 日期时间类 DATE和TIMESTAMP 数据同步任务开发 HDFS数据同步任务的配置入口和通用配置流程指导可...

Dataphin离线管道中Hive输出组件配置后报错“获取...

问题原因 Hive元数据meta的mysql数据库的连接数达到了设置的最大连接数量,导致新的hive连接无法连接到meta,从而报错获取元数据失败。解决方案 将Hive的meta mysql的最大连接数上限调大一些,一般建议设置为1000(通常默认值是200)。...

元数据管理

创建元数据库 登录 数据湖管理控制台,选择 元数据 目录下的 元数据管理。单击 新建数据库。配置元数据库参数。选择所属数据目录。输入元数据库名称。(选填)输入元数据库描述。输入元数据库的位置。创建元数据表 创建完成元数据库后,...

自建Hive数据仓库迁移到阿里云E-MapReduce

可靠性 使用阿里云数据库RDS保存Hive的元数据信息,可以提升数据可靠性和服务可用性,免除客户运维自建MySQL数据库的工作。架构图 方案详情 请参见 阿里云自建Hive数据仓库跨版本迁移到阿里云EMR。icmsDocProps={'productMethod':'created'...

API概览

本产品(数据湖构建/2020-07-10)的...GetDatabaseProfile 获取库数据概况 获取库数据概况的详细信息。GetLifecycleRule 获取库表生命周期规则 获取库表生命周期规则。ListPartitionsProfile 获取分区数据概况 获取分区数据概况的详细信息。

配置E-MapReduce服务使用文件存储 HDFS 版

Hive的元数据存储在MySQL,进入存储Hive元数据的MySQL数据库hivemeta,修改CTLGS表、DBS表和SDS表相应的值。执行 use hivemeta 命令,进入存储Hive元数据的MySQL数据库hivemeta。修改表CTLGS中的数据。执行 select*from CTLGS 命令,查询表...

元数据仓库共享模型概述

提高系统稳定性:如果您直接连接元数据库查询或同步数据,可能会对Dataphin系统的稳定性产生影响,从而影响功能使用。提升输出稳定性:Dataphin的系统元数据库表结构可能会跟随功能升级产生变化,包括表新增下线、字段新增下线等。直接使用...

数据湖构建的审计事件

数据湖构建已与操作审计服务集成,您可以在操作审计中查询用户操作数据湖构建产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中,满足实时审计、问题回溯分析等需求。操作审计记录了用户通过...

Dataphin元数据仓库标准模型文档中表dim_dataphin_...

概述 本文介绍Dataphin元数据仓库标准模型文档中表dim_dataphin_table查看方法。详细信息 物理表每天的增量没法直接看到,只能从元数据上每天计算差值。查看表的存储量需要在元数据仓库中查看表dim_dataphin_table,获取相关信息。此表在...

UpdateDatabase-更新元数据库信息

CatalogId string 否 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseInput DatabaseInput 否 新的元数据库 Name string 否 修改前的元数据库名称,更新前后元数据库相同则仅更新其他 Meta database_test 返回参数 名称 类型 ...

Hive数据迁移

表黑名单,格式为db.table 不需要迁移的Hive数据库表。单个表的格式为 dbname.tablename,多个表之间以英⽂逗号分隔。表白名单,格式为db.table 需要迁移的Hive数据库表。单个表的格式为 dbname.tablename,多个表之间以英⽂逗号分隔。单击...

使用数据探索查询Iceberg表

本文为您介绍如何使用DLF数据探索查询Iceberg表。目前DLF数据探索可以直接支持Delta、Hudi、CSV、Parquet、JSON、ORC等格式的表;受限于Spark和Iceberg的底层设计,在DLF数据探索中查询Iceberg表需要指定特定的Catalog。准备工作 已开通DLF...

CreateDatabase-新增元数据库

数据湖元数据中创建一个新的元数据库。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的...

概述

参见 元数据管理 章节,定义数据湖的元数据库和表。控制台概览 控制台概览分为2个部分,左侧为主要功能区,右侧为产品主要信息,帮助用户快速上手产品。注册数据湖位置 阿里云数据湖构建采用OSS作为统一数据湖位置,用户需要注册一个OSS的...

DeleteFunction-删除元数据库的函数

根据名称删除数据元数据库的用户自定义函数。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略...

CreateFunction-新增元数据库的函数

新增数据元数据库的用户自定义函数。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 ...

UpdateFunction-更新元数据库的函数

根据名称,更新数据元数据库的用户自定义函数信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM...

使用E-Mapreduce访问

Hive的元数据存储在MySQL中,进入存储Hive元数据的MySQL数据库hivemeta中,修改DBS表和SDS表,如下所示。MariaDB[(none)]>use hivemeta;修改表“DBS”MariaDB[hivemeta]>select*from DBS;DB_ID|DESC|DB_LOCATION_URI|NAME|OWNER_NAME|OWNER...

RenamePartition-更新元数据表分区名

均采用 JSON 格式 CatalogId string 否 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 否 元数据库名称 database_test PartitionInput PartitionInput 否 更新后的分区信息,和 CreatePartition 相同 ...

BatchCreateTables-批量新增元数据

均采用 JSON 格式 CatalogId string 否 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 否 元数据库名称 database_test IfNotExists boolean 否 如果相同名字的表已经存在,是否忽略异常 true TableInputs array 否 ...

RenameTable-更新元数据表的名称

JSON 格式 CatalogId string 否 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 否 元数据库名称 database_test TableInput TableInput 否 元数据表对象,注意仅需填写 TableName 即可 TableName string 否 元数据表...

UpdateTable-更新元数据表信息

CatalogId string 否 数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 否 元数据库名称 database_test SkipArchive boolean 否 默认情况下,更新元数据表会创建一个新的归档版本,但如果 skipArchive 设置 true 则...

ListPartitionNames-获取元数据表分区名称列表

数据库分类命名空间,默认填写主账号 Uid 1344371 DatabaseName string 否 元数据库名称 database_test NextPageToken string 否 翻页 token,从返回结果返回,无则传空字符串或'' 2cb472ec1bf84f8d92f9c4baa0d21c19aa PageSize integer 否...

ListFunctionNames-获取元数据库的函数名称列表

分页查询,获取元数据库的函数名称列表。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的...

存储概览

数据湖构建DLF后续还将推出生命周期管理功能,帮助您对湖内数据进行自动归档。目前功能开发中。存储格式分布 统计表的存储格式分布情况。大小文件分布和排名 统计大小文件分布及排名情况,根据业务情况,针对小文件较多的表进行优化,提高...

GetFunction-获取元数据库的指定函数

根据函数名称,获取数据元数据库的用户自定义函数。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM...

配置CDH6使用文件存储 HDFS 版

命令,进入存储Hive元数据的MySQL数据库。修改表DBS中的数据。执行 SELECT*FROM DBS LIMIT 5;命令,查询表DBS中的数据。返回结果示例如下:+-+-+-+-+-+-+-+|DB_ID|DESC|DB_LOCATION_URI|NAME|OWNER_NAME|OWNER_TYPE|CREATE_TIME|+-+-+-+-+-...

ListFunctions-获取元数据库的函数列表

批量获取数据元数据库的用户自定义函数列表。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略...

元数据库数据字典

PolarDB-X 的元数据库为information_schema库,兼容MySQL的元数据库。查询元数据库可以直接在JDBC连接中使用SQL语句进行查询。Information_schema视图 兼容情况 SCHEMATA 兼容 TABLES 兼容 COLUMNS 兼容 STATISTICS 兼容 COLUMN_STATISTICS...

入湖基础操作

关系数据库实时入湖:可以实现RDS MySQL或PolarDB数据库数据增量同步到数据湖,选择在数据源管理中配置好的数据源,将数据源对应数据库中选定表的数据抽取binlog的方式将数据库数据实时同步回放到数据湖中。待同步的数据表需确认包含...

元数据库数据字典

云原生数据仓库MySQL版的元数据库分为记载性能相关信息的performance_schema库和记载元数据的information_schema库,并和MySQL的元数据库有一定的兼容性,但并不是100%一致。查询元数据库可以直接在JDBC连接中使用SQL语句进行查询。查询云...

CDH6与文件引擎集成

三、安装HIVE服务 安装MySQL数据库,并创建用来存储hive元数据信息的数据库。登入CDH6任意的一台机器,执行如下指令,进行安装。切换到 root sudo su-#下载 MySQL的rpm 源 root@cdhlindorm001~/tool$wget ...

查看集群日报与分析

Hive库冷热数据分布Top信息会展示如下:极冷数据量分布Top 数据量分布Top 库温数据量分布Top 库热数据量分布Top 说明 冷数据是长时间不访问的数据,推荐放到冷备存储,例如OSS冷备等。冷热数据分布可以帮助您了解集群使用情况,有...

在DMS中自定义屏蔽系统

背景信息 在实例录入 DMS 后,系统将自动采集实例中数据库元数据(字典)信息。为保护系统,同时减少系统对您的干扰,可自定义屏蔽 DMS 部分系统(如MySQL的information_schema)或高敏感业务的数据库。屏蔽后,DMS 将不会采集...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 云数据库 Redis 版 云数据库 MongoDB 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用