[帮助文档] Hive使用JindoSDK处理OSS-HDFS服务中的数据

使用Hive搭建离线数仓时,随着数据量的不断增长,传统的基于HDFS存储的数仓可能无法以较低成本满足用户的需求。在这种情况下,您可以使用OSS-HDFS服务作为Hive数仓的底层存储,并通过JindoSDK获得更好的读写性能。

flink cdc写hdfs文件的时候,如果开启文件合并的话,最终的文件不能通过hive映射读取吗?

flink cdc写hdfs文件的时候,文件格式设置为parquet,压缩方式为GZIP,存在一个问题,如果开启文件合并的话,最终的文件不能通过hive映射读取,如果不开启的话,可以正常读取,这个怎么解决啊?

Hadoop 分布式文件系统 HDFS

43 课时 |
945 人已学 |
免费
开发者课程背景图

[帮助文档] AnalyticDB PostgreSQL读写HDFS、Hive或MySQL外部数据

若您需要通过AnalyticDB PostgreSQL版访问外部异构数据源(HDFS、Hive和JDBC)时,可以使用异构数据源访问功能将外部数据转换为AnalyticDB PostgreSQL版数据库优化后的格式进行查询和分析。

[帮助文档] 使用JindoTableMoveTo命令将Hive表和分区数据迁移至OSS-HDFS服务

本文介绍如何使用JindoTable MoveTo命令将Hive表和分区数据迁移至OSS-HDFS服务。

[帮助文档] Hive如何以EMR集群的方式处理OSS-HDFS服务中的数据

本文介绍Hive如何以EMR集群的方式处理OSS-HDFS服务中的数据。

Flink CDC中那位老师遇到以下写法,数据可以正常写到hdfs, 但是表和库在hive看不到,?

Flink CDC中那位老师遇到以下写法,数据可以正常写到hdfs, 但是表和库在hive看不到,是由于HadoopCatalog类型 元数据没有托管到元数据服务的原因吗?:// 通过catalog判断表是否存在,不存在就创建,存在就加载 Table table = catalog.tableExi...

大佬们 flink cdc适合做pgsql增量同步到hdfs/hive吗? 感觉几乎找不到下沉到ha

大佬们 flink cdc适合做pgsql增量同步到hdfs/hive吗? 感觉几乎找不到下沉到hadoop的资料,大佬们有成功的例子分享一下吗?

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
海量数据分布式存储——Apache HDFS之最新进展
立即下载