请问下,flink批,怎么读hadoop中的lzo压缩文件,包含索引读取

请问下,flink批,怎么读hadoop中的lzo压缩文件,包含索引读取

Hadoop 压缩文件方式比较

 对于Hadoop文件常用的几种压缩方法,我写了一个java程序进行比较。 期望是,给出一个大文件(bigfile.txt) ,我们用各种方式压缩他们然后最终复制到HDFS中。 代码很简单:就是构造codec的实例,然后让它来创建到HDFS的输出流 /*    ...

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第一阶段

33 课时 |
283 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第二阶段

28 课时 |
248 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第三阶段

25 课时 |
92 人已学 |
免费
开发者课程背景图

hadoop mapreduce开发实践之HDFS压缩文件(-cacheArchive)

1、分发HDFS压缩文件(-cacheArchive) 需求:wordcount(只统计指定的单词【the,and,had...】),但是该文件存储在HDFS上的压缩文件,压缩文件内可能有多个文件,通过-cacheArchive的方式进行分发; -cacheArchive hdfs://host:p...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

大数据
大数据
大数据计算实践乐园,近距离学习前沿技术
188891+人已加入
加入
相关电子书
更多
Why is my Hadoop* job slow
Hadoop存储与计算分离实践
\"Hadoop的过去现在和未来——从阿里云梯到E-MapReduce \"
立即下载 立即下载 立即下载
相关实验场景
更多