Apache Jackrabbit Oak 1.7.0 发布,内容资源库

Oak 是一个可伸缩、高性能分层次的内容资源库。这是 Jackrabbit 的子项目之一。 Apache Jackrabbit Oak 1.7.0 是来自 Jackrabbit Oak 分支中不稳定的版本,专注于新功能和其他改进。对于生产环境使用,建议采用最新稳定的 1.6.x 版本。该版本部分更新...

Apache Tika 1.15 发布 ,内容抽取工具集合

Apache Tika 1.15 发布了,该版本包含许多改进和错误修复。新发布的版本已推送到 Apache 发布网站以及 Maven Central。 Tika 是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了 POI 和 Pdfbox,并且为文本抽取...

Apache RocketMQ:如何从互联网时代演进到云

1 课时 |
154 人已学 |
免费

Apache Flink 入门到实战 - Flink开源社区出品

16 课时 |
1392 人已学 |
免费

Apache Flink 入门

9 课时 |
4826 人已学 |
免费
开发者课程背景图

Apache Tika-内容解析提取工具集合(a content analysis toolkit)

简介       Apache Tika toolkit可以自动检测各种文档(如word,ppt,xml,csv,ppt等)的类型并抽取文档的元数据和文本内容。Tika集成了现有的文档解析库,并提供统一的接口,使针对不同类型的文档进行解析变得更简单。...

Apache Tika:通用的内容分析工具

项目介绍 Tika是一个内容分析工具,自带全面的parser工具类,能解析基本所有常见格式的文件,得到文件的metadata,content等内容,返回格式化信息。总的来说可以作为一个通用的解析工具。特别对于搜索引擎的数据抓去和处理步骤有重要意义。 Tika是一个目的明确,使用简单的apache的开...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

Apache Spark 中国技术社区
Apache Spark 中国技术社区
阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!
4459+人已加入
加入
相关电子书
更多
Apache Doris 精选用户案例集
Apache RocketMQ 云原生统一消息引擎
Apache Tomcat 的云原生演进
立即下载 立即下载 立即下载
相关镜像