Apache Jackrabbit Oak 1.7.0 发布,内容资源库
Oak 是一个可伸缩、高性能分层次的内容资源库。这是 Jackrabbit 的子项目之一。 Apache Jackrabbit Oak 1.7.0 是来自 Jackrabbit Oak 分支中不稳定的版本,专注于新功能和其他改进。对于生产环境使用,建议采用最新稳定的 1.6.x 版本。该版本部分更新...
Apache Tika 1.15 发布 ,内容抽取工具集合
Apache Tika 1.15 发布了,该版本包含许多改进和错误修复。新发布的版本已推送到 Apache 发布网站以及 Maven Central。 Tika 是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了 POI 和 Pdfbox,并且为文本抽取...
Apache Tika-内容解析提取工具集合(a content analysis toolkit)
简介 Apache Tika toolkit可以自动检测各种文档(如word,ppt,xml,csv,ppt等)的类型并抽取文档的元数据和文本内容。Tika集成了现有的文档解析库,并提供统一的接口,使针对不同类型的文档进行解析变得更简单。...
Apache Tika:通用的内容分析工具
项目介绍 Tika是一个内容分析工具,自带全面的parser工具类,能解析基本所有常见格式的文件,得到文件的metadata,content等内容,返回格式化信息。总的来说可以作为一个通用的解析工具。特别对于搜索引擎的数据抓去和处理步骤有重要意义。 Tika是一个目的明确,使用简单的apache的开...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
社区圈子