PDF-Word-Count-Ver-3
简短的介绍:
旨在搜索目录及其子目录以查找 PDF 文档的应用程序。 然后,该应用程序会计算每个文档中的单词数、句子数以及在每个 PDF 文档中找到给定词典中的每个单词的次数。 然后将结果保存在 results.xls 文件中
使用的库
Apache PDFBox 处理 PDF 文档 (pdfbox-1.8.7.jar)
Apache POI对excel文件进行操作(poi-3.10.1-20140818.jar)
斯坦福 CoreNLP 分析 PDF 文档中的文本 (stanford-corenlp-3.5.0.jar)
JDK版本
运行该应用程序所需的版本为 1.8 或更高
其他依赖
fontbox-1.8.7
commons-logging-1.2
评论0
最新资源