检测并提取来自上千种不同文件类型(如PPT,XLS和PDF)中的元数据和结构化文本。除了用gui进行操作外,还可以在命令行界面中使用java -jar tika-app-1.15.jar --text .doc命令进行文本格式的转换,text为要转变的格式,.doc为你想要转变的文本的物理位置。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~