PHP+XPDF工具读取文件夹下PDF 并将内容写入文本
主要是尝试一下发资源 开发中摘了一段代码
功能很简单,就是利用XPDF工具把文件夹下的PDF文件遍历读取然后将pdf内容在写入文本文件中
需要先安装XPDF工具,各位大佬莫嫌弃~~~~
具体代码如下:
<?php
#### config ####
$filePath = 'E:\test\test';// 读取文件路径
$xpdfPath = 'D:\xpdf';//XPDF工具安装路径
#### config ####
$filePath = toUtf8($filePath);
$filePath = str_replace('\\',"/", $filePath)."/";
$files = scandir($filePath);
if(empty($files))die("no file");
$pdf_files = array();
foreach($files as $v)
{
if(substr($v,-3) == 'pdf')
$pdf_files[] = toUtf8($v);
}
if(empty($pdf_files))die("no file");
$xpdfPath = str_replace('\\',"/", $xpdfPath)."/";
foreach($pdf_files as $v)
{
$filename = $filePath . $v;
$content = shell_exec ($xpdfPath.'pdftotext '.$filename .' -');
$txtname = substr($filename,0,-4).".txt";
file_put_contents($txtname,$content);
}
function toUtf8($str)
{
$encode = mb_detect_encoding($str,'UTF-8');
if($encode!='UTF-8')
{
$str=@mb_convert_encoding($str,'UTF-8',$encode);
}
return $str;
}
【精品小工具】PHP+XPDF工具读取文件夹下PDF 并将内容写入文本
需积分: 6 65 浏览量
2023-04-09
09:31:22
上传
评论
收藏 1.49MB ZIP 举报
技术宅小伙
- 粉丝: 179
- 资源: 1777
最新资源
- 2022NOC软件创意编程赛项真题python小学高年级-决赛(有解析)
- mathml转换latex需要的xsl文件
- 2022NOC软件创意编程赛项真题图形化小学高年级-决赛赛(有解析)
- gbase驱动下载gbase-connector-java-8.3.81.53驱动下载
- 2022NOC软件创意编程赛项真题图形化小学低年级-决赛赛(有解析)
- InsightFace从青铜到王者,超大规模人脸识别的优雅解法
- python后端开发spider框架详解
- 基于 STM32 与 ESP8266 的智能家居系统源码.zip
- 毕业设计:基于SSM的mysql-个性化点餐配送系统(源码 + 数据库 + 说明文档)
- 基于matlab的鱼苗计数识别(GUI界面).zip代码57
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈