没有合适的资源?快使用搜索试试~ 我知道了~
大麦网源码java-OCR:图片文字信息提取
共590个文件
png:299个
jpg:126个
class:51个
需积分: 36 9 下载量 102 浏览量
2021-06-06
14:44:29
上传
评论 1
收藏 134.53MB ZIP 举报
温馨提示
大麦网源码java 1.网店工商信息图片文字提取 图片内容如下所示,但每张图片中信息出现的位置不尽相同,题目要求所写的程序能够完成如下几个功能点。 程序能够识别不同格式的图片,并能够提取所要求的信息。 从图片之中提取企业注册号和企业名称信息,并保存到Excel表格之中。 程序能够自动读取企业工商信息图片所在的文件夹路径。 识别速度保持在60秒识别50张图片,识别正确率保证在95%以上。 2.Tess4j 了解题目要求之后,我们便开始来解决问题。首先明确一点的是,肯定不能从头去写文字识别算法或者文字识别程序,OCR(Optical Character Recognition , 光学字符识别)发展这么多年来,开源的库肯定不少,只需找到适合中文识别的类库或者项目即可。 个人采用的是Tess4j开源库,其中Tess4j是由Tesseract扩展而来,Tesseract是HP实验室开发由Google维护的开源OCR引擎,Tess4j支持Tiff,jpeg,gif,png,pdf等多种格式识别。我们只需要在下载类库,然后编写下述代码便可实现文字识别,使用方法很简单。如果你要使用的话,请注意pac
资源推荐
资源详情
资源评论
收起资源包目录
大麦网源码java-OCR:图片文字信息提取 (590个子文件)
api_config 27B
Tesseract.class 19KB
ImageIOHelper.class 18KB
TessAPI.class 12KB
SWTResourceManager.class 11KB
PdfGsUtilities.class 8KB
LoadLibs.class 8KB
PdfBoxUtilities.class 7KB
GetFileImageText.class 6KB
ImageHelper.class 5KB
ImageRecognitions.class 5KB
SaveFileImageResult.class 5KB
GetOneImageText.class 4KB
ImageDeskew.class 4KB
ImageUtil.class 3KB
ImageRecognitions$2.class 3KB
PdfUtilities.class 3KB
ITesseract.class 2KB
GetFilePath.class 2KB
Utils.class 2KB
ImageRecognitions$1.class 2KB
TesseractExample.class 2KB
ITessAPI.class 2KB
LoggerConfig.class 2KB
ITesseract$RenderedFormat.class 1KB
Word.class 1KB
ITessAPI$ETEXT_DESC.class 1KB
ImageRecognitions$3.class 1KB
PdfBoxUtilities$2.class 1004B
PdfGsUtilities$2.class 1000B
ITessAPI$EANYCODE_CHAR.class 892B
PdfBoxUtilities$1.class 854B
PdfGsUtilities$1.class 850B
ITessAPI$TessPolyBlockType.class 841B
LoggHelper.class 792B
ITessAPI$TessPageSegMode.class 785B
TesseractException.class 760B
ITessAPI$TimeVal.class 737B
ImageDeskew$HoughLine.class 676B
ITessAPI$TessMutableIterator.class 583B
ITessAPI$TessResultRenderer.class 580B
ITessAPI$TessResultIterator.class 580B
ITessAPI$TessChoiceIterator.class 580B
ITessAPI$TessPageIterator.class 574B
ITessAPI$TessBaseAPI.class 559B
ITessAPI$TessParagraphJustification.class 438B
ITessAPI$TessOrientation.class 421B
ITessAPI$TessPageIteratorLevel.class 421B
ITessAPI$TessWritingDirection.class 417B
ITessAPI$TessOcrEngineMode.class 411B
ITessAPI$TessTextlineOrder.class 402B
ITessAPI$CANCEL_FUNC.class 287B
.classpath 3KB
digits 38B
libtesseract3051.dll 2.73MB
libtesseract3051.dll 2.12MB
1_20180319130313_3pc73.doc 4.46MB
.DS_Store 10KB
.DS_Store 8KB
.DS_Store 8KB
.DS_Store 6KB
.DS_Store 6KB
.DS_Store 6KB
hocr 22B
.50.png.icloud 156B
python.iml 623B
lept4j-1.6.4.jar 6.71MB
tess4j-3.4.8.jar 4.97MB
com.ibm.icu_3.8.1.v20080530.jar 4.26MB
org.eclipse.ui.workbench_3.4.2.M20090127-1700.jar 3.75MB
pdfbox-2.0.9.jar 2.4MB
poi-3.9-20121203.jar 1.78MB
org.eclipse.swt.cocoa.macosx.x86_64-4.6.jar 1.68MB
fontbox-2.0.9.jar 1.48MB
itext-2.1.7.jar 1.08MB
org.eclipse.jface_3.4.2.M20090107-0800.jar 1017KB
org.eclipse.osgi_3.4.3.R34x_v20081215-1030.jar 974KB
org.eclipse.jface.text_3.4.2.r342_v20081119-0800.jar 923KB
jna-4.1.0.jar 893KB
jai-imageio-core-1.4.0.jar 613KB
xmlgraphics-commons-1.5.jar 588KB
log4j-1.2.17.jar 478KB
logback-core-1.2.3.jar 461KB
junit-4.12.jar 309KB
org.eclipse.ui.forms_3.3.103.v20081027_34x.jar 291KB
logback-classic-1.2.3.jar 284KB
org.eclipse.text_3.4.0.v20080605-1800.jar 239KB
commons-beanutils-1.9.2.jar 228KB
commons-io-2.6.jar 210KB
gson-2.3.1.jar 206KB
ghost4j-1.0.1.jar 176KB
org.eclipse.equinox.registry_3.4.0.v20080516-0950.jar 169KB
jbig2-imageio-3.0.0.jar 149KB
calendarcombo-1.0.0.jar 147KB
jboss-vfs-3.2.12.Final.jar 141KB
org.eclipse.core.commands_3.4.0.I20080509-2000.jar 103KB
org.eclipse.equinox.common_3.4.0.v20080421-2006.jar 92KB
gallery-0.5.2.jar 91KB
collapsiblebuttons-1.0.0.jar 86KB
pdfbox-tools-2.0.9.jar 71KB
共 590 条
- 1
- 2
- 3
- 4
- 5
- 6
资源评论
weixin_38666753
- 粉丝: 7
- 资源: 909
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 批量word文件内容替换工具1.0 (批量实现多个 Word 文档文件文字替换利器).exe
- Cartoon GUI Pack 1.2.zip
- 【数据集和代码】基于加速度传感器的步态识别行人分类实验(可做步态识别)
- 我分享个魔兽内存修改器
- Python毕业设计基于Django的网易云数据分析可视化大屏系统的设计与实现+使用说明+全部资料(优秀项目).zip
- mp3 idv2,idv1,frame分析工具
- Python毕业设计基于Django的网易云数据分析可视化大屏系统的设计与实现+使用说明+全部资料(高分项目).zip
- 人工兔优化算法ARO MATLAB源码, 应用案例为函数极值求解以及优化svm进行分类,代码注释详细,可结合自身需求进行应用
- 人才网站设计-asp.net+sql-(系统源码)
- asp.net+sql人才网站设计-含系统源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功