jTessBoxEditor
jTessBoxEditor是一个用于Tesseract OCR的字体编辑器与训练器,可以编辑Tesseract 2.0x和3.0x格式的字体数据,并全自动完成Tesseract训练。它能读取包括多页TIFF在内的常见图像格式,运行该程序需要Java运行环境7或更高版本。 使用jTessBoxEditor生成.box文件的步骤是: 选择Tools -> Merge TIFF,打开对话框,选择训练样本所在文件夹,并选中所有要参与训练的样本图片,然后点击打开按钮,出现文件保存对话框,输入文件名:num_1.font.exp0.tif,完成后会出现merge完成的提示。 打开命令提示符,进入步骤1生成的num_1.font.exp0.tif文件所在目录,然后执行命令:tesseract num_1.font.exp0.tif num_1.font.exp0 –l eng batch.nochop makebox,执行完成后,会在当前目录下生成num_1.font.exp0.box文件。