没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
Tesseract OCR 包含了一个OCR引擎 - libtesseract和一个命令行程序 - tesseract。Tesseract 4添加了新的基于LSTM的OCR引擎,该引擎专注于行识别,但仍支持Tesseract 3的传统Tesseract OCR引擎,该引擎通过识别字符模式来工作。通过使用传统OCR引擎模式(--oem 0),可以与Tesseract 3兼容。它还需要训练有素的数据文件来支持旧式引擎,例如tessdata存储库中的文件。 Tesseract具有Unicode(UTF-8)支持,并且可以“开箱即用”地识别100多种语言。 Tesseract支持多种输出格式:纯文本,hOCR(HTML),PDF,仅不可见文本的PDF,TSV。master分支还对ALTO(XML)输出提供了实验性支持。 安装Tesseract: 您可以通过预建的二进制软件包安装正方体 或从源代码编译它。 支持的编译器是: GCC 4.8及以上 lang 3.4及以上 MSVC 2015、2017、2019年 其他编译器可能可以工作,但未得到官方支持。
资源推荐
资源评论
资源评论
weixin_38705558
- 粉丝: 4
- 资源: 944
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功