腾讯云 OCR 服务二次开发
本文记录了对腾讯云 OCR 服务二次开发的代码和开发过程中遇到的问题。
腾讯云 OCR 服务二次开发
目录腾讯云 OCR 服务二次开发前言安装 SDK 调用 API 学习 API 文档通用印刷体识别
API 代码 main.pyparse_args.pyocrtool.py 运行结果本地图片本地 PDF 网络图片问题整理问
题 1:argparse 模块参数之间如何生成依赖?问题 2:argparse 模块 parser 的参数 type 是 bool
时,CLI 中传入参数即使是 False,也会认为是 True?问题 3:bytes 格式转化为 str 格式的方
法:后续想法
前言
因为腾讯云账户中还剩一点点钱,刚刚好够买腾讯云里文字识别服务,想着自己平时看
PDF 比较多,可以用这个服务来便捷的进行图像文字转换。我购买的是通用印刷体识别,
即可以对图片进行识别,也可以对 PDF 文件进行识别。需要注意的的是,图片识别需要将
图片转为 Base64,PDF 识别时每次只能识别一张。
本文记录了对腾讯云 OCR 服务二次开发的代码和开发过程中遇到的问题。
安装 SDK
我使用的是 Python 3.6,要使用腾讯云的 OCR 服务,要先在本地环境中安装腾讯云的 SDK。
安装方式见:Python - SDK 中心 - 腾讯云 (tencent.com)
调用 API
学习 API 文档
安装好 SDK 后,调用相应的接口就 ok 了,可以参考:文字识别 API 概览 - 服务端 API