项目说明
该项目是一个脱机手写文本识别(HTR)系统,可将扫描图像中包含的印地语字符或英语单词转换为数字文本,并在网页中显示输出。除了转录外,还使用python API将文本从北印度语译成英语,反之亦然。
为了完成上述转录任务,使用了两个主要方法:直接对单词进行分类和字符分割。
对于前者,卷积神经网络(CNN)与各种体系结构一起使用,可以训练可以准确分类单词的模型。对于后者,使用长短期记忆网络(LSTM)进行卷积以构造每个字符的边界框。然后将分割后的字符传递到CNN进行分类,然后根据分类和分割的结果重建每个单词。
该模型是使用Tensorflow和Keras开发的,而Web应用程序是使用React和Flask框架开发的。
系统流程图
可用脚本
在项目目录中,可以运行:
npm start
在开发模式下运行应用程序。打开在浏览器中查看它。
如果您进行编辑,则页面将重新加载。您还将在控制台中看
评论0
最新资源