今天Gitee为大家介绍了中文OCR包。大家都知道训练模型是一件非常费时费力的事情,但是今天这个项目已经自带了训练好的识别模型,我们只需要下载使用即可,可以说是非常方便了,那我们就开始吧查看此项目的详细信息。项目名称:cnocr项目作者:cyahua开源许可协议:Apache-2.0项目地址:https://gitee.com/cyahua/cnocr项目介绍cnocr是一个用于中文OCR的Python3包。cnocr自带训练好的识别模型,安装后可以直接使用。cnocr主要针对排版简单的印刷文字和图片,如截图、文档扫描等。目前cnocr内置的文本检测和分支模块无法处理复杂的文本排版和定位。如果要用于场景文字图像识别,需要与其他场景文字检测引擎配合使用。可以直接使用的模型示例cnocr的ocr模型可以分为两个阶段:第一阶段是获取ocr图像的局部编码向量,第二部分是对局部编码向量进行序列学习以获得序列编码向量。目前两个阶段包括以下模型:局部编码模型(emb模型)conv:多层卷积网络;conv-lite:更小的多层卷积网络;densenet:小型densenet网络;densenet-lite:一个更小的densenet网络。序列编码模型(seqmodel)lstm:二层LSTM网络;gru:双层GRU网络;fc:二层全连接网络。cnocr目前包括以下型号可以直接使用。训练好的模型放在cnocr-models项目中,可以免费下载使用:Features本项目的初始代码是从crnn-mxnet-chinese-text-recognitionfork而来的,感谢作者。但是源码工程使用起来不够方便,所以我在这个基础上做了一些封装和重构。主要变化如下:不再使用需要额外安装的MXNetWarpCTCLoss,而是使用原生的MXNetCTCLoss。所以安装是最小的!自带训练有素的中文OCR识别模型。无需额外培训!添加了预测(或推理)接口。非常容易使用!如果您对本项目感兴趣,想亲自尝试一下识别效果,可以点击下方链接前往项目首页查看。觉得不错记得给个star:https://gitee.com/cyahua/cnocr
