大家好,我是雪球。一、前言今天给大家分享的实战项目是普通验证码标注&识别。前两篇文章讲解了文章的创作灵感、需求分析与实现思路、数据采集/预处理/字符图切分等知识,以及Python项目实战文章-常用验证码标注与识别(需求分析与实现思路),Python项目实战篇-常用验证码标注&识别(数据采集/预处理/字符图切分),本文将为您讲解高阶Efficiency数据标注。2.高效的数据标注根据第一大步实现思路的描述,大家应该能够理解,在标注图片验证码数据的初始过程中,是通过手动更改文件名进行标注的.这种方法适用于小数据量。标注是比较有效的,但是标注上百张图片效率很低而且容易出错。因此,笔者思考如何提高通用图片验证码数据标注的效率,管理文件,随时查询、修改、下载。一开始想用pythongui框架写一个简单的工具。在尝试了Tkinter和PyQT框架API后,发现列表组件的操作很麻烦,自定义项也很复杂,所以放弃了这种方法。计划。最终采用了目前主流的网页+后台应用方案。这个后端技术栈作者比较熟练,前端技术很一般。基本上,您现在就可以使用它。只需要找一个快速入门的前端后台管理模板工程修改即可。只是改变它。在此,感谢之前工作的前端同事,给我推荐了一个开源项目直接上手,也帮我解决了修改过程中的大部分问题。以下是Vue后台管理系统模板开源项目地址:[Vue-Admin-Template](https://github.com/PanJiaChen/vue-admin-template)确定应用方案后,需要考虑需要实现的通用图片验证码的需求和功能模块,由于文章篇幅,就不把具体的功能细节分析、设计、实现过程都写出来,贴出主要功能这里。以下是通用图片验证码数据标注的相关功能模块:1、用户模块:登录/注册、角色、权限控制等2、文件模块:用户附件表的增删改查、存储和查询按用户目录存储3.验证码图片模块:标签验证码拉取生成,标签数据提交/修改,分页查询,批量下载4.验证码图片模型预测:支持多模型切换预测(时间关系,只有单一模型)数据标注前端系统相关代码这里就不写了。有相关基础的可以拉取文章开头的项目链接阅读相关模块代码。下面仅给出项目中前后端系统功能实现的主要相关技术中间件和开源框架。前端技术框架:vue、vuex、vue-router、axios、element-ui等后端技术框架:SpringBoot、SpringSecurity、SpringMVC、SpringDataJpa、Redis、Mysql等稍微提一下这里,后端采用传统的单机Web/Session技术架构,个人项目勉强够用,企业应用可以改成分布式/微服务架构。以上就是通用图片验证码数据标注系统前后端功能的大致实现。有问题的读者可以留言或联系小编进行讨论。经过笔者1-2周的空闲时间进行数据库设计、前后端工程搭建、功能编码/测试等工作,初步实现了功能。接下来我们看一下项目在windows上的运行效果。前端运行效果:使用IDE:VisualStudioCode测试环境终端运行:npmrundev后端运行效果:使用IDE:IntelliJIdea2019运行:点击工具栏运行按钮下面是前端的部分运行效果-端系统演示效果:拉图验证码生成:标注图片验证码-提交:标注图片-分页查询/下载/编辑:模型预测生成的数据(40个字符中有2个字符错误~~):以上为演示核心功能的作用,这里是注意点,CNN模型预测和识别功能是一个需要部署python的神经网络模型项目。本次功能部署的相关内容将在下一步详细介绍。这里只是演示一下效果。3.总结我是雪球。本篇内容主要讲解高效数据标注。之前我们也讲解了数据采集/预处理/字图切割的知识,Python项目实战-常用验证码标注&识别(数据采集/预处理/字图切割),以上两个功能实现后,我们可以知道图片验证码标注管理可以做到高效,并且可以批量进行字符图片分割,那么基础数据就有了,接下来我们就进入本文的核心功能分析实现内容:字符特征提取-CNN神经网络模型训练。
