当前位置: 首页 > 后端技术 > Python

批量识别图中文字自动命名,让你1秒找到骚图

时间:2023-03-26 14:39:24 Python

批量识别图片中的文字自动命名,让你1秒包找骚图,我每次做视频都挺难找图片的,因为图片太多了,如果我想每次找一张固定的图片。这就像大海捞针。因为上一版代码保存图片是通过截取部分图片链接来命名的,所以名字是随机的。所以今天我要重命名这些图片。根据表情包中的文字命名。所以我得想办法识别图片中的文字。基本方法需要安装图像处理相关的库,如pillow、pytesser3、Tesseract-OCR等库。使用这些库识别图片文字的成功率不是很高,所以准备调用一些第三方库。看了一下百度文字识别的API接口。我们需要在下面的地址注册应用程序。https://ai.baidu.com/tech/ocr下面我们在文字识别中创建一个应用,选择图片文字识别。一般的文字识别接口每天有5万次免费调用,对于我们保存的几千张图片来说绰绰有余。创建成功后返回应用列表,我们可以看到刚刚创建的应用,有三个重要的参数,后面我们会用到AppID、APIKey、SecretKey。我们可以调用百度的图片文字识别API接口库。我们首先需要安装这个baidu-aip库。pipinstallbaidu-aip使用这个文字识别接口,选几张图片测试一下效果:总结一下:1、不识别GIF图片,只能识别静态图片,jpg、png、jpeg等。2、识别成功率不是100%。例如,“person”将被识别为“in”。3.如果图片中的文字有换行,会以字典的形式单独存放在words_result列表中。我将所有文本行加起来形成一行文本。有时图片中的符号无法保存为名称。我使用替换方法来替换和删除它。title=t.replace('/','').replace('\\','').replace(':','').replace('*','').replace('?','').replace('<','')\.replace('>','').replace('|','').replace('.','')gif动态图不能recognized,我们根据时间戳重命名它。如果表情包里没有文字,我们也用时间戳来命名。给定需要批量重命名的文件夹目录,我们可以使用rename方法批量重命名。当然,我们也可以优化上一版本的代码,即在图片保存的同时重命名。在下载图片的下载方法之后,添加根据表情包中的文字重命名的方法。效果如下:这样,大部分图片名称都是根据图片中的文字来命名的,查找起来更方便。比如我要搜索《川人光蒲老师》的资料时,输入“人光”就能找到。最后,原视频昨天发到了B站,很神奇,一起来欣赏吧!硬核加倍,将表情包中的文字识别为名字,1秒找到我想要的表情包。本文两个版本的代码(同时对一个目录下的所有图片进行批量保存重命名和重命名)都贴在了GitHub上。在本公众号“Python知识圈”后台输入框回复“重命名”。欢迎关注公众号“Python知识圈”,公众号会在后台回复关键词获取更多干货。回复“英语”:我给你7000个英语单词的速记方法。亲测非常有效。回复“编程”:免费领取2019年最新编程资料,认真学习BAToffer,手软。回复“赚钱”:领取36个简单实用的赚钱小项目,每天多赚100零花钱。