很久以前分享过一个Python代码实现验证码识别的方法。当时用的是pillow+pytesseract,优点是免费,好用。但其识别准确率一般。如果想要对验证码识别有更高的要求,初学者只能选择使用百度API接口。但实际上,无论是百度API接口还是pytesseract都需要提前配置好,对于新手来说不是很友好。而且百度API必须联网。对于一些机器无法上网的朋友,只能通过了。最近,群里有个群友分享了一个新库。试用了一下,非常好用,今天特地分享给大家。库的名字也很有意思——ddddocr(带弟弟OCR谐音)环境要求:python>=3.8Windows/Linux/Macox..可以通过以下命令安装pipinstallddddocr参数说明:随机找了个验证网上的代码图片,用这个库练习。来源:百度搜索importddddocrocr=ddddocr.DdddOcr()withopen('1.png','rb')asf:img_bytes=f.read()res=ocr.classification(img_bytes)print(res)成功识别验证码文本!而且优点也非常明显:首先,代码非常精简。与上述两种方式相比,无需设置额外的环境变量等,5行代码即可轻松识别验证码图片。另一方面,我们是否也可以使用魔术命令%%time来测试它?这个代码的识别速度非常快。接下来用更多的验证码图片继续测试:我又找了6张验证码图片进行测试,观察结果,发现这种简单的验证码基本可以快速识别。但是结果也有一些问题——字母大小写不区分(比如第6张图)。总而言之,如果需要验证码识别,对准确率要求不是太高。那么,带上小弟OCR(ddddocr)库是个不错的选择~我们的文章到此结束。如果喜欢今天的Python实战教程,请关注公众号:Python编程学习圈,了解更多编程技术东东。
