今天给大家分享的题目是利用百度的接口实现图片文字识别。整体环境和配置要求用Python实现。需要用到的第三方库包括aip、PIL、keyboard、pyinstaller。如果没有安装,可以在CMD中使用pipinstallBaidu-AIP/pillow/keyboard/pyinstaller命令安装。打开百度界面https://cloud.baidu.com/,如果还没有注册,请先注册,然后登录后点击管理控制台,点击左侧产品服务→人工智能→文字识别,点击创建application,输入应用名称如Baidu_OCR,选择一个用途如学习、办公等,最后描述一个简单的应用,然后点击立即创建。会出现一个应用列表,包括AppID、APIKey、SecretKey等信息,后面会用到。整个程序的大致思路是,使用截图软件获取截图后,交给百度接口进行识别,返回结果。当然也可以是本地图片识别。我用的是QQ自带的截图软件,速度很快。CTRL+ALT+A键用于打开屏幕截图。选择截取区域后,按回车键保存到剪贴板,也可以使用其他截图软件。①截屏键盘类库是用来监听键盘动作的,所以按下快捷键后,就会有相应的动作。并使用PIL中的ImageGrab获取剪贴板中的图片并生成本地图片文件。#1。截图keyboard.wait('ctrl+alt+a')print('开始截图')keyboard.wait('enter')print('保存截图')time.sleep(0.1)#2.savepictureimage=ImageGrab.grabclipboard()image.save('img.png')②调用百度aip识别并打印文字首先用注册时生成的AppID、APIKey、SecretKey初始化应用,然后读取保存的图片并打印识别出的文字。withopen('img.png','rb')asfp:image=fp.read()text_list=client.basicAccurate(image)['words_result']fortextintext_list:print(text['words'])运行结果展示图中提示:运行截图我们还可以添加一个无限循环,这样就可以一直截图了。③调用打包程序生成专属文字识别小程序使用pyinstaller库将小程序打包生成.exe文件,可以随时识别文字。在命令行使用pyinstallerxxx.py打包生成一个exe文件,最后在生成的dist文件夹中找到xxx.exe文件如下:独家文字识别完整源码下载见文末小程序!附图片识别案例
