当前位置: 首页 > 科技观察

Mac用户的福音:OCR新神器,一键转换屏幕上的任意文字

时间:2023-03-17 11:54:21 科技观察

在机器学习和计算机视觉领域,光学字符识别(OCR)一直是重要课题之一研究。OCR只是将文档或场景的照片转换为机器编码的文本。关于OCR工具,机器之心之前也介绍过很多,比如2020年频繁出现在GithubTrending日榜和月榜的开源项目PaddleOCR,目前该项目已经获得12.6kstar。此外,由旷视研究院与华中科技大学联合研发的基于分割的场景文本识别方法TextScanner,不仅可以正确读取字符数据,而且在一系列相关文本基准数据上也达到了目前最好的性能套。最近,GitHub上出现了一款非常流行的OCR工具macOCR。仅一天时间,就获得了近800个赞。macOCR是一个开源命令行应用程序,用户可以使用它来将屏幕上的任何文本转换为剪贴板上的文本。项目地址:https://github.com/schappim/macOCR当你调用ocr命令时,会出现一个类似光标的“截屏”(screencapture)。结果,框架内的任何文本都将转换为纯文本。项目作者提供如下动图展示,将图片文字转化为文字。对于macOCR命令行应用,网友们给予了很高的评价。网友@mromanuk说:“我很沮丧,因为一直没有简单的方法可以从Mac图片中提取文本。现在macOCR填补了这个空白!这个功能应该集成在MacOS中或者随时可用。”使用的操作系统需要是macOSCatalina及以上版本。用户可以选择编译下面repo中的代码,或下载预构建的二进制文件(针对AppleSilicon处理器和Intel处理器分开)并将它们放在他们的路径中。AppleSilicon处理器安装代码:curl-Ohttps://files.littlebird.com.au/ocr.zip;unzipocr.zip;sudocpocr/usr/local/bin;Intel处理器安装代码:curl-Ohttps://files.littlebird.com.au/ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;unzipocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;sudocpocr/usr/local/bin;首次运行macOCR应用程序时,用户可能需要“允许该应用程序访问您的屏幕”,如下图:项目作者macOCR的创建者是MarcusSchappi,现任ChickGlobal的首席执行官和联合创始人。他还是其他几家公司的联合创始人,包括LittleBirdElectronics和GeekAmmo。沙皮曾就读于澳大利亚巴克学院、悉尼科技大学和悉尼大学。其中,他在悉尼科技大学攻读工程创新、机电一体化和创业学学士学位时并没有获得学位。但由于他所创造的海啸预警软件引起了媒体的广泛关注,他最终被悉尼大学录取攻读设计科学硕士(DesignComputingandComputing)。Schappi在软件开发、移动应用程序和IOS开发方面拥有强大的技能。目前,他的GitHub主页上有多个项目,如macOCR、kod-website、dropcam等。