在Linux上使用gImageReader从图像和PDF中提取文本

时间：2023-03-16 14:10:27 科技观察

gImageReader是一个GUI工具，用于在Linux中使用TesseractOCR引擎从图像和PDF文件中提取文本。gImageReader是Tesseract开源OCR引擎的前端。Tesseract最初由HP开发，然后于2006年开源。基本上，OCR（光学字符识别）引擎允许您从图片或文档(PDF)中扫描文本。默认情况下，它可以检测多种语言，还支持通过Unicode字符进行扫描。然而，Tesseract本身是一个没有任何GUI的命令行工具。因此，gImageReader就是为了解决这个问题，任何用户都可以使用它从图像和文件中提取文本。让我强调一些关于它的事情，并在测试期间分享我的经验。gImageReader：Tesseract的跨平台OCR前端为了简化事情，当从PDF文件或包含任何类型文本的图像中提取文本时，gImageReader非常方便。无论您需要它进行拼写检查还是翻译，它都应该对特定的用户群有用。总结列表中的功能，以下是您可以使用它执行的操作：从磁盘、扫描设备、剪贴板和屏幕截图添加PDF文档和图像能够旋转图像用于调整亮度、对比度和分辨率的常用图像控件。直接从应用程序扫描的图像能够一次处理多个图像或文件手动或自动识别区域定义识别纯文本或hOCR文档编辑器显示识别的文本拼写检查提取的文本从hOCR文件转换/导出为PDF文件导出提取的文件文本为.txt文件跨平台(Windows)在Linux上安装gImageReader注意：您需要安装Tesseract语言包才能在软件管理器中检测图像/文件。您可以在某些Linux发行版（如Fedora和Debian）的默认存储库中找到gImageReader。对于Ubuntu，您需要添加PPA，然后安装它。为此，您需要在终端中输入以下内容：sudoadd-apt-repositoryppa:sandromani/gimagereadersudoaptupdatesudoaptinstallgimagereader您也可以从openSUSE的构建服务中找到它，ArchLinux用户可以在AUR中找到它.所有存储库和包的链接都可以在它们的GitHub页面上找到。gImageReader体验当您需要从图像中提取文本时，gImageReader是一个非常有用的工具。当您尝试从PDF文件中提取文本时，它的效果非常好。对于从智能手机拍摄的照片中提取，检测接近，但有点不准确。也许当您进行扫描时，从文件中识别字符可能会更好。所以，你需要自己尝试一下，看看它是否适合你。我在LinuxMint20.1（基于Ubuntu20.04）上试过。我在设置中管理语言时只有一个问题，我没有得到快速修复。如果您遇到此问题，可能是时候对其进行故障排除并了解??有关如何解决它的更多信息。除此之外，它工作正常。尝试一下，让我知道它对您有何影响！

上一篇：微信官网变绿，官方展示设计改版历史

下一篇：五天后，微信将以“宇宙中心”的身份屏蔽这种行为

在Linux上使用gImageReader从图像和PDF中提取文本相关文章