开始使用Azure认知服务来读取图像的文本

时间：2023-03-07 21:23:27 网络应用技术

　　计算机视觉帮助我们阅读文本，然后使用NLP了解已确定的文本。在本文中，我将讨论文本提取部分

　　在本文中，我们将学习如何从图像中读取或提取文本，无论是手写还是打印。

　　为了阅读文本，图片中有两件事。第一个是计算机视觉，第二个是NLP，这是自然语言处理的缩写。computer.computervision有助于我们阅读文本，然后使用NLP来理解已确定的文本。在本文中，我将讨论文本提取部分。

　　为了执行此文本提取任务，计算机视觉为我们提供了2个API：

　　OCR API适用于各种语言，非常适合相对较小的文本，但是如果您在任何图像中都有大量文本或文本为主导的图像，那么您可以选择阅读API。

　　OCR API以区域，线条和单词的形式提供信息。给定图像中的区域是包含文本的区域。

　　因此，输出层次结构将是区域，每个区域，然后是每行中的单词中的文本线。

　　读取API非常适合图像，并且文本高度加载。

　　基于文本的图像的最佳示例是任何扫描或打印文档。

　　这里的输出级别结构是页面，线条和单词的形式。

　　由于此API处理大量的线条和单词，因此它是异步的。

　　因此，在阅读整个文档之前，请勿阻止我们的应用程序，并且OCR API同步工作。

　　这是描述使用何时使用的表：

　　适用于相对较小的文本。

　　适用于基于文本的图像，即扫描文档。

　　输出层次结构是区域>>行>>单词。

　　输出层次结构将是页面>>行>>字。

　　同步工作。

　　以异步方式工作。

开始使用Azure认知服务来读取图像的文本相关文章