当前位置: 首页 > 网络应用技术

开始使用Azure认知服务来读取图像的文本

时间:2023-03-07 21:23:27 网络应用技术

  计算机视觉帮助我们阅读文本,然后使用NLP了解已确定的文本。在本文中,我将讨论文本提取部分

  在本文中,我们将学习如何从图像中读取或提取文本,无论是手写还是打印。

  为了阅读文本,图片中有两件事。第一个是计算机视觉,第二个是NLP,这是自然语言处理的缩写。computer.computervision有助于我们阅读文本,然后使用NLP来理解已确定的文本。在本文中,我将讨论文本提取部分。

  为了执行此文本提取任务,计算机视觉为我们提供了2个API:

  OCR API适用于各种语言,非常适合相对较小的文本,但是如果您在任何图像中都有大量文本或文本为主导的图像,那么您可以选择阅读API。

  OCR API以区域,线条和单词的形式提供信息。给定图像中的区域是包含文本的区域。

  因此,输出层次结构将是区域,每个区域,然后是每行中的单词中的文本线。

  读取API非常适合图像,并且文本高度加载。

  基于文本的图像的最佳示例是任何扫描或打印文档。

  这里的输出级别结构是页面,线条和单词的形式。

  由于此API处理大量的线条和单词,因此它是异步的。

  因此,在阅读整个文档之前,请勿阻止我们的应用程序,并且OCR API同步工作。

  这是描述使用何时使用的表:

  适用于相对较小的文本。

  适用于基于文本的图像,即扫描文档。

  输出层次结构是区域>>行>>单词。

  输出层次结构将是页面>>行>>字。

  同步工作。

  以异步方式工作。