我们可以使用名为“表单识别器”的Azure服务,该服务包含运动处理表格和收据中的智能处理功能。
如今,几乎所有内容都用于在线和虚拟模型。任何组织都面临的一个非常普遍的问题是处理电子扫描和提交收入以进行报销的问题。
目前,有必要澄清任何索赔或报销。首先,我们必须根据组织和部门首先到达适当的会计部门,实施此活动的方法是手动干预。一个人或团队必须手动浏览所有这些数字以扫描收据,并根据他们可能拥有的任何其他验证和资格标准。
当这种扫描收据太大时,情况就会变得更加悲惨。因此,摆脱了这项手动工作,许多组织选择了基于AI的解决方案,其中许多组织正在这样做。
当然,可以转到OCR,这是一个短期?paltic?haracter [r ecognization技术以提取数据,但这里的问题不仅是数据提取,而且是数据的解释。上传错误的文档可能会发生,这不是收据。因此,解决方案应足够强大以过滤这些场景。
像许多其他Azure服务一样,我们还可以使用称为形式识别器的服务,其中包含智能处理功能,使我们能够自动处理表单和收据。从基础上讲,它是OCR和预测模型的组合,后者属于该类别Azure认知服务。
在这里,OCR将用于文本提取,该模型将帮助我们过滤有用的信息,例如发票日期,地址,金额,描述,名称或任何其他可能是业务需求的相关字段。
表单识别设备支持两种类型的模型:预构建模型和自定义模型。
因此,在本文中,我将重点介绍前构造模型,并在另一篇文章中介绍自定义模型集成。
我们需要做的第一件事是登录到Portal.azure.com中的Azure门户以创建Azure Resources。有两种创建Azure资源的方法。
如果有人计划在认知服务下使用其他服务,则可以使用现有/新资源。但是,如果您只需要使用Form识别器服务,也可以使用。
为了开发,我将Python用作一种语言,并使用Jupyter笔记本使用Visual Studio代码。
以下是核心实施代码:
我已经使用以下收据作为输入:
因此,以上代码生成以下输出:
本文提到了如何使用预构建的ML模型从销售收据中读取信息。假定读者已经知道如何使用Python,VS代码,Jupyter笔记本电脑以及如何使用Python模块。
