人工智能(AI)系统交互更像人类,这让一些人感到不舒服,但人工智能并不是要取代人类。实际上,它更多的是关于从人类中移除机器人。人工智能的大部分价值在于自动化手动过程和快速分析大量数据,从而使人类可以自由地执行需要推理和判断的更高阶任务。然而,要实现这一目标,人工智能系统必须能够与用户交流并分析自然形式的数据(也称为非结构化数据),所有无法以整洁方式打包的自由流动数据,例如语音、图像和文本。非结构化数据对于人工智能系统的发展至关重要。人工智能系统与用户的沟通越好,它自己学习的东西就越多,因此它的效率就越高。这很重要,因为如果人工智能系统只需要结构化格式的用户交互,那么它的组件将非常有限。人工智能要想成功,就必须理解杂乱无章的信息。在这种情况下,需要深入了解非结构化数据的工作原理。非结构化数据的挑战在人世间,人与人交谈时,如果不按礼节说话。在某些可能遵循或不遵循约定的配置中,可能会想到任何事情。人们可能会使用俚语、讽刺和笑话。人们将日常语言和他们希望传达的信息组织成整齐的列和行是不自然的。语言本身是非结构化的。如果有人曾经与亚马逊的Alexa互动过,他们就会知道虽然Echo系统通常非常擅长理解自由形式的命令,但缺乏定义的协议有时会导致问题,或者至少在Alexa尝试回答时会出现幽默的回应。查询不符合模式。亚马逊投入了资源和数百万美元来创建和永久改进算法,使这种类人的声音能够响应命令,但正如Echo擅长破译流畅的语音一样,Alexa仍然存在缺陷。Alexa示例突出了一种非结构化数据的复杂性。人工智能系统处理和创建与文本等效的数字的能力也是一项艰巨的任务,尤其是当企业考虑到细微差别和上下文的重要性时。想象一下,一台机器试图“理解”家庭度假照片或印象派艺术史教科书中的图像发生了什么。与处理非结构化数据相关的复杂性可能是企业人工智能的最大障碍。然而,它们并非不可逾越。专业知识的重要性非结构化数据本身就是噪音。因此,它需要大量的专业知识来突破、梳理和检测模式,然后开发识别这些模式的模型。数据科学家正在积极推动人工智能系统的改进,最大的成功表明需要人类的直觉和经验。当团队专注于非常狭窄的AI应用程序时,通常会发生这种情况。就工人的赔偿索赔流程而言,对索赔有深刻理解的数据科学家团队可以根据他们发现的关键指标创建预测模型。它们包含诊断、药物信息、索赔记录等非结构化数据。在此过程中,人工智能系统评估早期指标并确定索赔可能被拒绝。然后它可以向用户提供警报。索赔代表可以弄清楚如何干预并给予具体索赔更多关注,以防止索赔人的律师介入(通常被拒绝的索赔最终会涉及律师,这可能会变得非常昂贵并且需要很长时间才能解决)。在这种情况下,很容易看出AI系统如何为用户提供帮助,并且与非结构化数据相结合时,与仅依赖结构化数据相比,还可以大大提高准确性。非结构化数据(例如,关于合并症的信息)中存在信息和洞察力的金矿,这些信息和洞察力无法始终如一地找到进入结构化数据的方式。每增加一条信息,人工智能系统就会变得更加智能,结果也会得到改善。这将提高效率并降低理赔成本。这只是将非结构化数据整合到企业人工智能系统中的好处之一。破解密码需要时间和精力,但回报是获得前所未有的洞察力——只需几分钟或几小时,而不是几天或几周。非结构化数据是关键展望未来,很明显每个人工智能系统都需要以自然的方式与用户交互。组织必须非常重视这一点。事实上,如果非结构化数据分析不是路线图的一部分,那么该公司的产品就会存在巨大差距。尽管非结构化数据面临挑战,但亚马逊、谷歌、苹果和其他公司为人工智能应用提供了许多机会。人们可以利用这些进步并将它们应用到具有巨大业务影响的企业应用程序中。通过花时间应用专业知识和可靠的数据科学,可以取得重大突破。人们不仅需要通过非结构化数据来提高数据分析的准确性,还需要实现未来思维、交流和利用信息的根本性新方式。
