当前位置: 首页 > 科技观察

人工智能如何拯救企业数据目录

时间:2023-03-20 16:52:35 科技观察

“数据目录”的概念并不新鲜。早在大型机时代,企业就开始通过数据目录来跟踪和管理自己的数据资产。数据目录存储与数据相关的数据,或元数据。企业数据目录需要记录并添加对整个公司所有数据库和文件的描述,例如,尽可能记录文件与文件之间的关系。数据目录允许业务用户快速找到他们需要的信息源——无论是资产数据、公司的地理位置,还是产品和供应商信息。然而,数据目录只有保持最新才能保证有效——在瞬息万变的行业中,这可能很难做到。元数据和数据目录理解元数据的一种简单方法是通过电影类比。电影存储在广播公司的电影库中,但您需要保存的不仅仅是电影的标题。重要的是要知道电影有多长,里面有哪些演员,谁是导演,谁是编剧,还有关于剧本的信息,所有这些都是关于电影的元数据。想必大家对数据目录、数据字典、业务词汇表等概念都有一个大概的了解。针对业务用户的业务词汇表与针对更精通技术的受众的数据字典之间存在细微差别。但这三个概念显然都与元数据相关——而且它们都面临着相似的挑战。企业数据目录的挑战早期的数据目录侧重于技术数据,例如数据库中有多少个字段、字段是基于数字还是基于字符、字段有多长以及它是否具有有效值范围。后来,该定义扩展到包括有关业务数据类型的信息,甚至包括该数据的定义,例如什么是“客户”、“产品”或“资产”。关键问题之一是企业数据目录可能会过时。通常,热情的员工会输入有关各种系统和数据库内容的信息,但几乎没有动力使这些信息保持最新。当部署新系统、收购整个公司并将其系统添加到企业产品组合或进行重组时,那些精心输入的描述性元数据变得过时以至于不再受信任,然后不再使用。向上。尽管许多公司在实施有效目录方面付出了很多努力,但很少有公司会随着业务的快速变化不断努力保持其企业数据目录完全同步。因此,虽然今年已有多家软件厂商提供了数据目录、数据字典、业务词汇表等产品和服务,但并没有得到真正意义上的广泛普及。人工智能和企业数据目录在数据量和种类不断增加的时代,保持企业数据目录处于最新状态变得越来越困难。然而,人工智能等技术的应用可以改变这种状况。机器学习应用程序可以筛选公司数据目录和文件系统,自动收集元数据标签,其过程类似于谷歌在互联网上搜索网站和目录并将其编入索引的方式。将这项技术应用于数据目录可以帮助组织自动填充和更新——无需人工干预。这解决了阻碍企业数据目录的一个关键问题:大量繁重的工作需要手动完成。可以预见,人工智能很可能会帮助数据目录市场蓬勃发展。