数据治理的价值对企业和数据管理的价值总体上反映在2023年塑造该学科的两个最明显的趋势中。首先,该术语本身几乎完全被专门从事访问管理、数据控制和企业安全内部方面的供应商。这些供应商专注于合规性、数据隐私和数据保护——在当今高度监管的环境中,这些已迅速成为当代企业成败的区别。即使粗略地检查一下投资于这些公司的资本,也能证实这一事实。第二个趋势是数据治理对越来越多的环境、用例和市场条件的实时适用性,所有这些都需要数据治理变得比以往任何时候都更加灵活,以适应这些需求的出现。组织意识到,尝试完全预先确定和准备每一种可能的数据治理突发事件是很困难的。相反,他们现在正尝试自定义数据治理结构,以便他们可以动态调整以适应发生的情况。TopQuadrant首席技术官RalphHodgson表示:“了解可能发生的事情(通常是数据治理表达这一点)、已经发生的事情和正在发生的事情之间存在差异。”很难解决的问题。如果企业的数字孪生是可能的,那么数据治理中‘正在发生什么’的概念就是未来。”方面——当通过实时访问控制和情境适应的镜头应用时——可以模拟他们详细描述当前正在发生的事情的能力。这只是从该知识到控制和利用它以实现治理目标的逻辑进展。元数据管理可能仍然是数据治理的核心。组织可以从许多旨在优化此任务的工具中进行选择。有海量数据目录、主数据管理工具,以及Privacera首席执行官BalajiGanesan所说的“敏感数据目录”通过各种元数据模型自动进行数据发现和分类。根据Hodgson的说法,元数据有六种主要形式关于数据治理的重要领域的命令,包括:数据表示:该维度属于“数据如何表示;什么数据类型;什么数据表达;它可以量化吗?”霍奇森透露说。数据质量:质量数据对于信任数据和鼓励企业采用数据是不可或缺的。目的:该领域涉及数据的重要性、数据安全性和数据机密性。数据管理:数据管理需要“所有权、指标、可访问性”,霍奇森阐述道。法规遵从性:有关法规遵从性的元数据通常为政策和标准提供信息。数据来源:数据沿袭或数据来源代表数据的来源和企业旅程。根据Gartner的说法,元数据已经从反应性转变为主动性,为数据结构的数据集成等实时用例提供信息。因此,Hodgson描述的元数据(以及伴随的数据治理结构)最关键的方面之一是它们“共享表达事物之间关系的共同需求,”Hodgson说。清楚地了解这些数据治理域中的元素如何相互关联,使组织能够调整它们以满足新的要求、数据源或用例。霍奇森称之为“元关系”的数据模型规则是动态修改数据治理组件以满足新情况和业务条件的组成部分。概念数据模型由这些关系、它们的定义和消除它们歧义的语义组成——如果需要,在部门或应用程序之间。此类数据模型有助于与数据治理相关的一切,从呈现数据访问控制到促进生命周期管理必需品(如保留策略)。定义良好的概念数据模型可能是调整数据治理协议以满足新情况的起点。为此,此类模型由特定领域(模型的内容)和学科组成。“你可以为护士提供化学,或者为计算机科学提供电气工程,”霍奇森指出。“领域和学科之间是有区别的。”其他维度包括公司对主题的看法、模型的具体程度、方面和时间信息。模型的这些元素指定了必要的数据标识符、术语和模式,可以轻松地将它们组合起来用于部门间分析、源系统、客户分析、数据隐私要求等。TopQuadrant首席执行官NimitMehta阐述了一个用例,其中有多个政府机构致力于预防野火,每个机构都有自己的术语。“Graphs不是集中它并做'你应该以同样的方式说话',而是允许你以标准驱动的方式创建一个元模型并将那些联合语言学保持在原处。”分布式数据管理数据格局的分布及其对数据管理的影响将继续成为明年数据治理领域的首要挑战。除了云和多云计算的日益普及之外,DataFabric等架构,尤其是数据网格,使这个问题更加复杂。实际上,它会影响数据治理的所有方面,从生命周期管理到元数据管理。尽管如此,正如Ganesan正确指出的那样,“这就是数据治理的用武之地:在公司内部。他们如何查看和处理这些数据?为此,在新的12个月期间内,对旨在扩展提供托管数据访问能力的解决方案的投资——同时减少跨源策略执行措施的数量——不太可能减少。Ganesan说,这些好处可以通过多种方式实现,包括“提供单一管理平台,可以管理所有政策[并且平台]执行这些政策。”策略减少是通过基于属性的访问控制(ABAC)及其必然的、基于目的的访问来实现的。这两者都对保持流畅、响应迅速的数据治理有影响。根据ImmutaCTOSteveTouw的说法,“基于数据标签标记数据和推送策略不是ABAC。这是ABAC不可或缺的一部分。ABAC的真正力量在于使[访问]成为一个动态的运行时决策,而不是预先计算的,基于角色的决策。“PBAC通过仅为特定目的授予访问权限来建立这种优势,例如处理特定报告。数据隐私和监管合规性ABAC和PBAC都是满足监管合规性的基础,尤其是在横向数据隐私要求方面,并向监管机构证明这些事实。“你不仅可以获得控制和阻止,还可以获得法律监督,让你的用户同意他们只会将事物用于特定目的,并在访问数据时根据该目的行事,”Touw规定。他所指的动态运行时决策用于修改数据治理结构,例如遵守特定用例的同步规则,甚至促进合并和收购期间的数据访问。此用例和其他此类用例的合法性合规性证明由数据来源支持,这通常适用于数据治理的许多方面。使用PBAC和其他方法生成关于谁访问了什么数据、在何处、何时访问以及出于什么目的的日志文件。也许数据沿袭对法规遵从性和其他治理维度的应用的更广泛影响与其提供的上下文有关——这有助于告知修改治理概念以满足不断变化的环境的能力。”从血统的角度来看,这不仅仅是数据从哪里来的问题,而是谁在使用它的问题;他们为什么使用它?’Immuta全球解决方案架构副总裁MattVogt说。“所有这些背景信息都很重要。“数据质量数据域的分布不断增加-除了大量可用的非结构化数据之外-使数据质量成为管理良好的数据的先决条件。”治理部分围绕元数据、质量和访问部分展开,以减少用户查找和使用该数据的摩擦,”Ganesan反映道。虽然有大量与数据质量相关的指标,但核心指标不可避免地涉及“完整性、正确性、清晰度、一致性等”,Hodgson解释道。与涉及统计和非统计AI来发现和分类数据的大量自动化类似,有一些机制可以帮助查明数据质量问题的区域并加以纠正。模糊和精确匹配也可以提供这些好处。因此,这种现代数据质量机制“使用机器学习,我们可以建议映射到词汇表,然后词汇表,例如,以词汇表的形式,可以表达一致性规则,”霍奇森说。态势感知,实时响应正如霍奇森之前指出的那样,数据治理的理想是业务及其数据流程的实时模型,确保后者的长期价值,同时丰富前者。此范例中隐含的是修改数据模型、权限、术语甚至治理策略的能力(如果需要),以一种在降低风险的同时提供业务价值的内聚方式。动态访问控制功能、活动元数据和流畅的分布式数据管理可以促进这些好处。实施这种可变形式的数据治理将比人们想象的更快成为强制性的。这篇文章是由杰拉尼·哈珀(JelaniHarper)撰写的
