当前位置: 首页 > 科技观察

数据安全:构建业务词汇表为什么和如何_0

时间:2023-03-21 12:39:05 科技观察

介绍数据治理业务词汇表是一种基本的数据素养工具,对于理解数据和在您的组织中进行有效分析至关重要。如果没有商业词汇表,公司通常会被大量使用中相互冲突的术语和定义所淹没。如果没有标准化,组织就会遇到阻碍关键业务流程的全面障碍。业务词汇表使用户能够找到常用的术语和定义,更轻松地就数据资产进行协作,并顺利推进数据驱动的增长计划。构建业务词汇表并不容易,需要一个专门的工具来完成这个过程。在尝试确定为您的业务词汇表确定哪些术语的优先级时,分析使用情况和技术重要性等方法有时会失败。相反,创建一个调查来找出哪些术语对您的组织很重要。使用提供的调查问题来全面了解需要通过数据治理定义的重要术语。不要害怕自己添加问题!商务词汇基础什么是商务词汇?一个业务词汇表,将与数据相关的术语和定义汇集在一起??,并清晰、有逻辑地显示它们,以便组织中的每个人都可以访问它们。标准化是数据素养最重要的组成部分之一,也是在任何组织中开发业务词汇表的关键驱动力。问题是,很容易得出一个定义,个人用户和部门往往会采用相互冲突的术语,很难与多个个人和部门协调,从一开始就建立通用术语很重要。随着时间的推移,随着越来越多的术语被使用,公司的数据资产变得非常难以导航,使得用户几乎不可能使用他们不熟悉的数据资产进行协作和创新。业务词汇表通过引入组织中每个人都能理解的标准化术语和定义来消除这种混淆。业务词汇表的要素是什么?尽管业务词汇表的核心目标是使组织中的术语标准化,但构成它的元素和用例很多。其中包括:术语和定义-因此业务用户可以受益于一致性并快速轻松地更好地了解数据资产数据分类-用户可以根据数据的分类方式搜索、识别和查找数据之间的关系参考数据-所以数据治理组可以在微观层面对数据进行分类技术元数据——这样有经验的数据分析师可以在上下文中分析数据资产但是,重要的是要注意,每个组织都会有一个特定的用例,通过实现业务词汇表来实现。即使您只同意我们上面提到的一两个要素。可能会有更多特定于组织的内容。BusinessGlossary经常与...混淆,但不是...许多用户可能会发现很难区分业务词汇表和数据字典。然而,虽然相似,但它们不是相同的资源。简而言之,业务词汇表的作用是定义术语,以便用户可以轻松识别它们并使用它们进行协作。另一方面,数据字典旨在通过设置和执行各种数据标准、记录源、格式和关系来使数据库顺利运行。一些用户可能还会将业务词汇表与数据目录混淆。同样,尽管有一些相似之处,但也存在显着差异。本质上,DataCatalog支持创建业务词汇表。正如数据目录爬取公司的所有数据源并将数据资产整合到一个集中的、可搜索的数据库中一样。正是这种集成使数据团队可以轻松找到相互冲突的术语和定义。拥有商业词汇表的主要好处在您的组织中拥有商业词汇表有几个重要的商业优势。以下是最重要的几点。1.促进理解借助活跃的业务词汇表,用户可以快速轻松地找到术语的定义,从而更容易理解数据集。例如,如果业务用户需要访问另一个部门的报告,其中包含部门外未知的术语,他们可以在公司的业务词汇表中查找。想象一下,如果研发中的业务用户想要访问财务记录以精简成本并进一步扩展他们的年度预算。如果他们访问财务部门持有的数据,他们可能会使用许多他们不常用的术语,从而使破译数据的任务几乎不可能完成。当这些术语标准化并列在业务词汇表中时,整个过程就会变得简单得多。2.改善部门之间的沟通有效的沟通对于数据驱动的创新至关重要。业务词汇表使与其他部门的沟通变得容易,同时避免对特定数据术语的混淆。例如,在医疗保健领域,没有用于计算医院“住院时间”的标准定义,这是每家医院在其年度资产负债表上报告的内容。当每个医院收集数据并计算住院时间时,如何汇总数据?这使得合并很难发生。一家医院可能将住院时间定义为患者从进入医院到离开医院的时间,而另一家医院可能将其定义为在特定病房或与医生第一次会面的时间。3.减少操作的复杂性和混乱业务词汇自上而下地解决操作问题。如果没有此工具,破译相互冲突的术语可能既耗时又昂贵,并且会影响到每个部门。当术语标准化时,不一致就会减少,每个人都可以更有效地访问和使用数据。这减轻了数据团队的压力,因为他们不负责制定冲突数据术语的关系和定义。反过来,从数据的角度来看,企业的日常运营也得到了简化。4.提高生产力和信任当用户信任数据时,他们更有可能使用它来做出更好、更高效的业务决策。然而,当组织中使用相互冲突的术语时,用户不仅会避免访问数据资产,而且无法理解他们实际访问的是什么。业务词汇表阐明了这些问题并减轻了数据团队的压力,因为业务用户可以通过自助服务独立访问这些信息。结果是提高了整个公司的生产力。例如,如果用户决定访问与其部门相关的客户数据并齐心协力改善服务,当他们发现数据中充满了相互矛盾的信息时,他们很可能会推迟访问。标准化术语使用户更容易掌握数据,因为他们需要的信息已明确定义。结果是使用公司数据资产进行更多创新。5.建立所有权数据治理的一个关键方面是确定数据所有者并建立数据资产的责任制。这有几个关键的后果。当您知道数据属于谁时,您可以直接联系数据保管人并更快地访问数据。当用户知道他们对自己的数据负责时,他们可以不断努力确保其质量,这最终将使整个组织受益。第三,建立数据所有权使数据资产更易于分类和组织。业务词汇表可以快速轻松地记录数据所有权并更新对此所有权状态的任何更改。如何构建业务词汇表构建业务词汇表的第一步是询问是否使用了多个术语。理想情况下,标准术语已经存在,但通常情况并非如此。当不同的部门使用不同的术语和定义来解释同一件事时,需要采用自下而上的方法。使用此模型的企业需要创建一个数据治理组。该组的功能是标准化组织中使用的术语。这是一个巨大的挑战,因为数百份报告已经使用了这些术语。治理小组必须确定术语在哪里使用、如何使用以及谁在使用它们。通过分析,可以识别和整合组织中最关键的术语。获得此信息后,您需要与这些术语的用户进行协调,以达成一致的标准定义。最后,新的标准术语和定义需要让组织中的每个人都知道,并输入业务词汇表。展望未来,无论何时添加新的数据元素,都应由将创建标准定义的治理小组签署。如果组织中没有现有的数据术语和定义,则可以采用自上而下的方法来构建业务词汇表。当没有使用冲突的术语和定义时,构建业务词汇表的过程会容易得多。需要建立一个数据治理小组,其中包括最高管理层和主要利益相关者。治理小组将确定可能在组织中使用的术语,最终确定这些术语的定义,并将它们添加到业务词汇表中。同样,这些决策需要社会化,以便组织中的每个人都知道并可以访问。每当用户希望使用特定术语时,他们应该访问业务词汇表并使用那里的标准定义。当然,理想很丰满,但现实很骨感,大部分组织都做的不是很好。可能会使用不同的术语,特别是如果公司正在经历一段并购时期。考虑自动化业务词汇工具到目前为止,实施业务词汇表的最佳方式是使用自动化数据治理工具。事实上,在一个必须(并且大多数人愿意)采用自上而下实施方法的组织中,如果不这样做,该过程几乎是不可能的。实施数据目录的最低成本远远超过手动尝试这个严格过程所花费的时间和金钱。全面的数据目录,如EllipseEdge,包括在您的组织中设置业务词汇表所需的所有工具。使用工具查找、索引和汇总组织中的所有数据资产,以便在构建业务词汇表时轻松获得所需的所有信息。采用数据目录的角色最好留给数据治理小组。DataCatalog爬取组织中的所有报告,查找术语并对其进行编目,同时还在冲突定义之间建立关系。使用数据目录,您可以快速识别组织中的核心数据所有者和利益相关者。如果没有数据目录,这个过程就不太可能奏效,因为不断创建和更新相互冲突的术语。结论如果您想在整个组织中鼓励数据驱动的决策制定,那么构建业务词汇表至关重要。通常,有多个术语和定义在使用,过程有些复杂。这就是为什么必须启动数据目录才能使进程运行更顺利的原因。创建业务词汇表的责任落在数据治理组身上。因此,选择加入该小组的人必须代表整个组织的利益相关者。实施成功的业务词汇表的最大障碍之一是个人或部门的偏见。因此,必须有一个代表组织中每个人的数据治理小组。人们的偏见往往根深蒂固。在每个参与过一个项目,尤其是参与过一些不系统工作的人的心目中,他们的经验是不可扩展的,而他却守着自己幼稚可怜的小经验。如果放不下,会对组织造成很大的伤害。为什么这样的人不愿意放弃这种偏见呢?原因是他只有那么多内容,不愿意接触新事物,害怕新事物,害怕变化。