想象一下,一位同事登录公司的人力资源门户网站,查看他的福利并查看其他人的薪水!!什么?别担心,这不会发生,因为这些应用程序是根据多年的业务流程专业知识构建的。这些流程决定了谁可以查看和编辑那里的数据。突然间,这些数据被带入数据湖或数据仓库。如何在这里建立数据访问治理是一个巨大的挑战。组织必须保护数据,这样坏事就不会发生,并且仍然可以用来做出明智的决定。及时向正确的人提供正确数据的访问权限的机制称为数据访问治理。什么是数据访问治理?用户可以通过多种渠道访问数据。它可以通过应用程序的用户界面直接从数据库或数据仓库访问,或者在某些情况下,当数据仍在传输中时。数据访问治理使用户能够控制、保护和审计数据的使用,以维护和确保隐私,并保护组织的专有信息和知识产权。随着组织努力增加分析,以他们可以使用的格式向各种项目团队、高管和分析师提供数据至关重要。然而,在授予此访问权限时会出现许多常见的挑战,以及数据无法免费提供的复杂原因。数据平台之前的数据访问挑战孤立的数据在组织中,数据通常出于不同目的存在于各种不同的系统中。例如,一个组织可以针对不同的用例使用多个销售管理系统,例如SalesForce、SalesLoft等。当任何人需要数据时,他们不确定哪个应用程序可能拥有哪些数据,通常称为数据孤岛。如果用户不知道在哪个应用程序中查找数据,这些孤岛使用户很难找到他们需要的数据。通常,访问应用程序或仓库中的信息需要数周甚至数月的时间,这会延迟停滞的项目并减缓创新。数据量和技术限制有时应用程序只能显示一定量的数据。因此,用户界面在与应用程序交互时可能会限制数据集的视图。例如,一个应用程序可能显示数百个数据集,但特定项目的聚合数据可能会达到数百万甚至数十亿个数据集。要解决这些限制,用户必须咨询他们的数据库管理员。通常,数据库管理员必须在授予访问权限之前混淆所有机密数据,但如果没有适当的自动化流程,这个流程可能会非常耗费人力。权力斗争数据是强大的,但保持它的整洁和有序需要大量的努力、关心和思考。因此,一些应用程序所有者不愿意将他们优化的数据移交给其他团队也就不足为奇了。数据访问的权力斗争会给组织带来巨大的问题,因为在这种情况下,没有提供有关数据的支持文档和信息。这一挑战提醒我们,培养协作文化与鼓励数据访问实践同样重要。数据平台的兴起为了克服孤立的数据和技术挑战,组织开始创建数据平台,通常是数据湖或数据仓库。要填充数据湖,需要使用大数据技术从各种应用程序中移动所有数据。相反,只需将特定用例的选定关键数据移动到数据仓库中。随着组织创建数据仓库和数据湖,出现了各种访问挑战。数据平台背后的数据访问管理挑战复杂的访问管理组织可以使用数据湖或各种类似平台来聚合精选数据,以克服孤立数据和技术限制。然而,将所有应用程序的所有权限转移到数据湖并不容易。基于角色的权限是为每个应用程序设计的,通常在使用后多年迭代。就其本质而言,将所有内容组合到数据湖或数据仓库中的实用性极具挑战性。隐私合规和监管监督组织必须遵守隐私合规法规和信息安全实践,以使用户能够识别风险区域并实施额外措施来保护机密数据。许多组织外的监管机构执行针对个人数据的法律,对违规行为处以巨额罚款。这些法律要求数据保护,这是PII数据无法普遍访问的原因之一。数据可发现性挑战由于现代数据平台托管来自多个来源的大量数据,因此很难找到正确的数据源。为什么传统技术不足以保护现代数据传统上,用户通过应用程序或自助服务门户访问数据。应用程序通常具有明确定义的策略,但使用自助服务时,数据是手动管理的并移动到数据仓库或数据湖。之后,数据被划分为各种角色,并通过角色管理工具(如OKTA和ActiveDirectory)进行管理。形成的组识别具有共同访问要求的个人,以支持他们在组织中的角色表现。数据通过进入组访问,分配到组后,批量开放访问。此方法未涵盖的任何内容都将用于临时工作流程。然而,临时访问通常没有得到很好的管理。没有访问权限的用户不知道向谁询问什么。通常,IT部门有一个表格,用户可以在其中请求访问他们通过电子邮件或通过单独的应用程序搜索发现的数据集。用户使用此表单编写整个区域的访问请求,或与其他人具有相同访问权限的访问请求。现代数据访问治理通过数据治理制定的策略自动化数据访问管理的新兴趋势。现代数据访问管理方法使组织能够通过整体方法解决最持久的数据访问管理挑战。现代数据访问扩展了传统方法以实现自动化、可发现性和简化的临时工作流。以下是该过程的工作原理。您需要构建数据目录,将数据分类到不同的组中,根据分类设计访问策略,并对分类参数之外的请求使用临时工作流。通过在数据层自动应用的策略管理访问。在数据目录中集中元数据第一步是创建一个集中的数据资产目录。数据目录可以使用数据资产发现攻击轻松实现,利用元数据轻松发现而不暴露实际数据。用户可以从许多有利位置搜索和了解生态系统中的数据,并在需要时请求访问,这些访问被路由到指定的工作流以实现快速周转、简单、自动化和可扩展。数据分类的最佳实践下一步是对具有潜在挑战性的数据进行分类。首先,需要考虑许多不同的应用程序,并且在这些应用程序中有许多复杂的流程和策略。其次,分类法需要支持解决许多痛点的综合访问策略。您不仅需要浏览各种单独的应用程序,还需要解决合规性、安全性和其他问题。为了使组织能够实现这一目标,可以探索数据分类的最佳实践。第一步是水平分区数据。这一步相对容易,因为横向分类是基于各种业务职能,如销售、人力资源、市场营销和财务。如果您还没有一套命名约定,开发一个非常简单。下一步是对数据进行垂直分类。这部分更具挑战性。垂直分类旨在将数据分为各种分类类别,包括专有、未分类数据、PII、分类、超级机密和公开。由于要定义的数据太多,AI用于根据现有的水平分类和预定义属性提供垂直分类。每个类别都应该有一个确定的访问所有者,并且位置应该适合该类别。所有者负责设置访问策略的参数。基于分类的访问策略可以在数据治理委员会会议上根据强访问策略框架中的分类组制定。可能还需要工具来在数据仓库或数据湖中配置此策略框架。策略将侧重于角色及其提供的特定权限。例如,销售代表可能只能访问未分类数据的元数据,但可以完全访问分类PII的数据。您可以为组织中的不同角色编写任意数量的策略。跟踪访问策略的一种方法是制作一个访问矩阵,显示哪些角色可以与哪些类别进行交互。访问矩阵显示了组织的访问策略并增加了谁有权访问哪些数据的透明度。来自营销的计费可以访问标记为营销一般受众、营销有限、销售一般受众以及矩阵指示的任何其他分类的数据。使用数据资产映射工具,您可以减少检索数据所需的时间和精力。用于连续分类的临时工作流每天都会创建新的文件和表格,从而为组织带来更多未分类的数据。由于数量如此之多,需要一个特别的工作流程来识别这些新的表格、文件和报告,以发送给适当的人员以确认分类。结论每个组织都是不同的,并且在访问治理中处于不同的位置,具有独特的流程、策略和程序。国外其实一直在做分类分级,但是他们横向的分类是和我们的分类一致的,而纵向的分类是我们的分类。分类是按照业务形成的,分类是按照安全等级要求形成的,但是他们是通过纵横分类来表达的,之前看这个内容的时候粗心大意。
