数据访问治理的一半

如果您是Collibra亚愽视频的客户,您很可能已经在建立广泛的数据访问治理计划方面取得了重大进展,即使这不是您的最初意图。

这个过程中有许多里程碑,包括获得数据资产所在位置的全景视图,并确保数据管理员正确地管理它们。

可伸缩数据访问治理基础的三个组件

可伸缩的数据访问治理所需的基础由三个组件组成:数据分类、数据目录和数据治理。

数据分类是数据发现过程中不可分割的一部分。它可以帮助您发现并分类生态系统中的敏感数据。

另一方面,数据目录创建了敏感数据的统一视图,跨越了数据孤岛。这确保您在组织范围内保护数据。

数据治理帮助团队理解应该如何使用数据以及如何保护数据的上下文。它还帮助您理解在创建策略时应该参与的涉众。

建立这个基础的挑战是什么?

所以你决定是时候授予更广泛的数据访问和保护了?在开始策略创建和维护之前,您是否完成了必要的准备工作,以确保可以部署可伸缩的数据访问治理程序?以下是组织在基础阶段需要考虑的三个关键挑战:

  • 不确定从哪里开始:组织通常希望对所有内容应用保护。对于需要保护的数据缺乏优先级,而且在处理数据时,安全性和业务目标之间可能不一致。当应用通用策略来保护数据免受所有潜在的伤害和暴露时,我们也限制了数据的可用性和对业务的价值。
  • 不确定数据的范围:数据领导者可能知道一些数据驻留在哪里。但是在启动一个大型项目来管理对组织数据的访问之前,我们需要问自己是否知道我们预览的所有数据的数量和范围。
  • 不清楚谁该负责:没有一个公式可以确保最好的政策得到落实。策略决策应该是策略管理员(了解要维护的数据标准)和域所有者(最了解他们的数据)之间的协作过程。没有此协作过程确定的策略可能是僵化的,并阻止业务实现其数据的全部价值。

用于数据访问治理的数据分类

什么是自动数据分类?

自动数据分类是一个ml驱动的过程,它基于数据本身的子集分析和标记数据的内容,帮助用户了解他们拥有哪些类型的数据以及与数据相关的风险。

数据分类自动为数据的各个列分配“数据类”或标签,以确定该列中包含什么类型的数据。例如,这些标签可以是“姓名”、“地址”和“电子邮件”。

哪些分类输出对数据访问治理实现有用?

数据分类引擎可以产生不同类型的输出。为了帮助创建策略,生成和利用以下输出是最有用的。

分类标签

标签标识列的内容,并将其分配给预定义的类。标签有时被称为类别,有时只是类。

  • 语义标签:列标头的通用描述符,使用从已批准的数据类库中选择的赋值。在本例中," email_address "和" C_email "列标题都将被分配为" email "标签。
  • 敏感标签:指示数据列中内容的敏感性级别的标签。敏感性标签的例子包括“私密”、“公开”和“受限”。
  • 自定义标签:您可以选择创建自定义标签,以交付更细粒度的数据控制。例如,可以为数据列分配监管标签,表明内容是否属于“GDPR”的范围,还是应该被视为“PI”。

上下文分类

上下文提供关于标签下可能无法捕获的列的附加信息。

  • 业务范围:该信息表明哪个部门拥有数据。例子包括金融、销售和零售业务。
  • 实体上下文:此信息描述数据所涉及的数据主体类别,例如客户、员工或第三方供应商。

分类层次结构

层次结构描述了数据的结构,以及数据的不同列如何在该结构下链接。为了使这个想法简单,我们在这个层次结构中引入了两个层:父层和子层。

  • 父层:这将使用与其他相关列共享的指定值将列分类到顶层。例如生物特征数据、金融数据、支付卡信息。
  • 子层:这将使用反映该列的各个内容的指定值,将列划分为最细粒度的层。“信用卡号”、“持卡人姓名”和“安全码”都滚到“支付卡信息”的顶层。

为什么自动数据分类很重要?

  • 理解数据列的内容:您了解您拥有哪些数据以及数据的位置,这为您提供了如何制定策略的指导。
  • 了解你所拥有的资料的风险:与数据相关的风险告诉您应该如何处理数据,这意味着您可以决定简单地限制对数据的访问或对数据列应用屏蔽。
  • 数据的自动化和规模化保护:除了保护现有数据外,所有传入的数据都应该自动分类。分类将应用于新数据,确保它在现有策略下进行治理,而无需在您的端为传入数据创建和更新策略进行额外工作。

用于数据访问治理的数据目录

什么是数据目录?

数据目录对公司的所有数据资产进行编目和组织。它使用元数据来帮助数据团队在整个生态系统中发现、理解和管理数据。

为什么数据目录很重要?

数据目录可以帮助数据领导者轻松地找到、理解和信任他们的数据。它提供了横跨整个数据领域的全面视图,并加快了实现数据访问治理的时间。

  • 横跨整个数据领域的全面视图:数据目录允许数据领导者在整个数据环境中查看数据。这使得数据领导者能够知道他们的敏感数据存储在哪里,这样他们就可以专注于保护这些数据。你只能保护你知道的数据。
  • 加快实施数据访问治理的时间:全面的数据视图使数据领导者能够无缝地识别敏感数据,并快速部署策略来保护这些数据。

用于数据访问治理的数据治理

什么是数据治理?

数据治理是管理数据的过程,以便将数据用作符合组织策略的一致、可信和安全资产。数据团队应该有一个单一的平台来管理数据,弥合部门竖井,以提供一致的理解和正确的数据处理。

为什么数据治理很重要?

数据治理非常重要,因为它确保了所有数据资产之间的信任。它为策略提供上下文,帮助数据领导者识别数据的所有者和相关利益相关者,并定义数据定义。

  • 提供策略上下文:记录并告知其他人应该如何使用数据,哪些组或第三方应该访问数据,以及哪些数据适用哪些保留政策。
  • 识别数据所有者和相关利益相关者:指定数据资产的所有者、数据管理员、主题专家或其他涉众。使用联邦治理模型,您将拥有负责管理总体策略的策略管理员。您还将在不同的部门(如市场营销、销售和财务)有领域负责人,他们负责并知道如何最好地从数据中提取价值。
  • 定义数据定义:什么是敏感数据?什么是财务数据?能够定义并就组成某类数据的内容达成一致,有助于确保组织能够对整个组织的数据应用适当和一致的控制。即使创建了新的数据类别或采用了新的数据解释方法,也可以保持数据的保护和效用

结论

为了确保可伸缩的数据访问治理,您必须通过在整个组织中实现数据分类、数据目录和数据治理来奠定基础。

数据分类和数据发现帮助我们发现数据生态系统中的敏感数据,然后对其进行分类。它提供了上下文,以帮助我们创建更细致的策略,从而实现对数据的快速和合规访问。

除了数据分类之外,数据目录还创建了敏感数据的统一视图,可以跨越数据孤岛,因此我们可以在组织范围内保护数据。它还帮助我们知道什么是优先考虑的。我们知道表的数量,也知道它们的位置。这意味着我们可以部署策略来解决这些问题。

数据治理帮助我们了解谁是数据的管理者和领域所有者。它告诉我们在创建影响特定团队数据的政策时应该与谁合作。

分类、目录和治理相结合成为数据访问治理实现的基础。我们的许多客户已经建立了这个基础。他们已经奠定了基础,现在我们有知识来制定更明智、更有效的政策。

相关资源亚博 在线

博客

雪花用Collibra 亚愽视频Protect介绍

视频/网络研讨会

在企业数据目录中寻找什么

电子书

Collibra数据智能亚愽视频云介绍

查看所有资源亚博 在线

更多像这样的故事

2022年12月15日3.最小值

数据窗口:介绍Collibra数据市场亚愽视频

阅读更多
箭头
2022年12月14日-3.最小值

理解和推动采用新的Collibra使用分析亚愽视频

阅读更多
箭头
2022年12月13日-5最小值

升级:雪花+ Collibra:扩大平台治理范围…亚愽视频…

阅读更多
箭头