12步骤数据情报:第4部分

自动化装配:分布式查询、访问管理和360度视图的数据情报的旅程

我们的任务是评估一个公司为什么经历高速率的客户流失。我们如何推动的结果,是准确的,可操作的和低努力所以公司可以防止未来的生产?我们在一个数据情报的旅程在12个步骤。在该系列文章的第4部分中,我们将介绍接下来的三个步骤的数据情报的旅程:

  • 步骤9 -服务代理:分布式和联邦查询和提取引擎,把要求和授权数据从选定的数据库和系统和传输加密的数据到指定的位置
  • 步骤10 -访问管理:身份和访问管理政策的实施(3)步提取的数据之前交付和消费
  • 步骤11 -合成:制造过程中两个或两个以上的提取(客户)记录确定(在步骤# 7)一样(人)到一个黄金之前交付和消费记录

我们的旅程还在继续

悬崖,业务分析师,负责试图找出为什么他的公司正在经历一场关于高客户流失的趋势。考虑到大量的股份,该公司必须迅速行动,但他们必须准确地发现问题的根源,开出一个行动计划。不作为是坏的。但是错误的行动是更糟。答案是在数据。但是什么数据呢?

这是的基础数据情报。可信数据属于每个知识工作者,应该通过组织生态系统以这样一种方式,让商务人士联系,沟通和协作的需要和选择。我们与悬崖,他试图找到解决这一实际问题。亚愽体育app下载

首先,我们建立了基金会对于一个战略情报数据计划。导致我们在商店的货架上高度有组织的方式和易于使用的上下文。然后我们准备从一个主供应需求关注的焦点在我们打开大门数码商店。这就是专业人士可以使用可信的数据:

  • 进行研究
  • 分析模式
  • 确定问题和机会
  • 与同事和合作伙伴
  • 确保安全性和遵从性

但是,让我们记住我们的目标受众,悬崖,因此支撑这段旅程的购物体验的隐喻必须尊重用户的技能和能力。让我们继续我们的旅程。

步骤9:服务代理

反射在步骤4 - 6 (第2部分),我们护送悬崖通过发现和选择过程的数据集的最理想的生产分析。悬崖被引导通过数据情报图,面对选择,高度有组织的(分类),提供了一个清晰的指示每个来自何处,任何可能发生在旅途中,或使用它去了别的什么地方血统转换),可用的选项和详细的差异选择(分析得分)。悬崖能够快速和可靠的填满他的购物车最适合他的分析的数据集。现在悬崖愿继续他的自助购物体验的数据通过一个自动化的检测过程。

每个数据集的悬崖的购物车与数据所有者,整个人在一个组织或部门负责建立和执行政策的访问和使用数据集。悬崖的要求,作为结帐过程的一部分,必须伴随着一个或多个数据集的目的和使用、访问和使用日期以及他如何想提货。有三个主要方法为悬崖提货请求的数据集:

  • ——一个临时的方法访问和使用数据虚拟化(物理副本不是存储)技术。这个交付方法最符合分析报告和训练算法
  • 租赁——一个定时的方法提取和加载数据到一个分析数据存储库为随后的访问和使用。这个交付方法最符合用例需要结合数据没有在目录和/或一个分析平台,不支持虚拟化
  • ——这一举动的无限复制数据集的提取和加载数据到一个分析数据存储库为随后的访问和使用。这个交付方法最符合遗留环境数据迁移到新一代的环境

一旦悬崖提供检查所需的所有信息,请求被路由到每个数据所有者与数据集要求悬崖。

数据所有者,利用嵌入式工作流功能,可以选择将他们的数据使用协议(DUA)手动或自动决策。如果数据所有者的政策要求悬崖承认DUA初次使用或每使用,无论手动或自动决定,悬崖将看到一个任务队列等在他的作品中承认,在适当的时候。毕竟审批和确认,现在悬崖授权检查。

伟大的利用所有的元数据和映射从编目和分类的行为物理数据集(步骤4),数据智能平台可以生成所有所需的精确的指令(查询语言)有效地提取数据,悬崖被授权使用物理数据所在的边缘。如果请求的多个数据集的悬崖和它们驻留在物理上不同的数据中心,这些指令将被适当的边缘拉组件来执行。每个边缘组件将连接,进行身份验证和从底层数据库中提取数据或系统使用精确的指令生成的数据智能平台。这个提取信息可以加密和传输请求的目标(例如,应用云计算,弹性容器或租赁S3文件夹装入BigQuery)。

每组查询指令,每一个数据集,将运行完成;提供所请求的数据请求的目的地。当两个或两个以上的数据集要求,每个数据集都将被交付到相同的目的地(如弹性容器,S3文件夹,等等)和熔融成规范格式(步骤2)保留其原产地标记/出处。通过这种方式,所有的数据汇集了股票的格式和逻辑或规范模型的形状无论如何不同的或独特的每个基础数据集。转眼间chango,悬崖他所要求的点击一个按钮,因为投资你的基金会大楼,商店的货架上和组织为任何人提供易于使用的线索。

第十步:访问管理

我们可以交付提取信息悬崖之前,它是至关重要的,以确保身份和访问管理规则是坚持和监管的原则问题,如果适当,执行。什么时候可以处理数据访问政策非常简单,萃取时(例如,社会安全号码必须蒙面或删除)没有意识到任何其他请求的数据,它可以而且应该执行作为提取指令的一部分,它是最有效的。然而,大多数通过直接提取数据(例如,JDBC)连接,从而绕过任何可能使用单点登录(SSO)和基于角色的访问控制(RBAC)在应用程序级别。此外,一些执法之前无法实现或数据提取的时候。例如,一些属性本身(例如,姓名或出生日期)不考虑个人身份信息(PII);然而,与一个或多个属性(例如,姓+出生日期),可以成为PII。因此,请求和可用性的身份属性必须首先确定数据提取后,才可以访问政策执行。总之,访问管理政策应该应用于最有效和适当的时间过程中,(1)指令的生成可能排除特定属性或表,(2)数据可以完全或部分蒙面作为提取的一部分,或(3)评估所有提取属性的记录可能导致取消和/或额外的屏蔽属性。

访问管理的目的在这12步旅程是过滤,删除面具或以其他方式强制执行访问政策与治理、描述数据使用协议和隐私风险策略建立在之前的步骤中,看到悬崖在购物和检测过程。执行访问管理后,剩余的数据集包括悬崖的一切要求和授权,所有没有编写任何复杂的集成代码,问有人在它将任务添加到他们的日益增长的要做的事情列表,创建一个新的数据,等。成功的悬崖峭壁上,但另一个步骤…

步骤11:合成

如果数据集悬崖请求包括重复相同(例如,客户重复两个或两个以上次从相同的数据集)和/或悬崖请求包含重叠的多个数据集(例如,两个或两个以上的数据集具有相同的客户),悬崖的分析可能会扭曲和误导。悬崖需要多个引用相同的技术整合到一个单一的、金色的记录来支持他的分析。的过程中减少多个引用相同的真实的东西,叫做合成

在步骤7 -数据匹配,我们自动匹配和链接的记录和数据集表示同样的事情,就像客户。在此步骤中,我们将演示的可怕的力量如何使用这些链接集提供真正值得信赖的,高质量的数据。有三种不同的知识记录在两个不同的数据集是相同的客户,悬崖可以定义合成规则,告知如何建立一个单一的解决方案,金色的记录进行分析。

一些例子可能是:

  • 所有的独特的价值观
  • 可信的源
  • 最常见的断言值
  • 最近宣称的价值

对于每个属性返回的数据集,当有多个记录包含一个非空值的属性,悬崖可以建立一个规则或规则选择的值(s)将代表金纪录。如果属性映射到参考管理代码,其生存价值(s)可以转化为共享分类逻辑属性。

最后,悬崖上有一个绝对的原始数据集的分析。不编码。不乞求帮助。没有人为的限制或障碍。周围没有风险或工作”的规则。“只是最好的数据公司提供授权使用的悬崖。这确实是一个民主化的数据集。

这是一个正在进行的系列的四个部分。如果你错过了他们,看看第1部分,第2部分第3部分

只有一部分留在系列,请回来看到悬崖如何消费和使用这个原始数据集来回答他的调查在生产。

了解更多关于数据情报

相关资源亚博 在线

博客

12步骤数据情报:第1部分

博客

12步骤数据情报:
第2部分

博客

12步骤数据情报:第3部分

视频/网络研讨会

亚愽视频Collibra数据智能云

查看所有资源亚博 在线

更多的故事

2022年12月20日—2最小值

聪明、清洁、更快:AWS + Collibra帮助政府作出更好的亚愽视频决策

阅读更多
箭头
2022年12月19日-3最小值

2023年五大数据的预测

阅读更多
箭头
2022年12月15日3最小值

一个窗口数据:引入Collibra数据市场亚愽视频

阅读更多
箭头