数据情报2020年5月15日·6分钟读

数据智能的12步:第3部分

推特

电子邮件

联系和信誉:为数据智能之旅建立数据注册和需求经济

我们的任务是评估为什么一家公司会经历高客户流失率。我们如何推动一个准确的、可操作的、低成本的结果，从而防止公司未来的流失?我们踏上了数据智能之旅，共12步。在这个由5部分组成的系列的第3部分中，我们将介绍数据智能之旅的下两个步骤:

步骤7 -数据匹配:一种无需标识的方法，可以链接和匹配企业中最重要的数据，而不需要集成、复杂的匹配监督或数据管理，可以作为一种服务，在需要时自动组装360°视图
步骤8 -创意管理:消费者和供应商之间的元数据、关系和归属的沟通方法，灌输游戏化技术，创造性地建立优先级和重要性

我们的旅程还在继续……

Cliff是一名业务分析师，他的任务是试图找出为什么他的公司正在经历一个令人担忧的客户流失趋势。考虑到涉及的人数众多，公司必须迅速采取行动，但他们必须准确地发现根本原因，并制定有效的行动计划。不作为是不好的。错误的行为更糟糕。答案就在数据中。但是什么数据呢?

这是基础数据情报。可信数据属于每一个知识工作者，并且应该以这样一种方式在组织生态系统中流动，让业务专业人员以他们需要和选择的任何方式进行连接、沟通和协作。我们跟随Cliff一起寻找这个现实问题的解决方案。亚愽体育app下载

首先，我们建立了基金会对于一个战略数据情报计划．这让我们在货架上摆满了高度组织的方式和易于使用的上下文．这是专业人员可以使用可信数据的地方

进行研究
分析模式
发现问题和机遇
与同事和伙伴合作
确保安全性和遵从性

但让我们记住我们的目标受众，Cliff，因此支撑这段旅程的购物体验隐喻必须尊重用户的技能和能力。让我们继续我们的旅程。

步骤7:数据匹配

克利夫准备把东西放进他或她的购物车，但有些事情一直困扰着他。他希望通过分析来最好地理解客户流失，这需要对客户群进行有意义的细分。Cliff已经确定客户年龄、位置(邮政编码)和性别是最好地理解、预测和防止流失的最重要的部分。但当克里夫对比数据集的时候步骤6:分析和评分，他注意到最好的数据集客户的年龄SFA申请，用于位置最好的数据集来自Fulfillment，而for性别它是Web门户配置文件和首选项数据集。这三个数据集中没有一个适合所有三个分割属性。Cliff面临着一个两难的境地——为了得到至少部分的答案，我愿意牺牲什么?

如果这个困境的答案是，你不需要牺牲!我们可以为您的生态系统中的任何客户提供最好的数据，您无需为此做任何额外的事情“但是怎么做呢?”

带你回到步骤2和4:建立数据域模型和编目，我们使用机器学习和指导管理发现、注册并将您的物理数据集分类到逻辑域模型。对于每个适用的域模型(例如，客户、员工、产品、位置等)，我们事先知道有助于断言任何域的标识的逻辑和物理属性。例如，我们预先知道姓名、地址、电子邮件、DOB等属性，这些属性在唯一标识客户时非常有用。

有了这些知识，就很有可能自动生成指令，以绝对精确的方式从每个数据集中提取个人身份信息，而不需要构建自定义集成。就像发现元数据、沿袭和配置文件信息一样，您可以在Edge提取这些信息，以便保护隐私和管理风险。

有了从主机数据库和Edge内存中提取的个人身份信息，您现在必须解决使数据匹配成为挑战的最常见问题

不一致
缺失的数据
错误
困惑

例如，在数据集中发现First Name和Last Name的互换或昵称的使用(例如，Bob vs Robert)并不少见。或者找到出生日期互换的月份和日期。这些类型的挑战会破坏确定性匹配系统，并导致假阴性(未检测到匹配)。您可能倾向于放松匹配规则，这可能会导致误报(过度匹配)。对提取的数据进行标准化处理，以考虑这些类型的现实问题，将对控制假阴性和假阳性的能力产生重大影响。

我们的目标是隐私和风险的设计，我们不能像主数据管理解决方案所要求的那样，将这些数据复制到中央位置进行处理。亚愽体育app下载但是为了实现Cliff 360客户的目标，我们需要能够比较和匹配来自数据领域所有四个角落的记录。实现这些相互竞争的目标的一个非常聪明的方法是，在传输到中心位置之前，对已经在Edge标准化的个人身份信息(PII)进行去识别(匿名化)。这种去识别的信息不能重新识别，否则将无法支持隐私和风险目标。但是，如果一个给定的Customer记录的足够多的这些去标识的属性能够与来自另一个数据库或系统的另一个记录进行足够多的匹配，那么我们就可以有把握地断言，来自不同数据库的两个或多个记录实际上是同一个Customer。

在Cliff的情况下，如果我们能够匹配和链接来自SFA、Fulfillment和Web Portal的客户记录，我们就可以使用来自这3个数据库中的任何一个的年龄、邮政编码和性别，而不需要进行非常复杂和昂贵的项目，如MDM或数据质量增强项目。我们已经为克里夫打开了大门，这样他就可以在没有妥协或牺牲的情况下运作。

其好处是不可否认的:这种数据匹配甚至超越了高级的主数据管理解决方案，因为它不需要集成，不需要算法开发和测试，也不需要数据管理。亚愽体育app下载Cliff对他或她可用的数据的丰富性和可信度感到非常满意。

第八步:想法管理

在购物过程中，Cliff很可能会发现货架上的东西少了，缺乏分析所需的质量，或者没有足够的信息来帮助指导客观的决策。如果Cliff的观察结果丢失，随后的用户遇到同样的限制或挫折，那将是一种遗憾。Cliff当然可以在工作环境中分享他或她的观察或建议，类似于软件客户可能使用像Aha!提交增强请求。但是每一个提供内容的人都可能有100个cliff(消费者)。你可能很快就会被这些建议淹没。

如果有一种方法可以让Cliff在整个公司范围内传达他的建议的相对重要性呢?想象Cliff在一段时间内拥有有限数量的虚拟货币。

假设Cliff这一年有1000个虚拟货币。当Cliff输入一个建议时，他可以将剩余硬币的一定比例用于该建议，花费的硬币越多，对Cliff来说就越重要。想象一下，供应商正在监控这些建议。当一个看似相对简单且容易解决的建议包含大量虚拟货币时，供应商更有可能接受这项工作，而不是一个复杂且耗时且只有少量货币的任务。

这样，你就融入了市场经济的影响，并使用了一种非常自然的方法来确定优先级和重要性。(供应商的)排行榜可以用来显示那些完成了大量高价值工作的供应商。虚拟货币可以用来在你的组织内交换有价值的东西——认可、金钱、有形商品、假期等。

很明显，我们正在从以供应为中心的模式(建立商店和库存货架)转向以需求为中心的模式(购物者或明或暗地决定优先级)。当Cliff发现与您的数据智能平台合作的价值时，他会经常回来。Cliff会告诉他的同事，口碑和其他促销活动将会推动更多的需求和采用。市场经济动态将推动您的组织进入一个良性的改进循环，在此过程中，见解会产生更多的见解，在您意识到这一点之前，您的组织将做出数据驱动的决策，这将成为一种习惯，生产率将飙升。

但是在我们讲得太超前之前，让我们记住Cliff并不编写代码。克利夫现在只有一些精心构思的指令。如果我们真的想以一种受治理和安全的方式使数据民主化，我们需要为Cliff提供一种简单的方法来请求和接收他或她购物车中的商品。在本系列的第4部分中，我们将了解如何实现这一目标。请继续关注。