联系我们
打电话给我们
办公室
电子邮件
美国
+1 646 893 3042
应收账款部
+1 646 974 0772
所有其他的
+32 2 793 02 19
北美:美国和加拿大
亚愽视频Collibra Inc .)
百老汇61号,31楼
美国纽约10006
EMEA:比利时
亚愽视频Collibra NV
Picardstraat 11b205,
1000布鲁塞尔-比利时
查看所有
登记进入
登记进入
  • 指示板
  • 大学
  • 数据的公民
  • 市场
  • 产品资源亚博 在线
  • 支持
  • 开发人员门户
通过注册,你就同意了Collibra亚愽视频隐私政策
我的资料
约翰。史密斯
name@company.com
数据科学家,美国
利益
云计算数据
数字转换
数据治理

数据沿袭图:信息架构师的范式转变

亚愽视频Collibra数据谱系图

2020年11月11日更新

什么是数据沿袭图?

数据沿袭图显示了数据如何在整个数据生命周期中从源传输到目标时进行转换和流动。业务沿袭图是一种交互式可视化,它显示了数据如何从数据源流向报告的概要沿袭,而不显示所有技术细节和转换。相比之下,技术数据沿袭图允许信息架构师查看转换,深入到表、列和查询级沿袭,并在数据管道中导航。

今天的数据景观以及为什么它是信息架构师的一个问题

许多公司(特别是金融服务、医疗保健等公司)的应用程序环境非常分散。从前台到后台办公系统,在多个数据仓库中,组织拥有许多本地和全球单点真相和各种各样的业务信息报告工具,从普通的MS Excel到更流行的BI工具,如Qlik和Tableau。

信息架构师(也称为数据架构师)负责使这个由数据源、系统、文件、接口、流程、数据仓库、监管报告、内部管理报告、公众股东披露和仪表板以及更多样化的大数据湖和系统组成的巨大蜘蛛网变得清晰。通常情况下,这些系统都没有足够的文档,即使有文档,它也经常过时。

云数据仓库、软件即服务、大数据和物联网肯定不会朝着将多个数据源整合和集中到单个数据位置的方向发展。相反,我们目前的蜘蛛网很可能会越来越大,因此,IAs今天面临的问题只会在明天变得更大。

IA今天如何解决这些问题——为什么它不起作用

那么,常规的信息架构师如何应对这一挑战,为这个应用程序和数据混乱创建一个漂亮的、易于导航、易于理解、易于维护、易于记录,更重要的是易于使用的架构图呢?当他们面临时间压力,要遵守严格的法规时,他们是如何做到这一点的GDPRBCBS 239、CMS等?

好吧,可能一次一个步骤,一次一个数据流。但是起点是什么呢?你从报告的最后开始吗?但谁先报告?对于金融机构来说,从您的合规报告模型(例如欧洲的)开始是有意义的数据点模型).医疗保健机构可能会从提供患者病史充分图片的系统开始。对于其他行业来说,这肯定是另一个起点。一种流行的方法是使用关键数据元素方法。

因此,首先,我们的IA将花费数天、数周甚至数月的时间,对所有这些不同系统和业务流程的不同中小企业进行调查和交谈。他将捕捉所有这些信息并将其写下来(在网络上的另一个文件里).

为什么这个不能工作

来源:使用Microsoft Visio逆向工程数据库

下一步,我们的IA将选择一个流,他将为不同系统和应用程序之间的交互设计一个详细的体系结构图,包括数据如何从这些系统流向不同的数据仓库,数据仓库如何为不同的报告工具提供数据,以及这些工具如何生成数百个报告。希望他能使用支持经典数据沿袭工具,因为市场上有很多工具可以自动完成其中的一些工作。

接下来,我们的IA将发布这些架构图,并将它们以只读PDF格式分发给不同部门的不同业务用户和分析人员。最终他会发现没有人使用它们。为什么?因为每个人都有不同的背景和不同的词汇商业语言与技术语言),对信息粒度的不同需求(管理层想要一个高层次的图景,抵押贷款专家想要一个更详细的图景,审计师想要看到一切,并能够进入细节).即使是DBA也需要了解数据上下文

不幸的是,最终,大量的时间、精力和金钱都花在了设计好看的建筑图片上,这是可以理解的,不能满足每个人的需求,很快就过时了,而且永远无法保持所需的详细信息和文档的水平。

即使建筑设计足够好,消费者也会面临传统的治理挑战:

  • 我在哪里可以找到他们?
  • 谁拥有它们?
  • 谁维护它们?
  • 谁能帮我解释一下?
  • 它们仍然是最新的吗?

显然,目前的方法行不通。

亚愽视频Collibra Data Lineage使组织能够更好地理解他们的数据

亚愽视频Collibra为所有需要赞助并最终对适当管理、记录和控制的IT环境负责的IAs、cio和cdo提供了解决方案。在Collib亚愽视频ra Data Lineage出现之前,IT花费了无数小时手动构建映射并在各种工具中跟踪数据沿袭。他们还必须保持映射是最新的,这需要大量的时间,特别是对于拥有大量分散在数据库和系统中的数据的企业。这种手动过程也可能导致不准确和人为错误。亚愽视频Collibra Data Lineage通过自动从各种源系统提取沿袭并保持最新来解决这个问题。这节省了95%的IT时间,并释放出资源来专注于战略计划。亚博 在线

如果你想参与可用性测试,beta测试,或功能头脑风暴,那么请订阅我们的用户参与计划。

在这里订阅!

相关资源亚博 在线

白皮书

通过数据谱系解锁商业机会

博客

使用自动化沿袭简化影响分析

博客

通过数据沿袭快速跟踪您的云迁移旅程

查看所有资源亚博 在线

更多像这样的故事

2020年11月12日-5最小值

亚愽视频Collibra和Databricks:将合作关系提升到一个新的水平…

阅读更多
箭头
2020年8月21日-3.最小值

信任您的数据:为什么需要受治理的数据目录

阅读更多
箭头
2020年8月7日-3.最小值

向重复的数据支出说再见吧

阅读更多
箭头