的一个目标我们的数据创建办公室数据产品支持我们的业务。这些可以简单的仪表板,AI-driven模型,或推荐引擎。如果你是新产品的数据,不知道如何开始,人们需要包括,采取什么措施,你来对地方了。在这个博客,我们将带您通过我们的上下文中创建过程数据产品我们最近部署我们的同事。
我们8步的过程
这八个步骤使成功至关重要和有价值的数据产品。
1。识别业务的问
应该总是首先确定一个数据产品过程需要从业务。除非你确定业务需求,风险资源浪费的东西不会被使用,从而增加任何价值。亚博 在线存储和计算可能会便宜,但是一个良好的数据团队的时间和注意力永远是一种稀缺资源。
2。定义数据产品负责人
数据产品负责人负责确定目标用户、何时以及如何训练数据产品的使用,以及它将如何融入业务流程。因为一个数据产品可能会揭露机密数据,数据所有者必须决定谁访问数据产品。他们还负责内部的数据共享协议数据质量。
3所示。优先考虑
对于优先级,它是与不同的利益相关者的关键,即使只是设置正确的预期水平。没有银弹确定什么产品是最重要的数据,但是数据产品负责人必须考虑到价值,成本,时间和目的的数据产品。
4所示。迭代原型,发展需求
我们开始这一步将数据产品builder (s)和所有者获得所有细节要求:需要什么样的见解,哪些数据应该/可以使用,目标受众,使用频率,当数据产品,该如何到达观众吗?
与这些需求明确,建造者可以开始画草图的数据模型和识别哪些数据可能需要进入的数据平台。
然后,不同的数据迭代产品原型与老板分享和讨论,通常导致调整需求。敏捷的工作方法可以识别未知的需求。
5。创建数据产品
首先,我们必须选择一个数据架构,可以可靠地提供产品的数据。你需要包括同事从法律和信息安全,因为你需要考虑数据隐私和数据保护。
在我们的数据产品的例子中,我们没有所需的数据在数据湖,所以我们写了管道吸入合同验收从源系统日志数据湖。(见建筑)
体系结构
6。最终的文档
一旦数据产品在生产中运行,我们必须确保数据产品是有据可查的亚愽视频Collibra数据情报平台。这意味着任何新注册的数据集目录,包括其业务上下文和相关元数据如列名称,描述,和一个数据产品和数据集之间的关系。该数据产品本身也是“shoppable”,使它容易如果其他人想要访问报告。
7所示。终结
数据和数据产品现在良好的文档记录,这意味着所有者和建设者可以坐在一起,完成该项目。在某些情况下,部门必须意识到训练使用的数据产品。
8。监控
我们的系统实现非常多才多艺,这意味着可以很容易地进行更改。需要监测的数据产品,目前在生产中,密切关注可能隐藏的错误和中断。可以计划跟进与业主,这样潜在的问题和新需求可以讨论(如果有的话)和循环重新开始。