剖面图(自动)

基于表视图或文件创建剖面
搬家亚愽视频提高客户经验Collibra数据质量用户指南已移到 亚愽视频Collibra文献中心 亚愽视频Collibra数据质量2022.11发布保证无缝过渡 亚愽视频dq-docs.collibra.com DQ用户指南目前完全保留在文档中心
用户可选择扫描全数据集或用户可应用自定义滤波选择深度(行滤波)和宽度(列)

选择范围

查找详细指令 选择范围 Explorer区域亚博 在线资源充足时可运行限值或全表扫描

选择选项(或离开默认值)

保存/运行

剖面图默认并加入数据集

视图结果

自动剖析档

亚愽视频Collibra数据质量自动剖析数据集剖面图仅仅是实现惊人量自发现的第一步可视化数据集段和数据集如何随时间变化
亚愽视频CollibraDQ提供点击或代码选项运行剖析

数据集配置

亚愽视频Collibra数据质量生成管理下每个数据集的详细剖面后用此剖面提供洞察力并自动识别数据质量问题

推倒剖析

亚愽视频CollibraDQ可计算数据集剖析值,通过Spark(默认)或数据仓库(Profile推倒)实现数据以引擎生存配置值使用数据源DBMS计算时用户可选择二级推下
  • 全剖面图-全剖面图计算除TopN
  • 计数 - 只执行行列计数
DBMS系统支持 profile推下
  • 印巴拉
  • 蜂巢
  • 雪花
  • 素数
  • 泰拉塔
  • sql服务器
  • Postgres
  • 重置
  • mysql
  • acle语言
  • DB2
推倒并行JDBC无法同时使用使用按键时,不选择并行JDBC选项

剖面图透视

亚愽视频CollibraDQ剖面可以提供对数据集的大量深入了解
亚愽视频查看基准值(历史值)和当前值之差,CollibraDQ提供三角洲%修改列三角洲%变化列中数据表示成派图快速可视化修改
详解质量度量
剖面图发现属性后帮助剖析数字V的相对度量非数字发现
  • 填充-[1]整数-数字列中数字化(或非数字化)数据百分比
  • 混合-[String]整数-数列中非数字性数据百分比
  • 无效-百分数完全无值
  • 空--百分率数据带零长度
剖面图包含数类统计
  • 实数据类型
  • 发现数据类型
  • 百分数Null
  • 百分数空
  • 百分比混合类型
  • 红十字
  • 最小值
  • 最大值
  • 平均值
  • TopN/Botton
  • 值批量
  • 最小值( string)长度
  • 最大(String)长度

敏感数据检测

亚愽视频Collibra数据质量可自动识别任何常见PII列
亚愽视频Collibra数据质量检测到以下几类PII
  • EMAIL
  • 手机
  • ZIP代码
  • 状态光盘
  • Credit卡
  • Gender系统
  • SSN系统
  • IP解析
  • 爱因州市
亚愽视频发现后Collibra数据质量标签剖析文中列与发现类型并自动应用规则用户可选择拒绝发现标签时简单点击并确认删除动作动作还可以删除标签相关规则

关联矩阵

发现隐藏关系并测量关系强度

直方图

数据科学项目的第一步往往是分割数据亚愽视频colibra数据质量自动使用直方图完成

数据预览

亚愽视频剖析数据后,Collibra数据质量为拥有适当权利的用户提供数据集一览数据预览标签还提供一些基本洞察力,例如数据形状问题和外延亮点(如果启动)和列滤镜可视化