目录
前言
算法原理
什么是数据血缘?
为什么要进行数据血缘关系分析?
数据血缘的重要性
数据血缘分析时的注意事项
数据血缘的组成部分
数据血缘分析的模块和步骤
模块
步骤
数据血缘关系特征
如何做好数据血缘关系分析?
如何在电商场景中建设全链路数据血缘?
如何构建数据血缘底座
电商场景的血缘应用实践
数据血缘分析的应用场景和价值
应用场景
数据血缘有什么价值
价值一:破除数据质疑
价值二:数据变更影响范围快速评估
价值三:数据资产价值评估度量工具
价值四:为数据滥用加上一把 " 道德 " 之锁
前言
数据血缘分析:数据血缘(Data Lineage)指的是数据的产生、ETL处理、加工、融合、流转到最终消亡的过程,便于了解数据的来源、流动路径和使用情况。数据血缘通过节点和边表示数据对象和数据之间的关系,节点代表数据表、字段或文件,边表示数据之间的依赖关系、引用关系或转换关系。数据血缘包含四个特征:归属性、多源性、可追溯和层次性。从数据角度,厘清数据的血缘关系,即弄清楚存储位置及字段属性;从业务角度,厘清数据的血缘关系,即弄清楚业务数据的产出逻辑,数据的使用逻辑等。
算法原理
什么是数据血缘?
数据血缘(Data Lineage),又称为数据血统、数据起源、数据谱系ÿ