(资料图片仅供参考)
1、ETL工程师又叫数据库工程师。
2、ETL工程师的主要工作内容有:从事系统编程、数据库编程与设计。
3、ETL原本是作为构建数据仓库的一个环节,负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。
4、因为以前经常是将业务系统的数据取出来放到数仓中,按照星型或雪花型建模。
5、ETL是数据仓库中的非常重要的一环。
6、它是承前启后的必要的一步。
7、相对于关系数据库,数据仓库技术没有严格的数学理论基础,它更面向实际工程应用。
8、所以从工程应用的角度来考虑,按着物理数据模型的要求加载数据并对数据进行一些系列处理,处理过程与经验直接相关,同时这部分的工作直接关系数据仓库中数据的质量,从而影响到联机分析处理和数据挖掘的结果的质量。
本文到此分享完毕,希望对大家有所帮助。
X 关闭