首页 > 代码库 > ETL基础1(概念)

ETL基础1(概念)

抽取(Extract):

一般抽取过程需要连接到不同的数据源,以便为随后的步骤提供数据。这一部分看上去简单而琐碎,实际上它是 ETL 解决方案的成功实施的一个主要障碍。

转换(Transform):

任何对数据的处理过程都是转换。这些处理过程通常包括(但不限于)下面一些操作:
移动数据
根据规则验证数据
数据内容和数据结构的修改
将多个数据源的数据集成
根据处理后的数据计算派生值和聚集值


加载(Load):

将数据加载到目标系统的所有操作。
概念扩展:ELT,EII(Enterprise information integration)/Data federation

架构图:

技术分享

商业ETL

1 Informatica2 IBM DataStage3 Microsoft SSIS4 Oracle ODI

开源ETL

1 Kettle2 Talend3 CloverETL4 Ketl,Octopus …

 

ETL基础1(概念)