数据分析认证考试介绍:https://www.cdaglobal.com/pinggu.html?utm_source=edu_cda_cn
企业数据仓库里面的数据一般是由业务数据经过ETL技术处理后来的,以下关于ETL的说法错误的是
A. ETL过程中的主要环节是数据抽取、数据转换和加工、数据流转
B. 增量数据抽取过程中,提取增量数据的方法有通过时间戳、建立触发器、全表比对、日志比对等
C. 常用ETL工具包括datastage,Informatica等
D. 数据清洗需要对维度表中的重复数据进行处理
参考答案: A
解析:A: ETL是Extract-Transform-Load的缩写,数据抽取(Extract)、转换(Transform)、装载(Load)的过程。数据流转不属于ETL的主要环节。所以A错误,B: 增量数据ETL中捕获数据变化的方法有:触发器方式、时间戳方式、全表删除插入方式、全表比对方式、日志表方式、系统日志分析方式等。C:datastage,Informatica属于常见的ETL工具,除此之外Spark等通用计算引擎也可用于ETL开发。D:数据清洗中需要删除无用的重复数据,维度表中的重复维度就是需要删除的。
专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分,通过该小程序,考生可以享受更便捷的服务。
扫码加入CDA小程序,与圈内考生一同学习、交流、进步!