CERTIFIED DATA ANALYST LEVEL I EXAMINATION OUTLINE
CDA(Certified Data Analyst),即“CDA 数据分析师”,是在数字经济大背景和人工智能时代趋势下,面向全行业的专业技能认证,旨在提升全球用户数字技能,助力企业数字化转型,推动行业数字化发展。「CDA 人才考核标准」是面向全行业数据相关岗位的一套科学化、专业化、国际化的人才技能准则,CDA 考试大纲规定并明确了数据分析师认证考试的具体范围、内容和知识点,考生可按照大纲要求进行相关知识的学习,获取技能,成为专业人才。
考试方式:线下考试,上机答题
考试题型:客观选择题(单选 85 题+多选 20 题+内容相关 8 题+案例分析 12 题)
考试时间:120 分钟
考试成绩:分为 A、B、C、D 四个层级,A、B、C 为通过考试,D 为不通过
考试要求:闭卷上机答题,请勿携带与考试无关的用品。
针对不同知识,掌握程度的要求分为【领会】、【熟知】、【应用】三个级别,考生应按照不同知识要求进行学习。
1. 领会:考生能够了解规定的知识点,并能够了解规定知识点的内涵与外延,了解其内容要点之间的区别与联系,并能做出正确的阐述、解释和说明。
2. 熟知:考生须掌握知识的要点,并能够正确理解和记忆相关理论方法,能够根据不同要求,做出逻辑严密的解释、说明和阐述。此部分为考试的重点部分。
3. 应用:考生须学会将知识点落地实践,并能够使用常用数据分析工具(如 Excel, BI, SQL 等)进行实操。能够根据具体要求,给出问题的具体实施流程和策略。
1.数据分析的时代背景
2.企业的数字化转型
3.企业的数据需求与数据分析需求
4.数据分析的基本概念
1.商业数据分析体系构建
2.商业数据分析总体流程
3. 商业数据分析实践
1.战略与业务数据分析的基本概念辨析
2.战略分析方法
3.业务数据分析的步骤
4.报告呈现
1.数据分析的基础范式
2.数据分析的六种分析方法
3.统计制图(数据可视化)
1.表格结构数据特征
2.表格结构数据类型、获取、引用、查询、计算与三个重要功能
3.表结构数据特征
4.表结构数据获取、加工与使用
1.数据库相关概念
2.创建表或视图
3.数据查询语言
1.统计基本概念
2.数据的描述性统计
3.参数估计
4.简单时间序列分析
1.多表透视分析逻辑
2.多维数据模型
3.透视分析方法
1.指标的基本概念
2.通用指标与场景指标
3.指标体系
4.指标体系搭建方法
1. 标签体系设计原理
2. 标签的加工方式
3. 用户画像
1.数据治理的驱动因素
2.数据治理体系
3.如何开展数据治理
1.数据分类
2.数据建模
3.数据仓库体系和 ETL
1.指标与指标体系管理的基础概念
2.指标体系的搭建方法与步骤
当前时代的数据分析特点
需要数据分析企业的特点
数据分析在企业中的作用
企业商业模式的转变
感知型企业
企业各个层面对数据的需求
企业各个层面对数据分析的需求
企业业务流程对数据分析的需求
数据的基本概念及其分类
数据模型的基本概念及其分类
数据分析的基本概念及其分类
EDIT 思维框架
平衡记分卡(BSC)
不同视角下的企业业务分析
业务角度的商业分析流程
技术角度的商业分析流程
能站在不同视角,选择合适的分析方法与工具,分析企业业务,并输出分析结果
战略数据分析的概念
业务数据分析的概念
战略与业务数据分析的异同
桌面研究与调查研究的异同
行业分析的方法和流程
竞品分析的方法和流程
调查研究的方法和流程
定性分析方法和定量分析方法
业务数据分析角色参与者
业务数据分析的工作流程
定性归因法
指标归因法
A / B 测试
能够使用归因分析方法进行问题定位和归因分析,将归因分析结论和实际商业逻辑相结合,能够有效地从数据中提取有价值的业务洞察。
战略分析报告的模块
业务分析报告的模块
根据数据分析的结果,汇总写成逻辑通顺、内容完整、格式规范的分析报告,为企业建言献策。
了解本体论和流程化的概念
分类思维的一般步骤
链式思维的一般步骤
相关思维的基本概念
波士顿矩阵
RFM 模型
用户忠诚度模型
同期群分析
广告用户行为漏斗分析
销售行为漏斗
AARRR 模型
趋势分析
对比分析
构成分析
分布分析
关系分析
流向分析
常用的统计图表类型
统计制图的数据加工方法
对数据进行处理,已达到制图的要求
根据分析意图对数据进行深度加工
确定分析类型
选择合适的图表类型,绘制并进行展示
表格结构数据概念
表格结构数据处理工具
表格结构数据特征
表格结构数据获取方法
表格结构数据类型(数值、字符、逻辑值、日期)
单元格区域的特征
表格结构数据的单元格引用方法
表格结构数据的查询方法
表格结构数据的公式和常用函数(文本、统计、日期、逻辑)
表格结构数据透视表的使用
表格结构数据查询和引用(Vlookup)的使用
表格结构数据条件格式的使用
理解主键的意义
理解维度及度量的意义
理解表结构数据特征
理解表结构数据与表格结构数据差异
表结构数据获取渠道及获取方法
表结构数据的多表合并逻辑
表结构数据汇总逻辑
理解缺失值产生的原因及处理逻辑
应用 E-R 图梳理数据表间的关系
计算两表横向合并汇总值
利用 BI 工具进行常规 ETL 操作
数据库分类
SQL 语言的功能
数据库、数据库管理系统与 SQL 之间的关系
表和视图的区别
创建表
创建视图
视图的优缺点
SQL 语句的基本语法和书写规则
常见子句关键字的功能
选取需要的列
过滤重复的行
筛选符合条件的行
对查询结果排序
在查询结果中创建新列
在查询中实现分组汇总和筛选
多表横向连接查询
子查询
多表纵向合并查询
统计学含义及其应用
统计学的基本概念:数据、总体、样本、参数、变量
常用分布:正态分布、 两点分布
描述性统计图表:直方图、柱状图、散点图、箱型图、折线图、饼图
集中趋势的描述:众数、中位数、分位数、平均数
离散程度的描述:极差、平方差、方差、标准差、离散系数(变异系数)
分布形态的描述:偏态、峰态
自由度的相关概念
数据标准化值的相关概念
能够应用统计指标对业务数据进行恰当的数据特征描述,针对数据描述特征阐述业务问题、探索问题原因、提出解决问题方法
点估计与区间估计的基本概念
区间估计中置信区间的计算
趋势分析与简单时间序列预测的使用场景
时间序列数据的不同组成部分:趋势效应部分、季节效应部分、随机效应部分
时间序列数据的不同组成部分的组合方法:加法组合、乘法组合
能够识别时间序列数据是否有季节成分
识别时间序列数据的趋势并进行数据调整
根据业务需求,对趋势预测结果进行解读
应用 EXCEL 或 PowerBI 等工具进行时间序列的预测。
熟知透视分析的作用价值
理解多表环境下的多维数据模型的创建逻辑及透视分析
能够通过表的字段理解该表所代表的业务维度及业务意义
能够通过表的业务意义倒推回表中字段的主键、维度、度量属性
了解使用多维数据模型的业务意义
熟知多维数据模型的创建方法
熟知多维数据模型中连接方式与汇总结果间的关系
熟知多维数据模型下汇总维度与筛选维度间的差异及各自的适用场景
熟知维度模型中星型模型,雪花模型及星座模型的应用场景
能够通过思维模型梳理业务线索,搜集完整的多表数据。
能够根据业务需求,按照正确的连接关系创建完整、准确、全面的多维数据模型。
根据多维数据模型推导出可探索的业务问题范围,实现业务洞察。
多维透视分析的价值及意义
熟知基本透视规则:求和、求平均、计数、最大最小值
熟知条件筛选透视规则:多条件透视计算、不同层级维度透视计算
熟知基本对比计算规则:均比、基准比、标准比、百分比、差异百分比
熟知时间维度下的透视计算规则:不同时间段、不同时间位移量下的透视计算规则
能够根据业务需求选择创建正确的透视规则
能够将透视规则应用在正确的多维模型下描述业务问题
能够通过透视结果理解业务问题
透视结果与预期结果不符时,能够检查、追踪问题原因
使用BI工具计算常见度量值,搭建数据分析看板
了解指标、维度、维度项、指标值、指标体系、指标数据等基本概念
指标值的计算规则、统计口径、维度项的粒度
求和类指标计算方法:常规求和、累计求和
计数类指标计算方法:常规计数、非重复计数
比较类指标计算方法:均比、定基比、同环比
按企业产品类型划分的指标
按职能划分的指标:财务分析指标、客户分析指标
指标体系的意义和作用
指标技术加工角度分类:根指标(基础指标)、组合指标和派生指标
指标业务层级角度分类:结果指标、过程指标
指标库
维度库
业务指标体系设计框架“OSM 模型”
北极星指标
指标拆解方法:全链漏斗式、因子分解式
业务指标的分层:战略层、管理层、运营层、操作层
使用树状分类法,进行树状层级拆解,绘制树状结构图,搭建树状指标体系。
区分标签和指标的概念
精准营销的概念
消费者决策进程
用户分群发展历程
分层标签和分群标签
马斯洛需求层次理论
用户标签和用户画像的关系
基于数据类型的角度制作标签
基于时态角度制作标签
基于加工角度制作标签
用户画像的概念
标签在数据科学的作用
用户细分的方法
用户分群的精准营销
用户画像在 EDIT 模型中的作用和应用
数据治理的价值
数据治理驱动的内部因素
数据治理驱动的外部因素
数据治理体系的框架的作用
数据治理域主要内容
数据管理域主要内容
数据应用域主要内容
如何保证数据治理的有效开展
数据、信息、知识的概念定义
数据分类的方法
数据管理视角数据的类别
数据架构的基本概念、数据建模概念、数据仓库体系和 ETL 概念
数据建模的方法、流程
关系数据模型与维度数据模型的定义、差异、使用场景
数据模型的层次
能够根据业务需求选择正确的数据模型建模
数据仓库与 ETL 之间的关系
熟知 OLAP、OLTP 系统定义及差异
熟知数据仓库的四大特点
熟知 ETL 要解决的问题
能够结合业务需求设计可落地的 ETL 方案
指标数据元和指标数据标准
指标数据质量评价维度
指标体系的生命周期
指标体系的管理体系
自上而下法(Top-Down)
自下而上法(Bottom-Up)
掌握企业级指标体系全生命周期建设步骤:找指标、理指标、管指标、用指标,通过单点看全局,通过全局解决单点的问题。