能力模型

CDA数据分析师人才教育品牌联合海内外知名讲师团队共同打造AI在线学习解决方案。旨在培养AI时代“十字型”技术精英。

数据思维
培养数据认知,学会从数据角度思考问题。
工程能力
精通至少一门编程语言,建立计算思维,构建工程能力。
数据技能
掌握数据采集、数据清洗、数据建模、数据可视化和模型评估、模型部署全流程数据能力。
业务经验
掌握一线企业数据分析案例。

课程计划


本课程为R语言数据分析师在线学习解决方案, 
总共包含24个学习模块,分为16周学习阶段,通关式学习考核。平均每周需要10+小时学习时间。

R数据分析专题

(学习编程工具R,掌握统计分析和数据清洗方法,提升数据可视化能力,进阶统计建模知识,强化数据分析技能。)

  • 01

    商业数据分析和R语言简介

    一、商业数据分析概述
    1. 商业数据分析本质
    2. 商业数据分析建设
    二、数据挖掘简介
    1. 基本概念
    2. 数据挖掘的技术与方法
    3. 描述性数据挖掘算法示例
    4. 预测性数据挖掘算法示例
    三、R语言简介
    1. R历史和特点
    2. R与数据分析
    3. R语言的学习资源
    4. R语言与其他工具比较/大数据时代的R
    四、R与RStudio的下载和安装
    1. R和RStudio的安装
    2. RStudio的界面介绍
    3. 在RStudio中安装包
    五、R语言实操
    1 用户价值深度挖掘案例分享
  • 02

    R语言编程基础

    一、R的基本数据类型
    1 字符
    2 数字和整数
    3 逻辑值
    二、R的基本数据结构
    1 向量
    2 矩阵
    3 数组
    4 因子
    5 列表
    6 数据框
    三、R的程序控制
    1 3种基本的程序控制结构简介
    2 顺承结构
    3 分支结构
    4 循环结构
    5 apply函数族
    四、文本处理
    1 基础文本处理
    2 stringr包快速上手
  • 03

    R进行数据读写操作

    1 利用Rstudio界面读入数据
    2 文本文件读写
    3 Excel文件读写
    4 数据库文件读写
    5 R语言实操:航空公司大文件数据集快速读入
  • 04

    R进行数据管理

    1 数据去重
    2 数据排序
    3 数据筛选
    4 数据合并
    5 数据关联
    6 数据转换
    7 数据聚合
  • 05

    R进行数据预处理

    一、数据抽样
    1 类失衡数据处理:SMOTE方法
    2 数据随机抽样
    3 数据等比例抽样
    4 用于交叉验证的样本抽样
    二、数据清洗
    1 缺失值识别
    2 缺失值模式探索
    3 缺失值处理
    4 缺失值插补
    5 异常值识别-
    6 异常值侦测案例
    三、数据变换
    1 数据分箱-cut函数详解
    2 数据标准化
    3 数据哑变量处理
    四、R语言实操
    1 游戏玩家数据探索
  • 06

    R数据可视化基础

    一、绘图三要素
    1 颜色要素
    2 文字要素
    3 点线要素
    二、低级绘图函数
    1 标题
    2 坐标轴
    3 图例
    4 网格线
    5 点
    6 文字
    7 线
    三、高级绘图函数
    1 散点图
    2 气泡图
    3 线图
    4 柱状图
    5 饼图
    6 直方图和核密度图
    7 箱线图
  • 07

    R数据可视化进阶

    一、lattice包
    1 绘图特色
    2 基本图形
    二、ggplot2包
    1 从qplot函数开始
    2 ggplot绘图
    3 ggplot2扩展包
    三、交互式绘图
    1 rCharts包图
    2 recharts包
    3 rbokeh包
    4 plotly包
    四、shiny快速上手
    1 shiny基础上手
    2 shinydashboard包上手
    3 案例:搭建数据可视化原型
  • 08

    透过现象看本质-回归分析

    一、理解回归分析
    1 简单线性回归原理及R语言实现
    2 模型诊断及预测
    3 指数变换Box-Cox方法
    4 多项式回归
    5 稳健线性回归rlm函数
    6 多元线性回归
    7 带离散变量的线性回归
    8 逐步回归,选择“最优”模型
    9 正则化方法:岭回归及Lasso回归
    二、广义线性回归之逻辑回归
    1 逻辑回归基本原理
    2 逻辑回归R语言实现
    3 混淆矩阵及ROC曲线
    4 模型评估方法:混淆矩阵、ROC曲线、KS曲线、二十分箱、PSI指标等
    三、R语言实操
    1 案例:信用卡评分模型
    2 案例:个人医疗费用预测
  • 09

    化繁为简的算法 – 降唯分析

    一、维度规约方法概述
    二、主成分分析
    1 主成分分析简介
    2 主成分分析原理
    3 主成分分析应用
    三、因子分析
    1 因子分析模型
    2 因子分析原理
    四、R语言实操
    1. 电信运营商客户使用关键因素分析
    2. 省份经济发展关键因素分析
  • 10

    预知未来的算法 - 时间序列分析

    一、时间序列分析简介
    1 时间序列基本概念
    2 时间序列特征捕捉
    二、时间序列模型介绍
    1 序列平稳的定义
    2 白噪声序列
    3 自回归模型
    4 移动平均模型
    5 自回归移动平均模型-ARMA 模型
    6 ARIMA 模型
    三、ARIMA 预测
    1 预测的评价指标
    四、BOX-JENKINS 建模流程
    1 BOX-JENKINS 建模流程
    2 平稳性检验与白噪声检验
    五、R语言实操
    1. 案例:电商渠道电脑销量的预测
  • 11

    期中项目作业

机器学习算法专题

(从商业理解到模型建立,围绕分类、回归、聚类三大数据挖掘主题,系统讲解机器学习算法和R实现,平滑过度到高级数据分析师)

  • 12

    最简单的机器学习算法 -K最近邻

    一、K最近邻简介
    1 数据前处理
    2 距离的计算
    3 预测概率的推估
    4 预测数值的推估
    三、K最近邻应用
    1 案例:电影推荐实例
    四、R语言实操
    1 案例:疾病诊断案例
    2 案例:寿险推销案例
    3 案例:汽车油耗预测案例
  • 13

    数学与科学的反映-贝叶斯网络

    一、贝式网络简介
    1 朴素贝式网络与贝式网络
    2 贝式定理及属性权重
    二、朴素贝式网络模型建置
    1 独立性假设
    2 概率为0的处理
    3 概率正规化
    4 空值处理
    5 数值型字段的处理
    三、贝式网络模型建置
    1 TAN模型原理
    四、R语言实操
    1 案例:电信宽带使用预测案例
  • 14

    分而治之的算法模型-决策树

    一、决策树简介
    1 分类树与回归树
    二、以分类树建立分类模型
    1 分类树的学习及测试阶段
    2 分类树的种类及分类树的归纳学习原理
    3 分类树的属性选择
    4 分类树的砍树方法
    5 分类树与分类规则
    三、以回归树建立分类模型
    1 回归树的归纳学习原理
    2 回归树的改进-模型树
    3 回归树的属性选择方法
    四、R语言实操
    1 医疗业乳癌预测案例
    2 医疗业糖尿病预测案例
    3 汽车业CPU效能预测案
    4 汽车业油耗预测案例
  • 15

    人工智能的底层模型-神经网络

    一、类神经网络简介
    1 生物神经网络的构造
    2 倒传递神经网络的架构
    二、以倒传递神经网络建立分类模型
    1 顺向数值传递
    2 逆向权重及偏移植修正
    3 神经网络逐步分类学习过程及CISPACE演示
    三、以倒传递神经网络建立数字预测模型
    1 神经网络逐步数字预测学习过程及CISPACE演示
    四、数据前处理
    1 数值型及类别型属性的数据前处理
    五、类神经网络总结
    1 类神经网络的优缺点及与线性回归、Logisic回归、非线型回归间的关系
    六、R语言实操
    1 案例:零售业便利超商选点案例
    2 案例:房地产房价预测案例
  • 16

    最受欢迎的智能算法-支持向量机

    一、支持向量机简介
    1 线性可分与线性不可分
    2 坐标转换
    二、支持向量机模型建置
    1 支持向量
    2 决策边界
    3 线性支持向量机
    4 错误率与最大决策边界
    5 非线性支持向量机及核函数
    三、支持向量机总结
    1 支持向量机与线性回归、类神经网络、非线型回归间的关系
    四、R语言实操
    1 案例:医疗业细胞样本分类案例
  • 17

    机器学习兵器谱的“屠龙刀”-集成学习算法

    一、集成学习简介
    1 传统学习与集成学习
    2 集成学习的分类
    二、集成学习模型建置
    1 袋装法原理
    2 提升法原理
    3 随机森林原理
    4 集成学习方法比较
    三、R语言实操
    1 案例:电信业产品交叉销售案例
    2 案例:银行业小额信贷营销案例
  • 18

    深入洞察你的客户-聚类分析和客户画像

    一、聚类分析简介
    1 聚类分析的目的
    二、聚类分析模型建置
    1 相似性/相异性的衡量
    2 聚类算法的分类
    3 阶层式与分割式聚类方法
    4 群数的判断与描述
    三、R语言实操
    1 案例:银行客户聚类案例
  • 19

    发掘购物篮规则 - 关联分析

    一、关联规则
    1 关联规则的概念
    2 关联规则的评估指标:支持度、置信度、提升度
    3 Apriori算法
    4 关联规则的生成
    二、序列模式
    1 序列模式的概念
    2 序列模式的评估指标
    3 AprioriAll 算法
    三、R语言实操
    1 案例:零售超商购物篮分析
  • 20

    自然语言处理与机器学习结合 — 文本分析

    一、文本分析简介
    1 文本分析基本概念
    2 文本分析流程
    二、文本数据前处理
    1 中文分词与中文词性标注
    2 关键词提取与N-gram字组
    3 词频与词重要性计算计算
    4 关键词关联与文字云
    三、文本分析应用与R语言实操
    1 文本分类:PO文量预测案例
    2 文本聚类:潜在舆情主题分析案例
    3 情感分析:舆情正负评分析案例
  • 21

    统计学的新兴领域-社会网络分析

    一、社会网络简介
    1 社会网络表示方式
    二、描述网络
    1 网络密度
    2 网络节点进出程度
    三、社会网络分析
    1 扩散分析理论
    2 群组分析
    3 社会相似性
    4 群组与群组成员描述(社群领袖分析)
    四、R语言实操
    1 案例:电信客户流失案例
  • 22

    人脑工作机制的模拟器 -深度学习

    一、深度学习算法简介
    1 深度学习算法的历史
    二、深度学习应用案例
    1 案例:物体侦测、语言处理
    三、卷积神经网络
    1 网络架构
    2 卷积层和池化层
    3 联结卷积层及池化层
    4 卷积神经网络可视化
    四、R语言实操
    1 物体侦测案例
  • 23

    就业技能直通车 – 大型项目实作案例

    一、零售业忠诚客户预测案例大型实际案例(数据大小超过20G)
    二、金融业银行信用卡评分项目实作
  • 24

    期末项目作业

项目案例 实战特训

有知识的地方必有案例,40余个经典案例,每周练习与项目实战,玩转R语言数据分析!
(以下节选部分案例)

业界师资

李御玺
国立台湾大学资讯工程博士
铭传大学大数据研究中心主任
铭传大学资讯工程学教授,铭传大学大数据研究中心主任,中华资料采矿协会理事 其研究领域专注于数据仓库(Data Warehousing)、数据挖掘(Data Mining)、与文本挖掘。
谢佳标
资深数据挖掘专家
微软数据科学和AI方向最有价值专家(微软MVP)
超过10年的数据挖掘与分享相关工作的经验;曾经从事过咨询、电力、游戏、金融和物流等行业,熟悉不同行业的数据特点,有丰富的利用R语言进行数据挖掘实战经验。出版书籍《R语言游戏数据分析与挖掘》、《R语言与数据挖掘》与《数据实践之美:31位大数据专家的方法、技术与思想》
美库尔
全美规模最大、私人控股的客户关系营销咨询公司
美库尔作为领先的整合客户关系营销解决方案供应商,具有成熟专业的咨询与数据分析团队。 授课讲师来自美库尔上海公司分析团队,拥有多年的企业项目经验,并会在课程中讲授成熟的成功案例,带领学生完成大型实战项目。
在线学习解决方案
使用先进强大的在线教育系统,您可根据自身时间自由学习,享有视频回放、在线作业、在线考试等一体化优质学习体验。
18周从零成长计划,平均每周学习及项目作业时间为10+小时,阶段性提升,步步为营。
全程专业的讲师助教答疑及班主任督学,更贴近每个学生的个性化学习需求。
课程对象
0基础入门或在职转行人士的修炼之路。
产品、市场、营销、财务等部门学习数据分析技能添砖加瓦。
数据分析师系统拓展提升,升职加薪。

立即领取500元优惠券

finish the course ,you will get ...

完成学习计划后,你将获得...

结课证明  certificate
含金量 来自行业领袖的认可与CDA数据分析师品牌影响力多年积淀。
用   途 可用于就业上岗、升职加薪、参与数据分析商业项目,永久有效。
就业推荐  employment
新人入职   通过毕业项目设计成果获得企业的认可,CDA就业服务团队为您解决就业难题。
转行跳槽    CDA OfferHere服务团队为您解决通往更高职业发展阶梯的需求。
会员服务  VIP service
社群活动   成为CDA俱乐部社群会员,可免费参与一切CDA线下交流活动与行业峰会。
特权资质   可参与全国各地CDA相关数据分析项目合作,业余时间实战提升,赚取酬劳。

更多问题 请看这里

  • Q: 我零基础适合学数据分析师吗?

    A: 你好,课程本来就是从零基础教起的,知识体系层层递进,旨在为学员在使用R进行数据分析领域需快速入行、直接上手,帮助学员入门到精通,掌握数据分析能力,提升业务应对技能。
  • Q: 请问这个课程是怎么上的?录播还是直播的?

    A: 你好,我们的课程是采取在线录播视频+在线直播疑难解答+线上作业考试的形式完成的。课程一旦购买后,需在课程规定的时间段内完成学习,然后提交作业和参加考试。 简言之,就是你可以自主安排时间学习教学视频;但需注意在规划的学习周期内完成作业,和参加考试。
  • Q:学习过程中有问题怎么咨询呢?

    A:你好,购买课程后,我们的班主任会邀请您加入课程班级群,并且每个人拥有自己的课程中心,可以做笔记,提问等,老师和助教都会解答大家的疑问。同时您也可以看到学习小组中其他同学提出的问题,进行学习。
  • Q:课程的学习周期是多久呢?

    A:你好,课程学习周期预计18周,每周需投入10+小时学习,某些模块的学习所花时间会更多。课程学习周期为4个月,补考期2个月。 课程有效期是远大于我们课程所需要的完成时间的,已经将大部分意外的情况包含在内,足够完成该课程。 如在有效期内毕业,视频和项目可以无限观看,如没有按时毕业,那么你的课程就失效了,需要再次付费才可继续学习(所以一定要认真学习,按时毕业!)
  • Q:学习后是否有工作推荐以及其他福利?

    A:新人入职,可以通过毕业项目设计成果获得企业的认可,CDA就业服务团队为您解决就业难题。转行跳槽者,CDA OfferHere服务团队为您解决通往更高职业发展阶梯的需求。 您还可以成为CDA俱乐部社群会员,可免费参与一切CDA线下交流活动与行业峰会。可参与全国各地CDA相关数据分析项目合作,业余时间实战提升,赚取酬劳。
  • Q:我是在职工作的,学习中每周的学习时间不够怎么办?

    A:本课程内容较为丰富,选择学习就必须要严格要求自己,才能达到相应的效果。平均每周10+小时的课程,在职人士可以这样安排:周一到周五下班后平均每天学习1个小时,周末两日集中学习剩下部分,是完全可以handle每周课程的。

填写个人信息

确认

提交成功


信息已成功提交, 3秒后返回上一页