首页 / R语言机器学习工程师
  • 3人
  • 分享
    收藏

R语言机器学习工程师

难度系数:★★★☆☆ 课程系列:CDA Level Ⅱ 数据分析师

价格 4999.00
学习有效期 730天 (随到随学)

简介

课程简介

强强联合打造稀缺商业数据分析课程。本课程将世界客户关系管理方面的领导者美库尔公司 (Merkle Inc)在专业管理咨询方面的几十年的经验积累与CDA数据分析研究院的教学理念与方法相结合,归纳了在商业智能系统设计、客户画像、精准营销、生命周期价值管理等主题的课程。为实践者提供全面的使用R进行商业数据分析的解决方案。 本课程以案例为主线,结合开源R工具,全面讲解了客户生命周期管理中涉及的主要机器学习主题。而且注重业务与算法的深入结合,在轻松的氛围内体会算法的奇妙之处。

学习目标

  1. 学会高级数据分析及机器学习算法知识
  2. 掌握最流行的开源数据挖掘软件之一R
  3. 熟知整个商业数据挖掘框架、流程与思路
  4. 了解前沿技术,增强业务与技术对接能力

学习对象和基础

  1. 各行业数据分析、机器学习从业者
  2. 金融、电信、零售、医学等各行业业务数据分析人员
  3. 政府事业单位大数据及数据挖掘项目人员
  4. 数据挖掘岗位就业、提拔涨薪、技能优化等从业人员
  5. 对数据挖掘感兴趣的各界人员

岗位职责

  1. 深入理解企业的业务需求,构建涵盖用户行为,用户群组、特征标签等企业级用户大数据模型,并完成项目实施落地。
  2. 负责编制算法设计文档,根据不同的应用场景进行适当的算法选型、仿真测试、结论验证、算法迭代、模型优化,并完成数据分析结论的可视化报告输出。
  3. 对企业数据保持充分理解和高度敏感,积极思考并拓展数据应用场景,负责数据应用方案拟定、执行落地、效能评估、模型优化,持续加强数据应用能力并丰富应用场景。
  4. 探索并挖掘企业经营过程中的客观规律,形成企业经营的经验知识库,依据这些规律协助经营决策、指导产品优化、助力业务增长、提升服务水平,以此加强数据驱动能力,实现企业数字化转型。

任职要求

  1.  计算机、数学、统计学相关专业,硕士及以上学历;有3年以上数据挖掘或算法研发的相关经验。
  2. 熟练使用SQL,熟练使用Mysql/Oracle/Hive中的至少一种数据库工具;熟悉主流的大数据技术,比如Spark、Hbase、Storm、Flink、NoSQL等。
  3. 熟悉R、Python、Java中至少一种开发语言;熟悉SPSS、SAS等数据分析工具;熟练使用TensorFlow、Pytorch、sparkMLlib、flinkML等主流机器学习框架。
  4. 有扎实的数据结构和算法功底,精通关联、聚类、回归、预测等算法的原理与应用,能够针对不同的业务需求使用不同的算法模型实现业务诉求,能够独立进行数据建模和参数调优。
  5. 具有金融、电信行业用户画像、精准营销等项目研发实施经验优先;具有电商行业智能推荐算法研发实施经验优先。

目标人群

  1. 对机器学习感兴趣的人员
  2. 对数据科学领域感兴趣的人员
  3. 对数据挖掘感兴趣的人员
  4. 对数据挖掘感兴趣算法研究的人员

课程内容

第一章:R语言编程与统计分析

  1. R语言入门与安装
  2. R的数据类型与数据结构
  3. R的程序控制
  4. R的函数与数据导入
  5. 变量的分类
  6. 变量统计特征探索
  7. 变量的可视化探索
  8. 参数估计
  9. 假设检验与单样本T检验
  10. 两样本T检验
  11. 方差分析方法

第二章:市场调研与数据处理技术(基于R)

  1. 市场调研方法与类型
  2. 定性调研与定量调研
  3. 数据抽样技术
  4. 分析调研数据
  5. 调研结构的交流与审查
  6. 数据的获取方法
  7. 数据清理方法
  8. 数据变换
  9. 数据规约

第三章:回归分析预测

  1. 回归分析的理论基础
  2. 回归分析模型的构建
  3. 回归的建模
  4. 回归建模的结果解读
  5. 回归诊断
  6. 异常值处理
  7. 多重共线性处理
  8. 自相关处理
  9. 异方差性处理
  10. 挑选最佳模型

第四章:客户画像

  1. 聚类方法简介
  2. 相似性 相异性的衡量
  3. 聚类算法的分类
  4. 阶层式聚类方法
  5. 分割式聚类方法
  6. 群数的判断
  7. 群特征描述
  8. 以R语言进行阶层式聚类分析及算法参数调整
  9. 以R语言进行分割式聚类分析及算法参数调整
  10. 聚类分析部分作业

第五章:K最近邻算法

  1. K最近邻分类及数字预测的原理
  2. K最近邻模型建置
  3. K最近邻应用
  4. 以R语言进行K最近邻分类模型建置及算法参数调整
  5. 以R语言进行K最近邻数字预测模型建置及算法参数调整
  6. KNN部分作业

第六章:贝叶斯网络

  1. 贝式网络简介
  2. 朴素贝式网络模型建置
  3. 贝式网络模型建置-TAN模型原理
  4. R语言实作案例:银行信用评分卡案例
  5. 以R语言进行朴素贝式网络模型建置及算法参数调整
  6. 以R语言进行贝式网络模型建置及算法参数调整
  7. 数学与科学的反映- 贝式网络作业

第七章:决策树算法模型

  1. 分类树的学习及测试阶段
  2. 分类树的种类及分类树的归纳学习原理
  3. 分类树的属性选择
  4. 分类树的砍树方法
  5. 分类树与分类规则
  6. 回归树的归纳学习原理
  7. 回归树的改进-模型树
  8. 回归树的属性选择方法
  9. 以R语言进行分类树模型建置及算法参数调整
  10. 以R语言进行回归树模型建置及算法参数调整
  11. 分而治之的算法模型-决策树-作业

第八章:神经网络算法

  1. 生物神经网络的构造
  2. 倒传递神经网络的架构
  3. 以倒传递神经网络建立分类模型
  4. 顺向数值传递
  5. 逆向权重及偏移植修正
  6. 神经网络逐步分类学习过程及CISPACE演示
  7. 以倒传递神经网络建立数字预测模型
  8. 神经网络逐步数字预测学习过程及CISPACE演示
  9. 数值型及类别型属性的数据前处理
  10. 类神经网络的优缺点及与线性回归...间的关系
  11. 人工智能的底层模型- 神经网络作业
  12. 以R语言进行分类模型建置及算法参数调整
  13. 以R语言进行数字预测模型建置及算法参数调整

第九章:罗吉斯回归

  1. 罗吉斯回归简介_以罗吉斯回归建立分类模型_数据前处理
  2. 罗吉斯回归逐步分类学习过程及CISPACE演示
  3. 以R语言进行分类模型建置及算法参数调整
  4. 应用最广的模型之一-罗吉斯回归-作业

第十章:支持向量机

  1. 线性可分与线性不可分_坐标转换
  2. 支持向量_决策边界_线性支持向量机
  3. 错误率与最大决策边界_非线性支持向量机及核函数_支持向量机与线性
  4. 以R语言进行分类模型建置及算法参数调整
  5. 以R语言进行数字预测模型建置及算法参数调整
  6. 最受欢迎的智能算法-支持向量机作业
  7. R数据挖掘答疑-李御玺
  8. R语言答疑-李御玺

第十一章:时间序列分析

  1. 时间序列分析简介
  2. 时间序列分析简介1
  3. 时间序列分析简介2
  4. 时间序列模型介绍
  5. 时间序列模型介绍-序列平稳
  6. 时间序列模型介绍-白噪声序列
  7. 时间序列模型介绍-自回归模型
  8. 时间序列模型介绍-移动平均模型
  9. 时间序列模型介绍_ARMA 模型
  10. 时间序列模型介绍-ARIMA模型
  11. ARIMA 预测
  12. BOX-JENKINS 建模流程
  13. 时间序列R程序--理论应用
  14. 时间序列R程序理论应用-白噪声序列
  15. 时间序列R程序理论应用-自回归模型
  16. 时间序列R程序理论应用-ARMA模型
  17. 时间序列R程序理论应用-ARIMA模型
  18. 时间序列R程序理论应用- BOX-JENKINS 建模流程
  19. 时间序列R程序--企业案例:电商渠道电脑销量的预测

第十二章:时间序列分析

  1. 关联规则概念与原理
  2. 本课程所需要准备的软件与配置
  3. 推荐系统的基本概念与分类
  4. 如何评价一个推荐系统
  5. 购物篮分析与关联规则
  6. 什么是购物篮分析--原理与基本概念
  7. 关联规则挖掘算法与其优缺点
  8. 案例:家居用品商店的营销策略
  9. 关联规则可视化
  10. 相似性推荐与系统过滤
  11. 如何收集用户偏好
  12. 如何计算相似度
  13. 相似性与协同过滤
  14. 相似性和协同过滤--5.案例
  15. 基于内容的推荐与混合推荐
  16. 基于矩阵分解(SVD)的推荐算法
  17. SVD矩阵分解--原理
  18. SVD矩阵分解--案例

第十三章:集成学习算法

  1. 集成学习简介
  2. 集成学习模型建置
  3. 以R语言进行袋装法模型建置及算法参数调整
  4. 以R语言进行提升法模型建置及算法参数调整
  5. 以R语言进行随机森林模型建置及算法参数调整
  6. 机器学习兵器谱的屠龙刀-集成学习算法作业

第十四章:文本分析

  1. 文本分析基本概念_文本分析流程
  2. 中文分词与中文词性标注_关键词提取与N-gram字组
  3. 文件分类1
  4. 文件分类2
  5. 文本聚类
  6. 情感分析
  7. 自然语言处理与机器学习结合-文本分析作业

第十五章:社会网络分析

  1. 社会网络表示方式_网络密度_网络节点进出程度
  2. 扩散分析_扩散分析理论
  3. 群组分析_社会相似性_分割群组_群组与群组成员描述
  4. 以R语言进行扩散分析模型建置、选择模型及算法参数调整
  5. 以R语言进行群组分析模型建置、选择模型及算法参数调整
  6. 统计学的新兴领域—社会网络分析作业

第十六章:深度学习

  1. 深度学习算法的历史_物体侦测、语言处理
  2. 网络架构1
  3. 网络架构2
  4. 卷积层_池化层_联结卷积层及池化层
  5. 以R语言进行DNN手写数字模型建置、选择模型及算法参数调整
  6. 以R语言进行CNN手写数字模型建置、选择模型及算法参数调整
  7. 人脑工作机制的模拟器—深度学习作业

第十七章:大型项目实作案例

  1. 策划某跨国电脑公司的营销活动
  2. 商业上建模流程
  3. 技术上建模流程
  4. 逻辑回归模型1
  5. 逻辑回归模型2
  6. 逻辑回归模型3
  7. 逻辑回归模型4
  8. 线性回归模型1
  9. 线性回归模型2
  10. 两阶段的应用
  11. 零售业忠诚客户预测案例大型实际案例(数据大小超过20G)
  12. 零售业忠诚客户预测项目
  13. 数据集表格及字段意义说明_数据集表格及字段描述性统计
  14. 数据的一些观察_数据的检察_解题思路的说明_衍生性字段的产生
  15. 效能评估方式的说明
  16. 以R语言进行分类模型建置、选择模型及算法参数调整
  17. 以R语言进行分类模型建置、选择模型及算法参数调整
  18. 以R语言进行分类模型建置、选择模型及算法参数调整
  19. 零售业项目实作案例作业
  20. 金融业银行信用卡评分项目实作
  21. 评分卡1 业务理解
  22. 评分卡2 数据理解
  23. 评分卡3 数据准备
  24. 评分卡4 变量粗筛
  25. 评分卡5 变量细筛
  26. 评分卡6 建模
  27. 评分卡7 模型评估
  28. 评分卡8 评分转换
  29. 评分卡9 模型监测
  30. 评分卡10 代码演示

学习目录

学员评价

暂无评价哦~
授课老师

CDA网校

一站式数据科学在线教育平台

电子版《CDA一级教材》

扫码获取CDA教材,累计已有10万+在读~ 

猜你想学

大数据在企业中的应用

0.00

1天搞定Python进阶课程-科学计算库Numpy

9.90

CDA A+数据分析师学位课程-公开课

0.00

众享区块链大讲堂

299.00

零基础入门Python数据清洗与机器学习

0.00

数据分析师(初级)

899.00