759人加入学习
(0人评价)
CDA LEVEL 1认证考试直播正式课

难度系数:★★☆☆☆ 课程系列:CDA LEVEL 1业务数据分析师

价格 ¥ 980.00
该课程属于 CDA LEVEL 1认证考试冲刺培训与模拟 请加入后再学习
  • 机器学习:
  • 机器学习的基本流程:获取任务-获取数据-算法学习模型推荐(数据清洗缺失值、异常值、重复值)-模型评估。
  • 异常值的识别方法:聚类、箱线图
  • 消除量纲:归一化、标准化、Zsore、连续数值变量分箱、有序分类变量One-Hot编码、字符型变量数值化等。
  • 特征工程:构建、选择、提取
  • 算法大类:距离类模型、线性方程、规则类、条件概率、矩阵分解类、强学习器、集成算法等。
  • 交叉验证:
[展开全文]

缺失值处理:缺失值需要手工填入,缺失值可以从本数据源或其它数据源推导出来。可以用平均值、最大值、最小值或更复杂的概率估计代替。

异常值检测及处理:用统计分析的方法识别可能的错误值或异常值。如偏差分析、识别不遵守分布的值,通过常识性规则、业务特定规则。

重复值检测及消除方法:数据中属性值相同的记录被认为是重复记录。通过判断记录间的属性值是否相等来检测记录是否相等,相等的记录合并为一条记录。合并/清除是消重的基本方法。

[展开全文]

授课教师

课程顾问

课程特色

视频(21)
下载资料(1)