难度系数:★★☆☆☆ 课程系列:CDA LEVEL 1业务数据分析师
这章明显讲得不如上面
缺失值处理:缺失值需要手工填入,缺失值可以从本数据源或其它数据源推导出来。可以用平均值、最大值、最小值或更复杂的概率估计代替。
异常值检测及处理:用统计分析的方法识别可能的错误值或异常值。如偏差分析、识别不遵守分布的值,通过常识性规则、业务特定规则。
重复值检测及消除方法:数据中属性值相同的记录被认为是重复记录。通过判断记录间的属性值是否相等来检测记录是否相等,相等的记录合并为一条记录。合并/清除是消重的基本方法。
CDA人工智能社区
工作时间:9:00-19:00
陈老师:13077998983
邮箱: edu_cda_cn@foxmail.com