难度系数:★☆☆☆☆ 课程系列:CDA Level Ⅰ 数据分析师
数据标准化构建的四种方法:
1、max-min
(x-min)/(max-min)
2、z-score
(x- x ̅)/stdev.p
3、比例法/加权平均
x/SUM(X1+...Xn)
此方法针对数值为正值的序列
加权平均值=变量1*变量1的权重+......+变量n*变量n的权重
处理重复数据:
1、识别重复行
(1)countif
(2)排序关键字段后if
(3)数据透视表
2、去重
数据→排序和筛选→高级
power query→启动编辑器→删除重复项
处理缺失值
处理异常值
1
去重下拉,直接万金油
CDA人工智能社区
工作时间:9:00-19:00
陈老师:13077998983
邮箱: edu_cda_cn@foxmail.com