K最近邻模型建置
一、数据的前处理
属性有Scale的问题(数值型字段极值正规化)
二、距离的计算
直角距离:每一个字段的街区距离相加
欧几里得距离:距离平方和开根号,用得频繁
三、预测概率的推估
预测此笔的目标属性值为a,概率为3/5.
K最近邻模型建置
一、数据的前处理
属性有Scale的问题(数值型字段极值正规化)
二、距离的计算
直角距离:每一个字段的街区距离相加
欧几里得距离:距离平方和开根号,用得频繁
三、预测概率的推估
预测此笔的目标属性值为a,概率为3/5.