05 K最近邻算法 - CDA网校 - 100000+数据分析师首选，专注于数字化人才教育！

CDA数据科学研究院 CDA考试中心 CDA网校企业服务

CDA竞赛 CDA技术答疑 CDA俱乐部 CDA论坛

关于CDA App下载

10人加入学习

(0人评价)

05 K最近邻算法

最简单的机器学习算法 -K最近邻

价格 ¥ 699.00

学习有效期长期有效

扫一扫扫二维码继续学习二维码时效为半小时
分享
已收藏
收藏

该课程属于 CDA A + 数据分析师-第八期请加入后再学习

排序：最新笔记
- 最新笔记
- 点赞最多

Class::KNN 只能做分类型预测

neighbr::KNN 可以告诉你邻居有几个。但是它不能告诉你的机率值（probability）是多少。

做数值型预测：

训练集Train_set 需要包含序号字段和目标字段，而ClassKNN 的训练集不需要包含这两个字段。

测试集两个都一样。

建立模型：

neighbr:knn: k = 5, categorical_target=NULL,,

continuous_value 预测值

comparision_measure 计算距离的方法。

broadband:电信网络数据集。找有意愿装电信网络的顾客，用KNN的

阿武Anke · 2019-05-27 · 5.以R语言进行K最近邻数字预测模型建置及算法参数调整 0

K最近邻分类模型建置

1.根据五个条件字段预测判断目标字段（诊断结果）

建立模型：病症相似的人判断诊断结果。

K=3，三个最接近的邻居。

计算两个客户的distance

2.

将所有变量变成数值型变量（0-1之间）

训练集测试集

类别型数据("1\2\3\4")要摊平成（1000、0100、0010、0001）

阿武Anke · 2019-05-27 · 4.以R语言进行K最近邻分类模型建置及算法参数调整 0

K：通过已知顾客的兴趣电影与讨厌，推荐他未看过的电影。

通过邻居喜欢的电影来推荐给他电影

阿武Anke · 2019-05-27 · 3.电影推荐实例 0

K最近邻模型建置

一、数据的前处理

属性有Scale的问题（数值型字段极值正规化）

二、距离的计算

直角距离：每一个字段的街区距离相加

欧几里得距离：距离平方和开根号，用得频繁

三、预测概率的推估

预测此笔的目标属性值为a，概率为3/5.

阿武Anke · 2019-05-27 · 2. K最近邻模型建置 0

KNN:

可以用来预测性的分类，数字预测。

Scatter：显示浅色的购买，深色的未购买。

X年龄 ,Y收入两个输入属性。找距离最短的K个人，最相似的人。跟K相似，就能预测新进来的特征。

要选对输入属性，跟预测相关的。

数字预测：用K个人的平均值来预测

分类预测：K个人投票来预测

阿武Anke · 2019-05-27 · 1.K最近邻分类及数字预测的原理 0

CDA数据分析师周末集训营（试听）

CDA数据分析师周末集训营（试听）

10 0

【CDA俱乐部会员分享】用户洞察—助力品牌商业价值提升

【CDA俱乐部会员分享】用户洞察—助力品牌商业价值提升

5 0

Yonghong Desktop Basic 一款免费智能数据分析工具

Yonghong Desktop Basic 一款免费智能数据分析工具

15 0

【CDA俱乐部会员分享】常用分析方法：相关性分析思路

【CDA俱乐部会员分享】常用分析方法：相关性分析思路

25 0

授课教师

熊巍

统计学博士/加州大学伯克利分校

CDA等级班

课程顾问

爱吃糖的小松鼠

若水若谷

课程特色

视频(5)

下载资料(1)

作业(1)

最新学员

学员动态

catcattttt 开始学习 5.以R语言进行K最近邻数字预...

catcattttt 开始学习 4.以R语言进行K最近邻分类模...

catcattttt 开始学习 3.电影推荐实例

catcattttt 开始学习 2. K最近邻模型建置

catcattttt 开始学习 1.K最近邻分类及数字预测的原...