CDA考试专区 加入小组

689个成员 358个话题 创建时间:2017-12-06

聚类算法的主要应用场景是用户分群,聚类是一种无监督方法,以下哪个不是衡量聚类效果好坏的评估方法()

发表于02-27 258次查看

聚类算法的主要应用场景是用户分群,聚类是一种无监督方法,以下哪个不是衡量聚类效果好坏的评估方法()。

A.    轮廓系数

B.    平方根标准误差

C.    ARI(调整的兰德系数)

D.    相关系数
参考答案: D
解析:参见教材9.3 ,页码336。聚类是一种无监督方法,无因变量,其效果好坏难以在建模时使用有监督模型的评估方法衡量。不过可以在建模之后,通过外部数据验证聚类效果的好坏。比如,将聚类后的标签作为“以下哪个选项更贴近您”的问题选项让用户自己填写,然后用准确度或ARI等指标进行评估。不过这样做的成本较高,也有一些低成本、精确度尚可的指标用于衡量聚类效果,其思想在于类簇内的差异尽可能小,而类间的差异尽可能大。评估聚类模型优劣的主要标准有轮廓系数、平方根标准误差、ARI等。因此只有选项D不是。

发表回复
你还没有登录,请先 登录或 注册!
话题作者
一站式数据科学在线教育平台