聚类算法的主要应用场景是用户分群,聚类是一种无监督方法,以下哪个不是衡量聚类效果好坏的评估方法()。
A. 轮廓系数
B. 平方根标准误差
C. ARI(调整的兰德系数)
D. 相关系数
参考答案: D
解析:参见教材9.3 ,页码336。聚类是一种无监督方法,无因变量,其效果好坏难以在建模时使用有监督模型的评估方法衡量。不过可以在建模之后,通过外部数据验证聚类效果的好坏。比如,将聚类后的标签作为“以下哪个选项更贴近您”的问题选项让用户自己填写,然后用准确度或ARI等指标进行评估。不过这样做的成本较高,也有一些低成本、精确度尚可的指标用于衡量聚类效果,其思想在于类簇内的差异尽可能小,而类间的差异尽可能大。评估聚类模型优劣的主要标准有轮廓系数、平方根标准误差、ARI等。因此只有选项D不是。