聚类算法的主要应用场景是用户分群，聚类是一种无监督方法，以下哪个不是衡量聚类效果好坏的评估方法（）

CDA数据科学研究院 CDA考试中心 CDA网校企业服务

CDA社区

CDA竞赛 CDA技术答疑 CDA俱乐部 CDA论坛

关于CDA App下载

CDA考试专区加入小组

689个成员 358个话题创建时间：2017-12-06

发表于02-27 258次查看

聚类算法的主要应用场景是用户分群，聚类是一种无监督方法，以下哪个不是衡量聚类效果好坏的评估方法（）。

A. 轮廓系数

B. 平方根标准误差

C. ARI(调整的兰德系数)

D. 相关系数
参考答案： D
解析：参见教材9.3 ，页码336。聚类是一种无监督方法，无因变量，其效果好坏难以在建模时使用有监督模型的评估方法衡量。不过可以在建模之后，通过外部数据验证聚类效果的好坏。比如，将聚类后的标签作为“以下哪个选项更贴近您”的问题选项让用户自己填写，然后用准确度或ARI等指标进行评估。不过这样做的成本较高，也有一些低成本、精确度尚可的指标用于衡量聚类效果，其思想在于类簇内的差异尽可能小，而类间的差异尽可能大。评估聚类模型优劣的主要标准有轮廓系数、平方根标准误差、ARI等。因此只有选项D不是。

只看楼主倒序查看

发表回复

你还没有登录，请先登录或注册！

(大小不能超过 2 MB，文件类型支持png ,jpg ,gif ,doc ,xls ,txt ,rar ,zip .)