CDA考试专区 加入小组

869个成员 593个话题 创建时间:2017-12-06

当对多个连续型变量进行主成分分析(PCA)以降维并且简化数据时,以下哪项原则通常被用来决定应当保留多少个主成分?

发表于02-07 704次查看

当对多个连续型变量进行主成分分析(PCA)以降维并且简化数据时,以下哪项原则通常被用来决定应当保留多少个主成分?

A.    保留的主成分个数应当使得累积方差解释比例至少达到50%。

B.    保留的主成分个数应当使得每个主成分的特征值大于平均值。

C.    保留的主成分个数应当使得每个主成分的特征值大于1,并且这些主成分的累积方差解释比例达到总体的80%~90%。

D.    只保留第一个主成分,因为它携带了最多的信息量。
参考答案: C
解析:当进行主成分分析时,通常采用的原则是每个保留的主成分的特征值应该大于1,这表示每个主成分本身就能解释比单个原始变量更多的数据变异。此外,我们还希望选取的前几个主成分能够累积解释原数据的大部分变异,具体来说,是80%到90%的变异。选项A中提到的50%可能太低,不足以充分表达原始数据的结构;选项B的“大于平均值”并不是一个标准的选择准则;选项D忽略了后续主成分可能携带的重要信息。因此,C选项是正确的。

发表回复
你还没有登录,请先 登录或 注册!
话题作者
一站式数据科学在线教育平台