关于高维数据在模型建立中的处理,以下描述正确的是:
A. 在分类模型中通常不需要进行变量选择和降维,因为算法可以处理成千上万个变量。
B. 聚类模型中剔除不相关变量主要依赖于算法而不是分析师的经验和维度分析。
C. 特征选择指的是从相关性较强的变量中提取代表性的变量,还可以做多项式旋转会增加变量。
D. 在数据挖掘的实践中,最佳实践是建立一个包含所有变量的大模型来处理不同情况。
参考答案: C
解析:特征选择是从相关性较强的变量中挑选代表性的变量进行建模,选项A忽视了变量选择和降维的重要性,选项B错误地指出聚类模型完全依赖算法,而实际上聚类模型在剔除不相关变量时依赖分析师的经验和维度分析。选项D与最佳实践相反,因为最佳实践建议是针对不同情况建立不同的模型,而不是一个包含所有变量的大模型。