关于高维数据在模型建立中的处理，以下描述正确的是：

【新版上线】《CDA模拟题（2025）》https://edu.cda.cn/goods/show/...

【新版上线】《CDA一级教材》试读已上线:https://edu.cda.cn/goods/show...

【免费活动】AI x 产品设计思维工作坊（2025 年 8 月 31 日开营）https://www...

CDA数据科学研究院 CDA考试中心 CAIE认证 CDA网校企业服务

CDA社区

CDA竞赛 CDA技术答疑 CDA俱乐部 CDA论坛

关于CDA App下载

CDA考试专区加入小组

1162个成员 594个话题创建时间：2017-12-06

发表于2024-02-07 2586次查看

关于高维数据在模型建立中的处理，以下描述正确的是：

A. 在分类模型中通常不需要进行变量选择和降维，因为算法可以处理成千上万个变量。

B. 聚类模型中剔除不相关变量主要依赖于算法而不是分析师的经验和维度分析。

C. 特征选择指的是从相关性较强的变量中提取代表性的变量，还可以做多项式旋转会增加变量。

D. 在数据挖掘的实践中，最佳实践是建立一个包含所有变量的大模型来处理不同情况。
参考答案： C
解析：特征选择是从相关性较强的变量中挑选代表性的变量进行建模，选项A忽视了变量选择和降维的重要性，选项B错误地指出聚类模型完全依赖算法，而实际上聚类模型在剔除不相关变量时依赖分析师的经验和维度分析。选项D与最佳实践相反，因为最佳实践建议是针对不同情况建立不同的模型，而不是一个包含所有变量的大模型。

只看楼主倒序查看

发表回复

你还没有登录，请先登录或注册！

(大小不能超过 2 MB，文件类型支持png ,jpg ,gif ,doc ,xls ,txt ,rar ,zip .)

文件名	描述	金币	操作

话题作者

CDA网校

一站式数据科学在线教育平台

新加组员

热门小组

CDA考试专区

1162 594

题库专区

527 12

CDA会员俱乐部

418 142

CDA考试专区加入小组