数据分析认证考试介绍:https://www.cdaglobal.com/pinggu.html?utm_source=edu_cda_cn
某连续型变量的数据集存在缺失值,可以采用哪种方法处理?
A. 插值法填补
B. EM算法填补
C. 随机森林填补
D. 以上均不对
参考答案: A,B,C
解析:在处理连续型变量数据集中的缺失值时,可以考虑以下方法:插值法:可以使用线性插值、多项式插值、样条插值等方法来填补缺失值,但需要注意插值方法的选择和插值效果的评估。EM算法:EM算法是一种迭代算法,可以用来估计缺失值的概率分布,并进行填补。随机森林填补:随机森林是一种基于决策树的集成学习方法,可以用来预测缺失值并进行填补。
专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分,通过该小程序,考生可以享受更便捷的服务。
扫码加入CDA小程序,与圈内考生一同学习、交流、进步!