CDA考试专区 加入小组

844个成员 593个话题 创建时间:2017-12-06

某连续型变量的数据集存在缺失值,可以采用哪种方法处理?

发表于08-02 342次查看

数据分析认证考试介绍:https://www.cdaglobal.com/pinggu.html?utm_source=edu_cda_cn

某连续型变量的数据集存在缺失值,可以采用哪种方法处理?

A.    插值法填补

B.    EM算法填补

C.    随机森林填补

D.    以上均不对
参考答案: A,B,C
解析:在处理连续型变量数据集中的缺失值时,可以考虑以下方法:插值法:可以使用线性插值、多项式插值、样条插值等方法来填补缺失值,但需要注意插值方法的选择和插值效果的评估。EM算法:EM算法是一种迭代算法,可以用来估计缺失值的概率分布,并进行填补。随机森林填补:随机森林是一种基于决策树的集成学习方法,可以用来预测缺失值并进行填补。

专为CDA数据分析认证考试报考打造的一款小程序。可以帮你快速报名考试、查成绩、查证书、查积分,通过该小程序,考生可以享受更便捷的服务。

扫码加入CDA小程序,与圈内考生一同学习、交流、进步!

发表回复
你还没有登录,请先 登录或 注册!
话题作者
一站式数据科学在线教育平台