CDA考试专区 加入小组

679个成员 340个话题 创建时间:2017-12-06

多元线性回归是在简单线性回归的基础上,增加更多的自变量,在构建多元线性回归时需对分类型变量进行特征变换,比如对学历我们可以做哑变量处理,以下代码可以将data_raw['edu clas

发表于03-12 187次查看

多元线性回归是在简单线性回归的基础上,增加更多的自变量,在构建多元线性回归时需对分类型变量进行特征变换,比如对学历我们可以做哑变量处理,以下代码可以将data_raw['edu class']转换成哑变量的是().注:pd表示pandas

A.    pd.get_dummies(data_raw['edu class'],prefix='edu').iloc[:,1:]

B.    pd.get_dummies(data_raw['edu class'],prefix='edu')

C.    pd.get_dummies(data_raw['edu class'],prefix='edu').iloc[:,:-1]

D.    pd.get_dummies(data_raw['edu class'],prefix='edu').iloc[:,0:]
参考答案: A,C
解析:参见教材7.4.2 ,页码233。本题主要考察特征处理时哑变量与独热编码的区别。哑变量就是在独热编码的基础上减少一列即可,pd.get_dummies可以将数据转换为独热编码,AC是在独热编码基础上减少了一列,因此是转换为哑变量,BD结果一样得到的是独热编码。因此题目选AC

发表回复
你还没有登录,请先 登录或 注册!
话题作者
一站式数据科学在线教育平台