多元线性回归是在简单线性回归的基础上,增加更多的自变量,在构建多元线性回归时需对分类型变量进行特征变换,比如对学历我们可以做哑变量处理,以下代码可以将data_raw['edu class']转换成哑变量的是().注:pd表示pandas
A. pd.get_dummies(data_raw['edu class'],prefix='edu').iloc[:,1:]
B. pd.get_dummies(data_raw['edu class'],prefix='edu')
C. pd.get_dummies(data_raw['edu class'],prefix='edu').iloc[:,:-1]
D. pd.get_dummies(data_raw['edu class'],prefix='edu').iloc[:,0:]
参考答案: A,C
解析:参见教材7.4.2 ,页码233。本题主要考察特征处理时哑变量与独热编码的区别。哑变量就是在独热编码的基础上减少一列即可,pd.get_dummies可以将数据转换为独热编码,AC是在独热编码基础上减少了一列,因此是转换为哑变量,BD结果一样得到的是独热编码。因此题目选AC