761人加入学习
(0人评价)
CDA LEVEL 1认证考试辅导预习视频

难度系数:★★★☆☆ 课程系列:CDA数据分析师 Level Ⅰ 业务数据分析师

价格 ¥ 399.00
该课程属于 CDA LEVEL 1认证考试冲刺培训与模拟 请加入后再学习

描述性统计

名义测量:分类属性

次序测量:量化水平(受教育程度)

连续变量测量

间距测量:

比率测量:

 

分类变量:频次/频数,百分比,累计频次

顺序变量

连续变量 -中心水平

中位数

众数

 

 

 

 

 

 

[展开全文]

查阅了一下资料,从小到大排序情况下,四分位数是指处在25%位置上的数值(称为下四分位数)和处在75%位置上的数值(称为上四分位数)

[展开全文]

检查中心水平:

spss:

内限:最大最小值,不是数据的最大最小值「上分位点加上1.5倍的内分位距(IQR)」

外限:真的变量的最大最小值

 

[展开全文]

12.21 描述性统计分析

1、计量尺度。 

a、名义测量(分类变量),数值代表符号,无顺序大小。频次/百分比/累计频次及累计百分比。

b、次序测量(顺序变量),有序分类,数字有高低。

c、连续变量测量(间距、比率)间距数值为相对,能加减,不可乘除。

四考察:

中心水平:均值;众数(出现次数最多);中位数,先排序后的中间值,数量为偶数时为[(n/2)+(n+1)/2]/2;四分位数,四等分后由中位数、上四分位数、下四分位数组成;平均数;加权平均数;几何平均数;

离散程度:异众比率(非众数比率);极差(最大-最小);四分位差(上分位数-下分位数);方差(本值与均值间的距离均值);

偏度:左偏(左边的变量线拖尾)、右偏(较普遍)

峰度:值高说明峰高。

2、统计图形:条形图;盒须图;玫瑰图

以上变量的量化水平,由低到高,低水平变量可以用于高水平统计,反之不行。

 

 

[展开全文]

1. 数据的计量尺度和具体的统计方法相关

名义测量-分类变量:数值谨代表某些分类或属性,不做高低,大小区分。如男女

次序测量-顺序变量:量化水平高于名义测量,具有一定的顺序性。如学历水平

连续变量测量-数值变量 (间距测量、比例测量)

间距测量:量化水平更高,其取值不再是类的编码,而是采用一定单位的实际测量值。可以进行加减运算,但不能进行乘除运算。

比例测量:最高级的测量等级。可以进行加减乘除,其0具有绝对意义

 

2 数据描述

分类变量:检查众数,百分比:

频次/频数、百分比、累积频次与累积百分比(仅对次序变量有意义)

顺序变量:众数,频次,百分比,百分比,累积

连续变量: 中心水平、离散程度、偏度和峰度

注意⚠️:分类变量、顺序变量、连续变量的量化水平是由低到高的,低水平变量的统计量可以用于高水平,反之则不一定

3 连续变量-中心水平:能代表“中心”概念的可选统计量有均值,中位数和众数

众数(数据量较大时有意义):出现次数最多的变量值,众数不是唯一的

中位数:排序后处于中间位置的值

样本量为奇数时,中位数为中间值

样本量为偶数是时,中位数为中间两值的均值,是一个计算值

四分位数:一组数据排序后,处于25%(下四分位数)和75%(上四分位数)位置处的数字

均值-算数平均数:样本平均数、总体平均数。

均值-加权平均数:样本加权平均,总体加权平均

均值-几何平均数:主要用于计算平均增长率,适用于比率数据的平均。

各个中心水平度量的比较:众数和中位数不易收到极端值的影响,平均数容易受到极端值影响。众数和中位数适合在非对称情况下使用。

4. 连续变量-离散程度:离散程度反映中心水平的代表性。

离散程度度量指标:

5. 连续变量-偏度:用来刻画偏态的程度

6. 连续变量-峰度:变量向两边拖尾的情况。正态分布峰度为0

7 统计图形

条形图

盒须图(箱线图):提供中位数,均值,上线分位点的信息

玫瑰图(南丁格尔玫瑰图)

 

[展开全文]

授课教师

CDA数据科学研究院Python课程讲师,AI教育项目部数据分析师。
CDA数据分析研究院 MySQL金牌讲师

课程特色

视频(42)
下载资料(1)