课时6.8.9没太听懂
"表格"结构数据:基于单元格的计算
“表”结构数据:基于整个字段的计算
Min-Max标准化:(原始值-极小值)/(极大值-极小值)
使用标准分进行标准化:标准分=(原始分-平均分)/标准差
标准差函数:STDEV.P(总体),STDEV.S(样本)
加权平均值:变量1*权重1+...
百分比值:(当前单元格值-最小值)/(最大值-最小值);=(当前单元格-min())/(max()-min())
百分点值:percentile()
数据透视图:基于数据透视表生成的图表,数据透视图由“筛选器”“图例”“轴”以及“值”构成,用户可以通过鼠标拖拽来快速更改图表的显示结果。数据透视图中没有Excel基本图表类型中的“散点图”及“气泡图”。
数据源:结构化数据(数据库数据、外部文件)、非结构化数据(图片、音视频)
数据分析方法:业务数据分析(描述性分析、数据透视、可视化图表;SQL、Excel)、数据挖掘(协同过滤、分类分析、关联分析、聚类分析;Python、SPSS、SAS、R)、大数据分析(Hadoop大数据平台、数据整理、建模、分析与展示;Hadoop、SPark)
数据分析:是将数据转换为知识、智慧的手段;数据-信息-知识/智慧
业务数据分析流程:业务理解、数据收集、数据处理、数据分析、数据展现、成果报告
Power BI:Power Query(数据处理)、Power View(仪表盘工具)、Power Map(地图工具)、Power Pivot(透视工具)。
基本数据处理方法
一、处理重复数据
1、COUNTIF
2、IF
3、利用数据透视表
二、处理不完整数据
三、处理异常值
四、数据分组
五、转换变量类型
六、数据标准化
七、设置变量权重
方法:
一、使用公式
二、使用基本功能
三、使用POWER BI插件
类型:
一、名义型
二、有序型
三、连续型
主要数据类型:
一、文本型:A、数据
二、整数型:10、1、-9
三、小数型:1.01、1、9
四、布尔型:TRUE\FALSE
五、日期型:长日期、短日期
六、其他类型:会计、特殊
常用函数
一、数学函数
1、奇函数
=IF(MOD(K2,2)=0
LEFT ----YEAR(TODAY)
MID-------
RIGHT
日期:
DATE------DATE(年月日)
WEEKDAY-----WEEKDAY(DATE
INDEX-------(LOOKUP-VALUE/LOOKUP-ARRAY/MATCH-TYPE)
MATCH------(ARRAY,ROW-NUM,COLUMM-MUM)
HLOOKUP-(VALUE,TBLE,ARRAY,ROW,INDEX,NUM,RANG,LOOKUP)
VLOOKUP--
ISERROR
IF
SUMPRODUCT
SUM
SUMIF
SUMPRODUCT
COUNTIF
REPT
二、文本
——基本图表。
一、柱形图(基于分类):比较(1个)
二、柱形图(基于时间):比较(1个)
三、条形图:比较(1个)
四、折线图:比较(1个)
五、饼图:比较(1个)
六、散点图:分布、联系(2个)
七、气泡图:联系(3个)
八、雷达图:比较(多个)
方法:选取区域内容,插入,图表(多种)
设计:(添加图表元素,有多种)
图表属性
函数公式基础:
由等号、函数表达式、操作符、参数、返回值五部分组成。
返回值=函数表达式 参数 操作符 参数
一、OFFSET函数
reference:参考基准单元格位置
rows:行位移(向下、向上)
cols:列位移(向左、向右)
height:行高
width:列宽
方法:=offset($, , , ,)
二、嵌套函数
文本型、数值型、布尔型、数组
文本型:文字
数值型:
布尔型:T\F代表
数组:一串数的组合
公式:IF(ISERROR(参考单元格),"ERROR","OK")
条件格式与迷你图
新建格式规则,“公式的值”设置格式公式:
1、开始,条件格式,新建格式规则,使用公式确定要设置的单元格,按照需要的格子内容,然后把“¥”锁定符号关掉。
2、偶数格式公式:
=MOD(ROW(),2)=0,再选择颜色
3、图标集。
红、黄、绿灯三色图标集
规则:公式:=average(
数字:如果是2倍,*2
百分比的由来:
(当前单元格值-最小值)/(最大值-最小值)
单元格用“¥锁定
百分点:
4、数据条、色阶。
数据条:最大的值条最长,总计最大的放在最下面。
色阶:最大的值用最深的,总计最大的放在最下面
5、迷你图。(加深)
代表选内容中的一行数据。
方法:插入,折线图,柱形图,位置范围(需要的格子里)
二、(4)EXCEL数据透视表与切片器
表:由“选器”、“行、列标签”、“值”构成
1、易操作性
2、可计算性:
3、数据处理方法多: