课程简介
大数据分析是指对规模巨大的数据进行分析。 大数据可以概括为5个V, 数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity) 。大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。
用于展现分析的前端开源工具有JasperSoft,Pentaho, Spagobi, Openi, Birt等等。
用于展现分析商用分析工具有Style Intelligence、RapidMiner Radoop、Cognos, BO, Microsoft Power BI, Oracle,Microstrategy,QlikView、 Tableau 。
本课为大数据分析短期训练营,力求使学员具备大数据分析基本技能,筑底大数据分析基础知识。
课程大纲
第一章 Hive, HDFS(map reduce), Yarn
1.1 大数据分析基础概念及Linux
1.2 Yarn、Hadoop
第二章 Linux, zookeeper, Spark, Hbase
2.1 Zookeeper、Hbase
2.2 Spark, Hbase
第三章 统计 ,机器学习,scala, spark(MLlib)
3.1 统计分析与机器学习
3.2 统计分析与机器学习