今天给大家分享一篇关于常用数据分析方法的干货~一、关联分析 关联分析,也叫作“购物篮分析”,是一种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法。关联分析目的是找到事务间的关联性,用以指导决策行为。如“67%的顾客在购买啤酒的同时也会购买尿布”,因此通过合理的啤酒和尿布的...
一、公式拆解所谓公式拆解法就是针对某个指标,用公式层层分解该指标的影响因素。举例:分析某产品的销售额较低的原因,用公式法分解种常用的数据分析方法"二、对比分析对比法就是用两组或两组以上的数据进行比较,是最通用的方法。我们知道孤立的数据没有意义,有对比才有差异。比如在时间维度上的同比和环比、增长率、定...
 CDA数据分析师 出品   作者:CDA Level Ⅰ持证人01背景RFM(Recency Frequency Monetary)模型是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。CDA的学员都知道,在Level 1知识体系中...
CDA数据分析师 出品  编辑:Mika 作者:CDA持证人 郭荫娇采访老师:大家好,今天我们邀请到了郭荫娇来参加CDA持证人线上专访。郭荫娇目前研三在读,更令人感到惊讶的是,她目前已经是一家上市公司校企合作数据挖掘项目的负责人,很是了不起。欢迎郭荫娇,可以和大家打个招呼。嘉宾:Hello,我叫郭荫...
1、变量之间关系可以分为两类函数关系:反映了事务之间某种确定性关系;相关关系:两个变量之间存在某种依存关系,但二者并不是一一对应的;反映了事务间不完全确定关系。2、为什么要对相关系数进行显著性检验?实际上完全没有关系的变量,在利用样本数据进行计算时也可能得到一个较大的相关系数值(尤其是时间序列数值)...
转载于CDA数据分析师无论是身处什么行业什么领域,数据分析越来越成为一项必不可少的技能,而运用数据分析进行决策更能产生形成高质量的决策结果。数据分析不仅仅是数据分析师才需要具备的,其实每位职场人士都需要具备。在各大招聘网站中,我们可以看到几乎每个跟数据打交道的互联网岗位要求都会写着:具有敏锐的数据洞...
作者:云朵君 转载于数据STUDIOApache Spark已经成为机器学习和数据科学方面最常用和最受支持的开源工具之一。在这篇文章中,我将帮助你开始使用Apache Spark的spark.ml线性回归[1]来预测波士顿住房价格。我们的数据来自Kaggle竞赛:波士顿郊区的住房价值[2]。对于每个...
作者:云朵君 来源:数据STUDIO今天云朵君给大家总结了四个特征提取及四个特征选择方法,简要介绍了他们的原理,并附上相应代码,希望能够帮助到大家!TF–IDFWord2VecCountVectorizerFeatureHasherVectorSlicerChiSqSelector单变量特征选择器方...
作者:graykode,转载于:机器之心机器学习开发者需要了解的 12 种概率分布,这些你都了解吗?机器学习有其独特的数学基础,我们用微积分来处理变化无限小的函数,并计算它们的变化;我们使用线性代数来处理计算过程;我们还用概率论与统计学建模不确定性。在这其中,概率论有其独特的地位,模型的预测结果、学...
文字内容来自单艺老师在CDAS数据分析师行业峰会的演讲实录,时任猎聘CDO(首席数据科学家),毕业于清华大学和美国University of Arizona,获得了管理信息系统专业的学士和硕士学位。(PS:本文完整视频链接:https://edu.cda.cn/goods/show/2975?tar...
作者:数据星爷,CDA特约作者  上市公司高级分析师/微软认证Excel专家我们来看看以下几个场景:产品:现在我们有一个想法,比如说对于产品的某个按钮由方形改成了圆形或是两个按钮的位置做了调整,我们猜想其会增加用户的点击转化率,但是,实际上我们并不知道是不是真的跟我们想的一样,毕竟用户真正的决策行为...
文字内容来自于谢邦昌老师在CDAS数据分析师行业峰会的演讲实录,时任台北医学大学教授,深耕于生技医疗大数据领域。现任职于辅仁大学副校长一职。视频地址:https://edu.cda.cn/goods/show/2973?targetId=4866&preview=0大家午安,很高兴今天来跟大...
特征相关性然而,在检查了这些特征的相关性之后,我决定从相关性大于0.8的配对中至少删除一个特征。因此,我删除了total_songs、unique_artists、unique_songs、total_events,只保留total_sessions。# 计算相关矩阵sns.set_style("w...
作者:云朵君  来源:数据STUDIO本文中,云朵君将和大家一起完成一个企业级数据挖掘实战项目,该项目基于Spark框架,使用 PySpark 进行大数据分析和挖掘,完成一个预测流失分析客户实战案例。该案例特点是具有较为完整的数据挖掘流程,数据代码齐全,每一步均有结果展示,便于理解和学习。对于在高度...
作者:CDA数据分析研发团队  赵坚毅CDA是什么?CDA(Certified Data Analyst),是信息时代面向全球范围所有行业从事数据分析专业人才的职业简称。数据是反映客观事物的记录,是信息的具体表现形式。数据经过加工处理之后,就成为信息;而信息需要转变成数据才能存储和传输,这个过程也叫...
编辑:Mika  作者:CDA持证人 张继荣主持人:欢迎继荣作为CDA的优秀学员参加今天的采访,继荣现在是在一家公司从事数据分析师,可以和大家打个招呼。张继荣:Hello大家好,我是张继荣,我是2017年毕业于河北工程大学,之前是从事销售管理的工作,然后目前是转岗到了数据分析师的岗位上。点击视频链接...
以下文章来源于算法进阶 作者:鄂维南院士,来源:科学智能AI北京时间2022年7月8日晚上22:30,鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenary talk)。今天我们带来鄂老师演讲内容的分享。鄂老师首先分享了他对机器学习数学本质的理解(函数逼近、概率分布的逼近与采样、B...
来源 :数字化动态,编辑:谈数据数字化转型需要投入,但不只是把技术武装到牙齿,更是需要把技术植入企业基因,开启一场长期的能力进化之旅。当企业思考预算之时,在CIO群体中有很多概念,如ERP、客户关系管理等。CIO年末向董事会、总经理报告新一年数字化战略,进行预算、招标、执行、评估等工作,投入大量时间...
一、信贷风控简介信贷风控是数据挖掘算法最成功的应用之一,这在于金融信贷行业的数据量很充足,需求场景清晰及丰富。信贷风控简单来说就是判断一个人借了钱后面(如下个月的还款日)会不会按期还钱。更专业来说,信贷风控是还款能力及还款意愿的综合考量,根据这预先的判断为信任依据进行放贷,以此大大提高了金融业务效率...