在数据分析工作中,你可能经常遇到这样的问题:从浏览到消费的转化率一直很低,那到底该优化哪里呢?如果你要投放广告该怎么选择对象人群呢?遇到类似的问题,我们需要将具体的业务问题和数据之间建立一种关系,然后通过一些分析方法和分析工具,让我们在遇到此类问题时知道:我该选择什么样的分析工具或分析方法去解决实际...
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?”“是不是广告投放的用户质量不高?还是我们的产品问题?”如果数据分析师的经验足够丰富,可能会想:“这里面肯定有很多变量的关系值得深挖。” 这时候,关系分析(Relationship Analysis) 就派上了用场。关系分析,简单来说...
一级教材p65 第二章数据分析方法 第二节由基础分析范式引申出的六种分析方法 第三小节 构成分析方法“我们的利润率上升了,但销售额却没变,这是为什么?”“某个业务的市场份额在下滑,到底是什么原因?”“公司整体业绩稳定,但某些部门的表现差异巨大,哪些因素影响了它们?”......以上是企业经营过程中经...
春风拂面,金三银四的求职季如期而至。谁都想在这场竞争里拿下心仪offer。一份亮眼简历是求职敲门砖,面试紧张则可能让机会溜走,做好充分准备十分关键。另外,明确目标岗位核心信息,能帮你找准职业方向。我们准备了四份求职宝典,从各方面帮你提升求职竞争力,助你顺利入职理想岗位!宝典1:企业面试题库——面试通...
在数据分析中,地图是一种非常直观的可视化工具,能够帮助我们更好地理解数据在地理空间上的分布情况。无论是展示销售数据、人口分布、还是疫情传播,地图都能提供一目了然的信息。本文将详细介绍如何使用Pyecharts绘制地图,适合数据分析小白入门。一、地图的应用场景地图在数据分析中的应用非常广泛,以下是一些...
1、闺女,醒醒,媒人把相亲的带来了。我。。。。。。。2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个?3、俺滴个亲娘,相一个不中,相一个不中, 你到底想要什么样的?王婆,我想找个高的,帅的,有钱的,给我做饭洗衣服的,每个月能给我2万块钱零花钱的。王婆:我是媒人,不是菩萨,许...
“ 三种方法对比来看,非对称变量在聚类分析中选用百分位秩和 Tukey 正态分布比较多,在回归分析中取对数比较多。因为商业上的聚类模型关心的是客户的排序情况,回归模型关心的是其具有经济学意义,自然对数表达的是百分比的变化。”---摘自CDA数据分析师Level II教材6.3.6《连续变量分布形态转...
“ 常见的连续变量降维分为主成分分析、因子分析和变量聚类等方法。另外分类变量的降维则使用概化处理。”在CDA数据分析师Level II新教材《量化策略分析》第六章市场调研与数据预处理中有这样一个知识点,如下图。概化处理这个词你可能听的比较少,那么这项技术是如何实施,又为何需要呢?本文来带你详细学习。...
“分箱方法是通过考察数据的“近邻”来光滑有序数据的值,使有序值分布到一些桶或箱中。通常分为两种方法,分别是等深分箱和等宽分箱。“--摘自CDA数据分析师2级教材第六章《市场调研与数据预处理》。最近在做一个数据分析项目时,遇到了一个头疼的问题。从数据噪声,到分箱方法年前,我们手头有一组银行用户的交易数...
“在数据分析中,并不是所有变量都能直接用来计算,比如像“红蓝”这样的分类变量。在利用和处理这种分类数据时,经常不能直接拿来使用。“最近在球圈出了一个新闻:曼城俱乐部官方宣布签下埃及前锋马尔穆什!英超联赛官方预告,2月23日曼城主场迎战利物浦时,埃及前锋萨拉赫与马尔穆什有望同场竞技。曼城的新援马尔穆什...
当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督学习有Label Propagation和Label Spreading两种。他们的主要区别是第二种方法带有正则化机制。我们在上篇已经讲解了Label Propagation...
考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额外的未标记数据,更好地捕捉数据分布的潜在形状,并在新样本上的泛化能力更强。当我们只有非常少量的已标记数据,同时有大量未标记数据点时,这种算法可以表现得非常出色。在sklearn中,基...