首页 >>  正文

相关分析方法

来源:baiyundou.net   日期:2024-09-23

本文的主要内容就是为大家科普数据分析的概念和方法,作者用清晰的“是什么,为什么,怎么做”思路,为读者提供了一个又一个的方法论,为数据分析小白们带来了入门级的先进知识。

有同学问:陈老师,每次被面试都被问“你使用过哪些数据分析的方法”。结果都感觉答不上来。到底数据分析有什么方法?为啥我在做数据分析,却感觉没什么方法?今天系统解答一下。

首先,并不是名字带“分析”俩字的,就是数据分析方法。有很多XX分析,是统计学、运筹学、数学的专业工具,并不直接指向业务问题的答案。当人们在问:”有什么分析方法”的时候,更多期望听到一个能给出结论的方法。

所以想回答好这个问题,要回到:数据分析到底解决哪些业务问题上去。

从业务用途上看,数据分析可以解决5大类问题

  1. 是多少(数据描述状况)
  2. 是什么(树立数据标准)
  3. 为什么(探索问题原因)
  4. 会怎样(预测业务走势)
  5. 又如何(综合判断状况)

围绕每个问题场景,有特定的方法组合(如下图)

一、解决“是多少”的方法

用数据描述状况,需要建立完善的数据指标体系。建立数据指标体系,则需要梳理清楚数据指标之间的逻辑。数据指标间有两种基本的逻辑:串行逻辑和并行逻辑,因此衍生出两种基本的分析方法:漏斗分析法&指标拆解法。

拆解的业务多了,人们发现,某些数据指标可以固定的组合使用,比如:

  • 用户运营场景:AARRR指标、RFM指标
  • 零售门店场景:人、货、场指标
  • 商品管理场景:进、销、存指标

这些也习惯性被称为:分析模型。但注意,这些都只是在展示数据。数据+判断标准,才有分析结论。有关判断标准的分析,就是:是什么类问题。

二、解决“是什么”问题的方法

判断标准可以很简单,比如领导的指令、KPI要求、过往同期数据,都能作为标准。这些统称为:简单标准。但很多时候,指标走势是否正常,并无明确的KPI约束,甚至KPI达标,但是走势奇特,领导们还是会觉得有问题。这时候就需要找其他参照物。因此衍生出一系列分析方法。

比如:

  • 与业务自身规律比较,判断好坏:生命周期法、自然周期法
  • 与同类型,同期发展的业务比较:同期群分析法
  • 与其他业务个体进行比较:分层分析法

这样对比,即使只有1个数据指标,也能得出好坏判断。如果业务发展违背过往规律,明显比其他个体更差,则可以判定为:不好。

当然,也可以使用2个指标,比如经典的矩阵分析法,通过两指标交叉+两指标平均值,分出四类业务,从而得出好坏判断。

如果用更多指标也行,比如常用的Kmean聚类,可以先利用多个指标对业务个体聚类,之后再看各类型之间表现优劣。

以上这些方法,都能将业务的好/坏区分出来,从而在一定程度上辅助判断。

三、解决“为什么”问题的方法

“分析下这个问题是什么原因导致的……”是常见的要求,这就是“为什么”问题。解决为什么问题,有两大基本思路:

1. 结果推断

常见的,比如:

  • 结构分析法:通过结构分析,找到问题发生点
  • 标签分析法:通过打标签,做个体对比,找到问题原因
  • 相关分析法:通过计算指标相关关系,找到相关指标,再形成假设
  • MECE法:讲多个业务假设,按MECE原则合并成分析逻辑,一一验证

结果推断,意为问题发生后,用各种数据寻找差异,建立假设。可以把业务口中“我觉得这是XX原因”,抽象成一个数据可验证的假设,因此适用范围非常广。但结果推断只是单方面从结果做归纳,有可能有偏颇,还需要实验验证。

2. 实验推断

这些方法更接近传统统计学的实验,大部分都要求:

  • 开展数据实验,验证假设
  • 设参照组/实验组,且参照组/实验组特征相似
  • 区分控制变量、环境变量,重点测控制变量的影响
  • 先有假设,然后通过实验/分组对比,验证假设。常见的方法,包括ABtest、DID、PSM、RDD、Uplift等方法。

实验推断有统计学依据,计算过程复杂,看起来更量化一些。但是对实验条件要求太高,比如大促销类ALL in的业务,比如商品、店铺这些无法控制环境的业务场景,比如业务员行为、内容传播等难采集数据的领域,都很难用。

理想的状态,肯定是两者结合,事实-假设-验证,不断循环,接近真相。但现实中有很多条件制约。导致我们只能从一个角度切入,慢慢靠近真相。

四、解决“会怎样”问题的方法

预测类问题,是所有人都感兴趣的话题,也是统计学/算法最有可能发挥作用的地方。唯一限制方法使用的,是:到底有多少数据&业务人员要不要参与。

如果业务人员坚持参与预测过程,就只能用业务假设法或者滚动预测法,这些方法把影响结果的参数都列出来,方便业务人员拍脑袋,也能帮他们清晰:我要做多少。

如果业务人员不参与,则视数据量的多少。数据少,则使用时间序列预测,数据多,且有影响结果的原因数据,则可以用诸如回归模型一类算法预测。

五、解决“又如何”问题的方法

综合评估与分配问题,统称“又如何”问题。这是决策的最后一步,决定是否对业务做动作,做多大动作。有些简单的评估是很容易的,比如销售签了生死状,达不成业绩目标就炒鱿鱼。

但大部分情况,评估很复杂,要考虑方方面面。这里最大的区别,在于要不要考虑领导的主观意见。如果要,果断使用主观评分法!满足领导的打分欲是第一位的。如果不要,再考虑使用有监督的机器学习算法,或者因子分析法,DEA法(求的是相对效率)等客观方法。

至于:做多少,谁来做。就是更复杂的问题了。想做好分配,得先把前边几步分析做完,对每个业务线基础能力有充分认识,才好下判断。这里,线性规划的方法,可以用来做支持。

六、为什么感觉没用上方法?

综上可见,数据分析的方法是非常多的。但为什么很多同学感觉自己没用上方法呢?因为每种方法是和业务场景、领导风格、数据质量、息息相关的。

比如因果推断算法大多基于分组测试展开,而实际业务中,很多因果分析是事后再查原因,也不给二次实验的机会。

比如很多公司的分配方案,根本就是领导拍脑袋,一言堂,根本没机会让分析师用算法。

比如预测问题,很多公司根本没有足够数据积累,只有一条销售数据,那撑死了也只能用时间序列法。

这种理想与现实的差距,让很多同学很痛苦。一方面不清楚到底这些方法该如何用,另一方面不了解,自己该如何应对业务需求。面试和工作都很吃力。

专栏作家

接地气的陈老师,微信公众号:接地气的陈老师,人人都是产品经理专栏作家。资深咨询顾问,在互联网,金融,快消,零售,耐用,美容等15个行业有丰富数据相关经验。

本文原创发布于人人都是产品经理。未经许可,禁止转载。

题图来自Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

","gnid":"9ef26a0c0d8eb8e13","img_data":[{"flag":2,"img":[{"desc":"","height":"420","title":"","url":"https://p0.ssl.img.360kuai.com/t01ae57665bb8f896da.jpg","width":"900"},{"desc":"","height":"595","title":"","url":"https://p0.ssl.img.360kuai.com/t01ff48c04094d33d75.jpg","width":"865"},{"desc":"","height":"330","title":"","url":"https://p0.ssl.img.360kuai.com/t012f40c7df620241cf.jpg","width":"865"},{"desc":"","height":"341","title":"","url":"https://p0.ssl.img.360kuai.com/t0121cee4a22e92579f.jpg","width":"865"},{"desc":"","height":"378","title":"","url":"https://p0.ssl.img.360kuai.com/t0173b51702f837262b.jpg","width":"865"},{"desc":"","height":"512","title":"","url":"https://p0.ssl.img.360kuai.com/t01ec690aa6c8c0d603.jpg","width":"865"},{"desc":"","height":"445","title":"","url":"https://p0.ssl.img.360kuai.com/t019233ab4975ffb65d.jpg","width":"865"},{"desc":"","height":"321","title":"","url":"https://p0.ssl.img.360kuai.com/t01972942d17f4ad58e.jpg","width":"865"},{"desc":"","height":"354","title":"","url":"https://p0.ssl.img.360kuai.com/t01b2a9f791d5624389.jpg","width":"865"}]}],"original":0,"pat":"art_src_3,fts0,sts0","powerby":"hbase","pub_time":1681119420000,"pure":"","rawurl":"http://zm.news.so.com/7f93f0469fa1aa842535030585a35885","redirect":0,"rptid":"9dcd23c932e16cf3","rss_ext":[],"s":"t","src":"人人都是产品经理","tag":[],"title":"你会用哪些数据分析方法?

羊狭泻723SPSS统计软件相关分析及回归分析怎么做 -
陈屈宝15662777749 ______ 相关分析 两个定性变量之间的相关做卡方 两个定量之间的相关关系做pearson 一个定性变量一个定量变量做t或者方差 多元线性回归1.打开数据,依次点击:analyse--regression,打开多元线性回归对话框.2.将因变量和自变量放入格子的列表里...

羊狭泻723用spss怎么做数据相关分析??
陈屈宝15662777749 ______ 首先,应明确什么叫相关分析.在做相关分析之前,要做一些前期准备工作,如果没有这些工作,是没法做相关分析的.比如散点图等.其次,相关分析有很多种,有spearman,有pearson,有kendall,都是相关分析的方法,这时就需要你去明确哪种方法更合适于你的数据了.如果还是不懂的话,可以去找专业统计分析人员帮助你.推荐star统计分析工作室,专业、诚信,质量有保障!百度输入star统计分析工作室即可

羊狭泻723相关与回归分析的主要内容包括哪些方面? -
陈屈宝15662777749 ______ (1)确定现象之间有无关系.这是相关与回归分析的起点.只有存在相互依存关系,才有必要进行进一步的分析. (2)确定相关关系的表现形式.只有确定了现象之间相互关系的具体表现形式,才能运用相应的相关分析方法去解决.如果把曲线相关误认为是直线相关,按直线相关来分析,便会出现认识上的偏差,导致错误的结论. (3)测定相关关系的密切程度和方向.现象之间的相关关系是一种不确定的数量关系,因此常常给人的感觉是不明确的.相关分析就是要从这种不确定、不明确的数量关系中,判断相关变量之间数量上的依存程度和方向.

羊狭泻723相关损益分析法是什么分析法? -
陈屈宝15662777749 ______ 相关损益分析法是指在进行短期经营决策时,以相关损益指标作为决策评价指标的一种方法.相关损益指标是一个正指标,可用于两个以上方案的决策. 这种方法适用于多个方案的决策分析,最终选择相关损益最大的项目作为最优方案.某方案的相关损益就是该方案的相关收入与相关差别之差,相关损益指标是一个正指标,根据它做出决策的判断标准是:哪个方案的相关损益最大,哪个方案最优.

羊狭泻723自变量为虚拟变量,因变量不是,有什么方法进行相关分析?愁死我了,论文都快交了,万分感谢!
陈屈宝15662777749 ______ 逐个进行分析,确定相关性最好的.具体的分析方法,一个是机理分析,从内部探讨原因,二是数量分析,通过回归等方法加以确定.

羊狭泻723成本分析方法有哪些? -
陈屈宝15662777749 ______ 成本分析方法主要分为对比分析法,连锁替代法,相关分析法. 对比分析法 对比分析法是通过成本指标在不同时期(或不同情况)的数据的对比,来揭露矛盾的一种方法,成本指标的对比,必须注意指标的可比性. 比较形式 (1)绝对...

羊狭泻723引文分析方法有哪些 -
陈屈宝15662777749 ______ 引文分析法 除了前面两节介绍的内容分析法,内容相关分析涉及到的另外两个主要的领域是情报检索和引文分析.本节在扼要阐述和比较这两者之后,集中介绍引用相关分析的方法—引文分析法如何进行...

羊狭泻723数据分析算研究方法吗? -
陈屈宝15662777749 ______ 对于数据分析师来说,懂得更多的数据分析方法是很有必要的,而且数据分析师工作工程中会根据变量的不同采用不同的数据分析方法,一般常用的数据分析方法包括聚类分析、因子分析、相关分析、对应分析、回归分析、方差分析等,我们要...

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024