首页 >>  正文

相关系数r的计算公式化简

来源:baiyundou.net   日期:2024-08-27


一、案例介绍

某医师测量了15名正常成年人的体重(kg)与CT双肾总体积(ml)大小,数据如下表所示。据此试分析两变量是否有关系?其方向与密切程度如何?

要分析两个定量数据之间是否有关系以及关系的方向和紧密程度,可以使用Pearson相关分析。使用Pearson相关分析,需要满足4个条件。

条件1:两变量均为定量数据。

条件2:两变量之间存在线性关系,通常使用散点图进行检验。

条件3:两变量均没有异常值。

条件4:两变量均符合正态分布。

在本案例中,体重和双肾总体积均为定量数据,满足条件1;条件2-4需要分别进行检验。

(1)线性关系检验

变量之间的线性关系通常使用散点图进行检验。散点图是通过使用两组数据构成的多个坐标点,判断两变量之间是否存在线性关系。将数据上传至SPSSAU系统,在【可视化】模块选择【散点图】,将“双肾总体积”拖拽到右侧“Y定量”分析框中,将“体重”拖拽到右侧“X定量”分析框中,然后点击开始分析,操作如下图:

SPSSAU输出散点图如下:

从散点图可以看出,体重和双肾总体积之间呈现出明显的线性关系,随着体重的增大,双肾总体积也不断增大。所以两变量满足条件2存在线性关系。

散点图除了查看是否存在线性关系,还可以查看是否存在异常值;不过通过散点图判断异常值具有很强的主观性,比如上图圈出来的点,无法做到准确判断,而Pearson相关系数易受异常值的影响,所以可以选择通过其他方式检验异常值,比如箱线图。

(2)异常值检验

使用箱线图可以直观识别数据的异常值,箱线图由5个点构成,分别是最大观察值、25%分位数(Q1)、中位数、75%分位数(Q3)、最大观察值,最大观察值和最小观察值的定义如下:

最大观察值=Q3+1.5IQR,IQR=Q3-Q1

最小观察值=Q1-1.5IQR,IQR=Q3-Q1

如果数据存在异常值——大于最大观察值或小于最小观察值,SPSSAU将该点以“原点”形式进行展示。

在SPSSAU【可视化】模块,选择【箱线图】,将两变量均拖拽到右侧“分析项(定量)”中,点击开始分析,操作如下图:

SPSSAU输出体重和双肾总体积的箱线图如下:

从箱线图可以看出,体重和双肾总体积两变量均不存在异常值,满足条件3。

若存在异常值,可以通过异常值汇总表格如下图,查看具体异常值个数以及异常值数字,对异常值进行删除等操作。

(3)正态性检验

两变量均需要满足正态性,正态性可以使用多种方式进行检验,比如直方图、P-P如/Q-Q图、峰度/偏度、正态性检验等。本案例选择正态性检验。在SPSSAU【通用方法】模块,选择【正态性检验】,将两变量拖拽到右侧“分析项(定量)”分析框中,然后点击开始分析。操作如下图:

SPSSAU输出正态性检验结果如下:

从上表可知,针对体重、双肾总体积进行正态性检验,样本量为15<50,所以使用Shapiro-Wlik正态性检验结果,具体来看,体重、双肾总体积正态性检验对应p值均大于0.05,未呈现出显著性,说明接受原假设(原假设为数据服从正态分布),即两变量均服从正态分布,满足条件4。

综上所述,本案例数据满足使用Pearson相关分析的条件,可以进行Pearson相关分析。

(4)Pearson相关分析

①相关系数计算

Pearson相关分析使用相关系数描述变量之间的相关关系,Pearson相关系数取值范围为[-1,1],相关系数的绝对值越接近1,说明变量之间相关性越强;绝对值越接近0,相关性越弱。相关系数大于0,代表变量之间存在正相关;相关系数小于0,代表负相关

Pearson相关系数的计算公式如下:

r=\frac{sum(X-overline{X})(Y-overline{Y})}{sqrt{sum(X-overline{X})^2}sqrt{sum(Y-overline{Y})^2}}

overline{X}=(43+74+51+…+54)/15=59.53

overline{Y}=(217.22+316.18+…+266.104)/15=266.104

sum(X-overline{X})(Y-overline{Y})=(43-59.53)*(217.22-266.104)+(74-59.53)*(316.18-266.104)+…+(54-59.53)*(252.08-266.104)=6301.038

sqrt{sum(X-overline{X})^2}=2555.733

sqrt{sum(Y-overline{Y})^2}=20270.495

r=\frac{6301.038}{sqrt{2555.733}sqrt{20270.495}}=0.8754

所以,手工计算得到体重和双肾总体积的Pearson相关系数为0.8754,说明两变量之间存在高度正相关关系。

接下来,介绍如何使用软件快速计算相关系数。

②软件计算

在SPSSAU【通用方法】模块,选择【相关分析】,将“体重”拖拽到右侧“分析项X”分析框中,将“双肾总体积”拖拽到右侧“分析项Y”分析框中,选择“Pearson相关系数”,然后点击开始分析,操作如下图:

SPSSAU输出Pearson相关分析结果如下:

从上表可以看出,体重和双肾总体积之间相关系数为0.8754,p<0.0,5,说明两变量存在显著正相关关系,即体重与双肾总体积之间存在高度正相关关系。

本案例研究体重与双肾总体积之间的关系情况,经检验,两变量均满足Pearson相关分析需要满足的4个条件。使用Pearson相关分析得到,体重与双肾总体积之间的相关系数为0.8754,p<0.05,说明两变量之间存在显著正相关关系,即体重越大,双肾总体积越大。

数据不满足正态性怎么办?

经过正态性检验,如果两个变量不符合正态分布,有以下三种选择:

①使用Spearman相关系数进行分析。

②对不服从正态分布的变量进行数据变换,如取对数等操作,对变换后的数据再进行检验。

③继续使用Pearson相关分析,如果对数据要求不是太严格,Pearson相关系数对不服从正态分布的数据具有一定抗性,可继续使用。

","gnid":"982c7d4d3da6d0eae","img_data":[{"flag":2,"img":[{"desc":"","height":"383","title":"","url":"https://p0.ssl.img.360kuai.com/t01ded1500e7a860c87.jpg","width":"900"},{"desc":"","height":"480","title":"","url":"https://p0.ssl.img.360kuai.com/t012f56633c8a818b39.jpg","width":"414"},{"desc":"","height":"203","title":"","url":"https://p0.ssl.img.360kuai.com/t017b74def914a494a8.jpg","width":"482"},{"desc":"","height":"508","title":"","url":"https://p0.ssl.img.360kuai.com/t0107c54716ab36190c.jpg","width":"904"},{"desc":"","height":"215","title":"","url":"https://p0.ssl.img.360kuai.com/t0181700d09643f23f2.jpg","width":"711"},{"desc":"","height":"448","title":"","url":"https://p0.ssl.img.360kuai.com/t019ef4bbc5b085e50b.jpg","width":"822"},{"desc":"","height":"445","title":"","url":"https://p0.ssl.img.360kuai.com/t0108c50c10308edd1b.jpg","width":"807"},{"desc":"","height":"297","title":"","url":"https://p0.ssl.img.360kuai.com/t018d2bdf09eb6a403b.jpg","width":"910"},{"desc":"","height":"304","title":"","url":"https://p0.ssl.img.360kuai.com/t011436b27c43dbae88.jpg","width":"470"},{"desc":"","height":"243","title":"","url":"https://p0.ssl.img.360kuai.com/t017be637b38d82ff59.jpg","width":"1307"},{"desc":"","height":"129","title":"","url":"https://p0.ssl.img.360kuai.com/t01d03b4a18cf17df49.jpg","width":"508"},{"desc":"","height":"98","title":"","url":"https://p0.ssl.img.360kuai.com/t01c558a7047be53f69.jpg","width":"557"},{"desc":"","height":"320","title":"","url":"https://p0.ssl.img.360kuai.com/t01709dc2adfb54fb98.jpg","width":"809"},{"desc":"","height":"248","title":"","url":"https://p0.ssl.img.360kuai.com/t019971a765449fdd26.jpg","width":"525"}]}],"original":0,"pat":"art_src_3,fts0,sts0","powerby":"pika","pub_time":1693980960000,"pure":"","rawurl":"http://zm.news.so.com/e368a6e592ffde1f134fb26dfdb8e2b9","redirect":0,"rptid":"cdb672e021dc1d54","rss_ext":[],"s":"t","src":"SPSSAU","tag":[],"title":"医学案例 | 相关分析

龙哗萍1365相关系数的公式是什么? -
池鸦哗19136128349 ______ 相关系数的公式是什么? 相关系数常用于度量两个变量之间的相关程度,相关系数有多种,pearson相关系数、spearman相关系数等,但是pearson相关系数比较常用.通常情况下有相关关系,相关系数越大,表示两变量之间的相关性越强,相...

龙哗萍1365如何计算若干点(散点)与任意一条直线或曲线的相关系数r? -
池鸦哗19136128349 ______ Excel里面应该有现成的函数. 首先,你要确定是用泊松法还是皮尔生法. RSQ--返回给定数据点的Pearson 乘积矩相关系数的平方 PEARSON--返回 Pearson(皮尔生)乘积矩相关系数 r 具体的你看一下Excel的帮助就可以了. 举的例子中,采用皮尔生乘积矩法求得相关系数是0.941061925974533 (与y=x+1)

龙哗萍1365如何用R计算两个矩阵相关系数 -
池鸦哗19136128349 ______ 矩阵之间没有相关性的,矩阵之间只有等价,相似,合同 只有向量组之间有相关性 如果是两组向量组,就把两组向量组合并到一起,然后再求出它的齐次非零解 希望你能帮助到你哦

龙哗萍1365excel中的相关系数是如何计算出来的? -
池鸦哗19136128349 ______ 用统计函数中的CORREL函数,假设的两组数据为:A1:A10和B1:B10 在C1输入公式=CORREL(A1:A10,B1:B10) 相关系数就出来了, 以前我也不知有这个公式,我是用求标准差的办法设置的公式做了一个小模板,累死了,哈哈!

龙哗萍1365相关系数r - 1.相关系数r=1是函数关系吗?2.相关系数r=0不是相关关系吗?
池鸦哗19136128349 ______ 1.相关系数r=1是函数关系吗? 2.相关系数r=0不是相关关系吗? 相关系数r是变量之间相关程度的指标,取值范围为[-1,1] |r|值越大,变量之间的线性相关程度越高; |r|值越接近0,变量之间的线性相关程度越低. r>0,呈正相关,r=1时为完全正相关; r

龙哗萍1365偏相关系数的偏相关系数的计算 -
池鸦哗19136128349 ______ 偏相关系数的计算可以有下面的三种方法(详细的计算方法见参考文章) 1 根据上面的说法,从线性回归的角度计算变量间的偏相关系数,但是这样做很麻烦. 2 迭代法,可以认为简单相关系数为0阶偏相关系数,任何n阶偏相关都可以通过3个...

龙哗萍1365概率论概率论 相关系数怎么算 -
池鸦哗19136128349 ______ 相关系数 正的协方差表达了正相关性,负的协方差表达了负相关性.对于同样的两个随机变量来说,计算出的协方差越大,相关性越强. 但随后一个问题,身高和体重的协方差为30,这究竟是多大的一个量呢?如果我们又发现,身高与鞋号的...

龙哗萍1365 若回归直线方程中的回归系数b=0时,则相关系数r=______. -
池鸦哗19136128349 ______[答案] 由于在回归系数b的计算公式中, 与相关指数的计算公式中, 它们的分子相同, 故 答案为:0.

龙哗萍1365已知变量X和Y的协方差为 - 50,X的方差为180,Y的方差为20,其相关系...
池鸦哗19136128349 ______ 首先简单阐述两个概念.相关系数R是用以反映变量之间相关关系密切程度的统计指标.相关系数R(coefficient of correlation)的平方即为决定系数,它与相关系数的区别在于除掉|R|=0和1情况.相关系数是用来描述两个变量之间的线性关系的,但决定系数的适用范围更广,可以用于描述非线性或者有两个及两个以上自变量的相关关系.

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024