首页 >>  正文

相关系数r的第二个公式

来源:baiyundou.net   日期:2024-08-28


一、案例介绍

某医师测量了15名正常成年人的体重(kg)与CT双肾总体积(ml)大小,数据如下表所示。据此试分析两变量是否有关系?其方向与密切程度如何?

要分析两个定量数据之间是否有关系以及关系的方向和紧密程度,可以使用Pearson相关分析。使用Pearson相关分析,需要满足4个条件。

条件1:两变量均为定量数据。

条件2:两变量之间存在线性关系,通常使用散点图进行检验。

条件3:两变量均没有异常值。

条件4:两变量均符合正态分布。

在本案例中,体重和双肾总体积均为定量数据,满足条件1;条件2-4需要分别进行检验。

(1)线性关系检验

变量之间的线性关系通常使用散点图进行检验。散点图是通过使用两组数据构成的多个坐标点,判断两变量之间是否存在线性关系。将数据上传至SPSSAU系统,在【可视化】模块选择【散点图】,将“双肾总体积”拖拽到右侧“Y定量”分析框中,将“体重”拖拽到右侧“X定量”分析框中,然后点击开始分析,操作如下图:

SPSSAU输出散点图如下:

从散点图可以看出,体重和双肾总体积之间呈现出明显的线性关系,随着体重的增大,双肾总体积也不断增大。所以两变量满足条件2存在线性关系。

散点图除了查看是否存在线性关系,还可以查看是否存在异常值;不过通过散点图判断异常值具有很强的主观性,比如上图圈出来的点,无法做到准确判断,而Pearson相关系数易受异常值的影响,所以可以选择通过其他方式检验异常值,比如箱线图。

(2)异常值检验

使用箱线图可以直观识别数据的异常值,箱线图由5个点构成,分别是最大观察值、25%分位数(Q1)、中位数、75%分位数(Q3)、最大观察值,最大观察值和最小观察值的定义如下:

最大观察值=Q3+1.5IQR,IQR=Q3-Q1

最小观察值=Q1-1.5IQR,IQR=Q3-Q1

如果数据存在异常值——大于最大观察值或小于最小观察值,SPSSAU将该点以“原点”形式进行展示。

在SPSSAU【可视化】模块,选择【箱线图】,将两变量均拖拽到右侧“分析项(定量)”中,点击开始分析,操作如下图:

SPSSAU输出体重和双肾总体积的箱线图如下:

从箱线图可以看出,体重和双肾总体积两变量均不存在异常值,满足条件3。

若存在异常值,可以通过异常值汇总表格如下图,查看具体异常值个数以及异常值数字,对异常值进行删除等操作。

(3)正态性检验

两变量均需要满足正态性,正态性可以使用多种方式进行检验,比如直方图、P-P如/Q-Q图、峰度/偏度、正态性检验等。本案例选择正态性检验。在SPSSAU【通用方法】模块,选择【正态性检验】,将两变量拖拽到右侧“分析项(定量)”分析框中,然后点击开始分析。操作如下图:

SPSSAU输出正态性检验结果如下:

从上表可知,针对体重、双肾总体积进行正态性检验,样本量为15<50,所以使用Shapiro-Wlik正态性检验结果,具体来看,体重、双肾总体积正态性检验对应p值均大于0.05,未呈现出显著性,说明接受原假设(原假设为数据服从正态分布),即两变量均服从正态分布,满足条件4。

综上所述,本案例数据满足使用Pearson相关分析的条件,可以进行Pearson相关分析。

(4)Pearson相关分析

①相关系数计算

Pearson相关分析使用相关系数描述变量之间的相关关系,Pearson相关系数取值范围为[-1,1],相关系数的绝对值越接近1,说明变量之间相关性越强;绝对值越接近0,相关性越弱。相关系数大于0,代表变量之间存在正相关;相关系数小于0,代表负相关

Pearson相关系数的计算公式如下:

r=\frac{sum(X-overline{X})(Y-overline{Y})}{sqrt{sum(X-overline{X})^2}sqrt{sum(Y-overline{Y})^2}}

overline{X}=(43+74+51+…+54)/15=59.53

overline{Y}=(217.22+316.18+…+266.104)/15=266.104

sum(X-overline{X})(Y-overline{Y})=(43-59.53)*(217.22-266.104)+(74-59.53)*(316.18-266.104)+…+(54-59.53)*(252.08-266.104)=6301.038

sqrt{sum(X-overline{X})^2}=2555.733

sqrt{sum(Y-overline{Y})^2}=20270.495

r=\frac{6301.038}{sqrt{2555.733}sqrt{20270.495}}=0.8754

所以,手工计算得到体重和双肾总体积的Pearson相关系数为0.8754,说明两变量之间存在高度正相关关系。

接下来,介绍如何使用软件快速计算相关系数。

②软件计算

在SPSSAU【通用方法】模块,选择【相关分析】,将“体重”拖拽到右侧“分析项X”分析框中,将“双肾总体积”拖拽到右侧“分析项Y”分析框中,选择“Pearson相关系数”,然后点击开始分析,操作如下图:

SPSSAU输出Pearson相关分析结果如下:

从上表可以看出,体重和双肾总体积之间相关系数为0.8754,p<0.0,5,说明两变量存在显著正相关关系,即体重与双肾总体积之间存在高度正相关关系。

本案例研究体重与双肾总体积之间的关系情况,经检验,两变量均满足Pearson相关分析需要满足的4个条件。使用Pearson相关分析得到,体重与双肾总体积之间的相关系数为0.8754,p<0.05,说明两变量之间存在显著正相关关系,即体重越大,双肾总体积越大。

数据不满足正态性怎么办?

经过正态性检验,如果两个变量不符合正态分布,有以下三种选择:

①使用Spearman相关系数进行分析。

②对不服从正态分布的变量进行数据变换,如取对数等操作,对变换后的数据再进行检验。

③继续使用Pearson相关分析,如果对数据要求不是太严格,Pearson相关系数对不服从正态分布的数据具有一定抗性,可继续使用。

","gnid":"982c7d4d3da6d0eae","img_data":[{"flag":2,"img":[{"desc":"","height":"383","title":"","url":"https://p0.ssl.img.360kuai.com/t01ded1500e7a860c87.jpg","width":"900"},{"desc":"","height":"480","title":"","url":"https://p0.ssl.img.360kuai.com/t012f56633c8a818b39.jpg","width":"414"},{"desc":"","height":"203","title":"","url":"https://p0.ssl.img.360kuai.com/t017b74def914a494a8.jpg","width":"482"},{"desc":"","height":"508","title":"","url":"https://p0.ssl.img.360kuai.com/t0107c54716ab36190c.jpg","width":"904"},{"desc":"","height":"215","title":"","url":"https://p0.ssl.img.360kuai.com/t0181700d09643f23f2.jpg","width":"711"},{"desc":"","height":"448","title":"","url":"https://p0.ssl.img.360kuai.com/t019ef4bbc5b085e50b.jpg","width":"822"},{"desc":"","height":"445","title":"","url":"https://p0.ssl.img.360kuai.com/t0108c50c10308edd1b.jpg","width":"807"},{"desc":"","height":"297","title":"","url":"https://p0.ssl.img.360kuai.com/t018d2bdf09eb6a403b.jpg","width":"910"},{"desc":"","height":"304","title":"","url":"https://p0.ssl.img.360kuai.com/t011436b27c43dbae88.jpg","width":"470"},{"desc":"","height":"243","title":"","url":"https://p0.ssl.img.360kuai.com/t017be637b38d82ff59.jpg","width":"1307"},{"desc":"","height":"129","title":"","url":"https://p0.ssl.img.360kuai.com/t01d03b4a18cf17df49.jpg","width":"508"},{"desc":"","height":"98","title":"","url":"https://p0.ssl.img.360kuai.com/t01c558a7047be53f69.jpg","width":"557"},{"desc":"","height":"320","title":"","url":"https://p0.ssl.img.360kuai.com/t01709dc2adfb54fb98.jpg","width":"809"},{"desc":"","height":"248","title":"","url":"https://p0.ssl.img.360kuai.com/t019971a765449fdd26.jpg","width":"525"}]}],"original":0,"pat":"art_src_3,fts0,sts0","powerby":"pika","pub_time":1693980960000,"pure":"","rawurl":"http://zm.news.so.com/e368a6e592ffde1f134fb26dfdb8e2b9","redirect":0,"rptid":"cdb672e021dc1d54","rss_ext":[],"s":"t","src":"SPSSAU","tag":[],"title":"医学案例 | 相关分析

霍咽冠576r平方计算公式是什么? -
龙勤湛17285531703 ______ r²(r平方)是用于衡量统计学中线性回归模型的拟合优度的一个指标.在线性回归中,我们试图用一个直线来拟合数据点,r²可以告诉我们这条直线对数据的拟合程度. r²的计算公式如下: r² = 1 - (SS_res / SS_tot) 其中, r² 表示拟合优度,...

霍咽冠576matlab中做回归分析,怎么获得每一个预测变量的系数和p值和R方~跪求函数~ -
龙勤湛17285531703 ______ 对于多变量线性回归分析,可以regress()函数来预测变量系数. 基本用法: [b,bint,r,rint,stats] = regress(y, X) 式中:b——变量系数 bint——bint为b的置信区间 r——残差向量 rint——rint为r的置信区间 stats——为1*3检验统计量,第一个是回归方程的置信度,即相关系数R²;第二个是F统计量;第三个是F统计量相应的p值 y——因变量向量,n*1向量 X——自变量向量,n*p向量

霍咽冠576如何通俗理解“协方差”和“相关系数” -
龙勤湛17285531703 ______ 相关系数概念在评价图像的处理效果方面很有用,因为很多时候我们需要只要处理后图像与原图像的关系.一、协方差: 可以通俗的理解为:两个变量在变化过程中是同方向变化?还是反方向变化?同向或反向程度如何? 你变大,同时我也变...

霍咽冠576若变量x与y之间的相关系数r=0.8,则回归方程的判定系数R^2=() - 上...
龙勤湛17285531703 ______ 相关一般指的是线性相关性,用相关系数来表示,相关系数为零代表两个变量间没有线性相关性.而独立意味着除了无线性相关外也不能有非线性相关,因此独立意味着不...

霍咽冠576若回归直线方程中的回归系数b=0时,则相关系数r= - ----- -
龙勤湛17285531703 ______ 由于在回归系数b的计算公式中, 与相关指数的计算公式中, 它们的分子相同, 故 答案为:0.

霍咽冠576相关系数r=0.24,p=0.09,有没有相关性,有没有统计学意义
龙勤湛17285531703 ______ 没有相关性,因为检验不通过

霍咽冠576相关系数公式 - 上学吧技能鉴定
龙勤湛17285531703 ______ 你用zscore这个函数进行预处理之后,这两个矩阵是一样的~;在明白这个原因之前,你必须要知道协方差矩阵和相关系数矩阵的计算方法~

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024