关于相关分析

文献里面的描述:
Statistical analyses were performed by using statistical software (SPSS Statistics version 20, IBM, Armonk, NY; and R version 3.5.1, the R Foundation for Statistical Computing, Vienna, Austria). For a single test, P values less than .05 were considered to indicate statistical significance. We used Bonferroni correction in all post hoc comparisons throughout the study to control for multiple comparisons and we show the corrected P value except when comparing multiple brain regions, wherein we indicated the resulting new significance level. Group differences in Table 1 were tested by using Kruskal-Wallis test, χ2 test, or analysis of covariance, as appropriate. Shapiro-Wilk test (P < .05) showed deviations from the normality distribution in MH, tau, and amyloid β PET. Nonparametric Spearman correlation adjusted for sex, age, and education was subsequently used.

请问这里是怎么adjusted for sex, age的呢,SPSS里面的偏相关好像可以,但是是参数方法。

或者如果是一组定量资料和等级评分做相关分析时,把定量资料用年龄 性别拟合的模型得到的残差来与等级资料做两额spearman相关吗?

我自己是因为先在SPM里面用GLM在adjusted for age sex找到了与评分显著相关的脑区,之后我想提取脑区内的数据,来重现这种相关的结果,但是我的评分的分布是非正态的,不符合Pearson相关的假设,可能要用非参数的方法。那我这时候是直接把脑区里面的均值提取出来以后,用一个只有age sex 的模型的残差来和评分做非参数的相关可以吗。

如果你是想做spearman的偏相关,只需要把你的数据(比如影像数据)转换成rank(排序)即可。因为spearman相关就是rank的皮尔逊相关。你可以测试一下。不过rank可能有相等的情况(tie),所以最好是用现成的软件做,可能会有一定的校正。

如果你想用回归掉协变量的残差的方式,那么你的脑指标和评分都需要回归掉age/sex,因为这才和偏相关在思路上是一致的。

谢谢!但我的评分是等级资料,能够用线性模型回归吗,线性回归好像要求Y是连续型变量。
但我想了一下,我其实是想去除age/sex对脑指标的影响,那我只求脑指标的残差,然后和评分做Spearman相关,这样可行吗?

我只能说这样就和你GLM的结果不一样了,因为在GLM中,age/sex和脑指标、和评分的关系都是考虑了的。不过我也不是统计方面的专家,我也没有特别的信心说你这样做是错的,仅供你参考。

https://zhuanlan.zhihu.com/p/336236261
偏相关(Partial Correlation):是两个变量间的净相关,其他影响这两个变量关系的变量可以称为控制变量。偏相关系数是表示两个变量均剔除控制变量影响后的相关密切程度,等同于将两个变量分别对控制变量的回归残差间的相关系数。偏相关系数的平方表示去掉其他变量的影响后,一个变量可解释的另外一个变量变异的比例。部分相关(Part correlation):也称半相关(semipartial correlation),是某个变量剔除其他变量的影响后与另外一个变量的相关关系,其平方代表的是变量剔除其他变量的影响后可解释另外一个变量的总变异的比例。
偏相关与部分相关(半相关) - 知乎 (zhihu.com)

比如我们可以首先通过体重、胸腔横径与心脏面积进行线性回归获得残差,同样可以获得体重、胸腔横径与心脏纵径的回归残差,然后通过Bivariate过程获得两个残差的相关系数,即心脏面积与心脏纵径的偏相关系数

偏相关(Partial Correlation):是两个变量间的净相关,其他影响这两个变量关系的变量可以称为控制变量。偏相关系数是表示两个变量均剔除控制变量影响后的相关密切程度,等同于将两个变量分别对控制变量的回归残差间的相关系数。偏相关系数的平方表示去掉其他变量的影响后,一个变量可解释的另外一个变量变异的比例。

部分相关(Part correlation):也称半相关(semipartial correlation),是某个变量剔除其他变量的影响后与另外一个变量的相关关系,其平方代表的是变量剔除其他变量的影响后可解释另外一个变量的总变异的比例。