关于统计分析中协变量选择

在做两组间的不同小脑叶的体积比较时,选择协变量的依据是什么呢,有的文献写年龄+性别+TIV,有的又只是年龄和性别,甚至有的在做组件比较时会把某个变量加上,但当做偏相关的时候会把变量剔除。
我自己在做的时候,发现不同的协变量时,有组件差异的脑叶会有些不同。

个人观点(不一定对):(1)如果两组被试在协变量上的分布是匹配的,那么可以不加协变量(加了也可以);(2)如果要加协变量,应该加已知的最重要的协变量,比如年龄、性别等,这可能需要一定的理论和文献证据,比如TIV一般在分析体积的时候会加,但是在分析皮层厚度的时候就不加(因为有相当充足的证据表明体积和TIV有强相关,而皮层厚度没有);(3)如果有组间比较和相关分析,最好协变量是保持一致,不然有点前后矛盾;(4)至于为什么文献里各种都有,我个人认为一个很重要的原因是,是从结果反过来考虑的,显然这不是一个合理的做法;(5)如果不同的协变量组合对结果影响非常大(如果p值从0.04变成了0.06,我觉得这影响并不算大),可能需要研究一下为什么会这样,是不是被试匹配存在问题?或者协变量和组别存在交互作用等等。

谢谢解答!