三组被试的F检验和one-way anova的区别

大家好!

我最近在用GLM做统计,我的数据是DTI的数据,用的是MRtrix3的fixelcfestats命令做GLM,据开发者称这个算法逻辑基本跟FSL中的randomise是一样的。
我有三组被试(病人和对照组,其中病人包括两个亚组)

我先做了T检验,对照组G1 vs 患者组G2:
design matrix: G1 G2 sex age TIV (其中sex,age,TIV都作为协变量回归了,并且手动demean了。)
contrast matrix: C1:1 -1 0 0 0
C2:-1 1 0 0 0

然后做了F检验,对照组G1 vs A亚组G2 vs B亚组G3:
design matrix: G1 G2 G3 sex age TIV (其中sex,age,TIV都作为协变量回归了,并且手动demean了。)
contrast matrix: C1:1 0 0 0 0 0
C2:0 1 0 0 0 0
C3:0 0 1 0 0 0

F matrix: [1 1 1]

由于分不清该用哪种contrast matrix,于是又做了ANOVA,对照组G1 vs A亚组G2 vs B亚组G3:

design matrix: G1 G2 G3 sex age TIV (其中sex,age,TIV都作为协变量回归了,并且手动demean了。)
contrast matrix: C1:1 -1 0 0 0 0
C2:0 1 -1 0 0 0
F matrix: [1 1]

做出来之后查看结果发现,两组T检验和三组ANOVA的结果是一模一样的,但是F检验与T和ANOVA的结果却相差很大,我不知道该信任哪一个, F还是ANOVA呢?
以及为什么T和ANOVA的结果会是一样的呢?(补充一下,T的两个contrast中,只有C1是有显著结果的,也即对照组>患者全组。)

之前我有看过Alex在另一个帖子中讨论过TBSS的三组问题,当中提到demean以后F和ANOVA结果应该是一致的。由于MRtrix与FSL不同,是自己手动demean的,不知道是这个差异吗?
有个小建议,希望论坛能出一个收藏帖子的功能,有些帖子当时看到有用,但是随着发帖数量的增多,隔一段时间再想翻看时就很难找到了。

(1)你说的帖子应该是这个:https://brainbbs.cn/t/topic/347,这个帖子里的demean是指对因变量进行demean,所以跟当前的情况关系不大。所以F检验和ANOVA的结果应该是不一样的,而且ANOVA的结果才是你想要的。这里的ANOVA检验是,至少有两组的差异不为0。而这里的F检验检验的是至少有一组的均值不为0,类似于单样本T检验的假设。
(2)你T检验里的G2应该指的是(A亚组G2+B亚组G3)合在一起的结果吧?这是为什么我还没想清楚。我查查资料再回复你。你有看看在ANOVA的情况下C1的结果和T检验里的C1的结果是一致的吗?
(3)我记得好像以前有收藏帖子的功能,我去解决一下这个问题。

谢谢Alex老师的解答!
(1)对的,我指的帖子就是您贴出来的链接。好的,我现在明白F和ANOVA的区别了。
(2)是的,T检验是对照组vs.所有患者组的,也即G1 vs. (G2+G3)。请问要怎么单独查看ANOVA中C1的结果呢?MRtrix3和FSL不同,并不会在F或ANOVA检验的结果中,生成单独的C1和C2的T检验结果。是不是我该做事后检验查看ANOVA中单个contrast的结果呢?还是我直接再单独跑一次两样本T检验呢(如果是这样的话,design matrix中还需要加入G3的吗)?
(3)好的,感谢Alex老师维护这个论坛!
(4)额外的问题,我是否可以不做两组的T检验,直接做ANOVA呢?其实,我有点觉得这两步有些重合了,直接ANOVA好像更能达到我的目的。我是参考这篇论文的统计步骤做的Fixel-based analysis reveals fiber-specific alterations during the progression of Parkinson’s disease
(5)做完ANOVA以后我需要做post hoc检验,请问我是直接利用ANOVA结果的mask提取出相应的平均fmri指标(例如FA),然后用SPSS做T检验吗?但是我有个疑惑,就是我的ANOVA显著tracts还挺多的,是每一条纤维束都要提取mean FA,然后做两两组间比较吗?假设有8条显著纤维束的话,这样就要比较8*3=24次(如果没算错的话),这样假阳性率就会增大很多欸,怎么解决这个问题呢,手动做Bonferroni矫正,设置p < 0.05/24 为临界值吗?
不好意思,之前没做过这方面的统计,困惑比较多T^T,再次谢谢Alex的耐心解答!

(1)我觉得这里的F和ANOVA都是F检验,区别只是检验的零假设不一样。我觉得FSL的wiki有点误导。:frowning:
(2)为什么G1 - (G2+G3)的T检验会和G1 - G2 - G3的F检验结果一样,我确实还没想明白(我对这些统计原理理解很浅,所以我都会严格按照官方文档去做。也许你可以去Matrix3或FSL的邮件列表问问专家,如果你搞清楚了也希望能告诉我。
(3)谢谢你提的很好的建议。
(4)我觉得如果你的亚组就是最终感兴趣的划分,那么直接ANOVA会更好。
(5)因为你显著的cluster包含的tracts比较多,如果混在一起做事后检验,结果看起来就比较粗糙。我觉得可以分成纤维束提取均值,然后对每条纤维束进行事后检验。理论上,应该需要校正多次比较,不过我觉得ANOVA已经控制了多重比较,所以我只会校正三次组间比较,而不考虑纤维束之间的校正了。我觉得影像里的统计还是有一些不一样的地方,如果严格去校正,最后可能什么结果都没有了,那显然是不合理的,因为和ANOVA的结果就矛盾了。

不好意思,Alex老师,由于您这次的回复我没有收到邮件提醒,所以才看到。
(1)确实,我按照fslwiki里的介绍理解以为这两种contrast构建方式出来的结果是等同的,所以结果不一样的时候我很困惑;
(2)我已经在MRtrix3的官方论坛里发帖一个礼拜了暂时没收到任何回复。如果有后续的话,我会来更新这篇帖子哒。
(3)不客气,期待论坛更新得更好!
(4)好的,谢谢Alex老师,那我先暂时不纠结T和ANOVA的问题了,直接做ANOVA了。
(5)是的,我考虑也是分别提取均值做事后检验这样讨论时更有针对性。假如严格按照纤维束之间的矫正后p值来比较的话,很可能是没有结果的。那按照您的意思,我就只需要将事后检验的临界值设为p < 0.05/3对吗?(害怕理解错,所以向您再确认一遍,感谢您花时间帮我解惑。)

是的,显著性水平设置为0.05/3即可。

Alex老师,您好!

关于post-hoc我还有些疑问。例如我做三组比较的TBSS,得到显著的cluster之后,需要制作cluster的mask做roi用于提取mean FA进行post-hoc。假如ANOVA后有三根纤维束是显著的,

  1. 那么根据p值提取出来的显著cluster的mask是三根的总和,如何能提取单根显著纤维束的mask做post-hoc呢?还是说我不需要提取单根纤维束的mean FA,只需要一个综合的mask就可以了?
  2. 我还想到一个办法是,我用atlas定位出显著cluster所在纤维束,然后利用altas制作单根纤维束的mask用于提取mean FA。但是有些纤维束上是部分显著,并不是整根显著的,这样提取整根纤维束的mean FA用来做post-hoc好像是有失偏颇的?

请问常规的做法是什么呢?

(1)我觉得取决于你的cluster有多大?如果cluster很小,虽然包含三条纤维束,仍然可以作为一个整体来做post-hoc。至于多小算小,就比较主观了。
(2)如果cluster很大,分成多个纤维束单独进行post-hoc也许能揭示更多信息。我觉得可以把cluster mask和atlas mask做交集,也就是对于某一条纤维束,只用和cluster mask有重叠的部分来提取值。

请问怎么能取交集呢?用什么命令呢

如果用FSL的话,比如:

fslmaths atlas.nii.gz -mul cluster_mask.nii.gz overlap.nii.gz

atlas.nii.gz就是分区模板,不同数字表示不同纤维束,cluster_mask.nii.gz就是cluster的二值mask,overlap.nii.gz表示分区模板和cluster mask的重叠部分,你用这个文件去提取每个纤维束的均值即可。

谢谢Alex老师,我已经成功提取了overlap_mask,但是现在有个问题是,几乎每条纤维束都有显著的voxel。。
这样做事后检验要做很多次,而且报告结果的话太多了。我看到有些文章会写明voxel大于某个数值的纤维束才会进行进一步分析,但是没看到他们这么做的依据是什么。
请问Alex老师,您知道限定cluster大小的依据吗?

我觉得你可以反过来考虑,比如就只想做三条纤维束,你就看卡多少个体素的时候剩下三条纤维束。依据的话,我觉得就是看如何报告结果能够最好的突出重点。当然,这个依据是主观的。

但是担心这样在论文里报告的时候,会不会被审稿人argue呀?虽然我至今看到的文章都没有提到他们是如何设置这个阈值的

我觉得这个阈值确实是比较主观的,如果担心审稿人不满意,你可以把所有涉及到的纤维束都算一遍,但是把自己认为不太重要的结果放在辅助材料。不过我觉得一些特别小的肯定是可以排除的,比如小于10个体素。

好嘞,谢谢Alex老师,给我解答了好多困惑!