非参数检验的多因素方差分析—ART与GEE

在处理数据时,有时会面临使用非参数数据,或者数据非正态或非方差齐性的问题,此时,传统的因素分析方法也便可能不再适用。

众所周知,传统的F检验需要满足三个条件:

  1. 独立性假设:即样本之间必须相互独立
  2. 正态性假设:每组数据应该来自一个正态分布
  3. 方差齐性假设:各组数据的方差应当相等

然而,在实际研究中,很多研究者其实会忽略对数据的正态与齐性检验,并直接进行F检验,这样的检验方式无疑会增加结果假阳性(I型错误)的概率。

另外一种常见的方式是使用单因素非参数检验例如Wilcoxon检验, 弗里德曼检验(Friedman test)等。但是,这些方法无法处理多因素的情况,特别是无法处理因素之间的交互作用。

因此,对于不满足参数检验而需要使用非参数据检验的数据,则需要使用其他的方法来解决。

有学者整理了常见的一些统计方法,汇总表格如下(Wobbrock et al., 2011)1

目前来说,主要有两种思路:

广义估算方程(Generalized Estimating, GEE)

广义估算方程(Generalized Estimating Equations, GEE)是一种用于处理相关性数据(如时间序列数据、分层数据等)的统计方法,特别适用于纵向数据或重复测量数据的分析。GEE是在广义线性模型(Generalized Linear Models, GLM)的基础上发展而来的,旨在解决数据之间的相关性问题。

主要特点

  1. 处理相关性:GEE能够有效处理重复测量或分层数据中的相关性,避免了传统线性回归模型对数据独立性的严格要求
  2. 稳健性:即使在协方差结构指定不完全正确的情况下,GEE仍能提供渐近正确的参数估计和可信区间。这使得GEE在处理缺失数据或观测次数不均等的情况下表现出色
  3. 灵活性:GEE可以适用于多种类型的反应变量,并且允许多种类型的自变量。

应用场景

  • 纵向数据分析:例如,研究同一组对象在不同时间点的表现(如临床试验中的患者反应)
  • 多重比较:在进行多重假设检验时,GEE能够提供对组内相关性的考虑,从而更准确地评估处理效果
  • 缺失数据处理:在面对缺失数据时,GEE能够有效利用可用数据进行分析,而不需要完全的数据集

对齐秩转换(Aligned Rank Transform, ART)

ART适用于处理不符合正态分布假设的数据。ART的主要原理是通过对数据进行对齐(Alignment)和排序(Ranking),使其能够用于传统的方差分析(ANOVA),同时能够分析主效应和交互效用。

程序原理

从原理上,该算法基于五个基本步骤:

(1)计算残差

\(residual = Y – cell mean\)

其中,cell mean的算法示例如下:

(2)计算所有主效应和交互效应的估计效应值(这一步参见Wobbrock的文章,见文末)

(3)计算对齐后的Y’

\(Y’ = residual + estimated effect\)

(4)对Y’进行排序,得到Y”

(5)对Y”数据进行正常的ANOVA即可

具体实操:

其实如果严格按照上述的流程来做的话,数据分析流程实际上是十分复杂的,因此,ART的作者在论文中提到自己开发一个工具,并且我在来链接中也找到了他们做的转换工具,可以一键将初始数据转换为Y”数据,这样经过转换我们仅需要在SPSS中执行分析即可,工具链接可见:ARTool (washington.edu)

接下来举个例子,假如现在有两个自变量分别为A(被试间两水平)、B(被试内两水平),一个因变量Y(连续变量)。

由于我们的数据未通过正态性检验与方差齐性检验,因此,现在考虑使用ART分析方法。

(1)使用ART作者Wobbrock开发的工具,计算出A、B、A*B(交互作用) 的对齐秩次,分别标记为ART(Y) for A,ART(Y) for B, ART(Y) for A*B。

(2)将数据导入SPSS,注意,由于B为被试内变量,因此仍然按照被试内变量的方式是排列,如下图:

(3)执行重复测量ANOVA(重要!)

这里要注意,ART的主效应、交互效应是分开单独做的。
例如,想要做B的主效应,在选择主体内变量时仅选择ART_for B的值,在输出结果中,也仅看B的主效应(其他例如A、A*B都不看!)

依次类推,共做三次,分别做出A、B与A*B三个效应即可。

注意事项:
如果是完全被试间设计,就按照被试间设计的SPSS分析方法来。

对于该方法的使用,其实可能也存在一些问题。例如Luepsen, H. (2017)2在其文章中就指出,当平均每个处理组的样本量大于10时,应该尽量避免使用ART,因为这可能会导致一类错误的概率上升。当然,后续Elkin et al., (2021)3对ART又进行了一次校准,成为ART-C,如果感兴趣,也可以进一步了解一下。

相关链接:

  1. Aligned Rank Transform ANOVA | Real Statistics Using Excel (real-statistics.com)
  2. ARTool (washington.edu)

参考文献

  1. Wobbrock, J. O., Findlater, L., Gergle, D., & Higgins, J. J. (2011). The aligned rank transform for nonparametric factorial analyses using only anova procedures. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, 143–146. https://doi.org/10.1145/1978942.1978963 ↩︎
  2. Luepsen, H. (2017). The aligned rank transform and discrete variables: A warning. Communications in Statistics-Simulation and Computation46(9), 6923-6936. ↩︎
  3. Elkin, L.A., Kay, M., Higgins, J.J. and Wobbrock, J.O. (2021). An aligned rank transform procedure for multifactor contrast tests. Proceedings of the ACM Symposium on User Interface Software and Technology (UIST ’21). Virtual Event (October 10-14, 2021). New York: ACM Press, pp. 754-768. ↩︎

(注:以上内容系本人原创,创作不易,如若转载敬请注明出处,感谢!)

如果内容对你有所帮助,也欢迎赞助一杯咖啡~

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注