在处理数据时,有时会面临使用非参数数据,或者数据非正态或非方差齐性的问题,此时,传统的因素分析方法也便可能不再适用。
众所周知,传统的F检验需要满足三个条件:
- 独立性假设:即样本之间必须相互独立
- 正态性假设:每组数据应该来自一个正态分布
- 方差齐性假设:各组数据的方差应当相等
然而,在实际研究中,很多研究者其实会忽略对数据的正态与齐性检验,并直接进行F检验,这样的检验方式无疑会增加结果假阳性(I型错误)的概率。
另外一种常见的方式是使用单因素非参数检验例如Wilcoxon检验, 弗里德曼检验(Friedman test)等。但是,这些方法无法处理多因素的情况,特别是无法处理因素之间的交互作用。
因此,对于不满足参数检验而需要使用非参数据检验的数据,则需要使用其他的方法来解决。
有学者整理了常见的一些统计方法,汇总表格如下(Wobbrock et al., 2011)1:
目前来说,主要有两种思路:
广义估算方程(Generalized Estimating, GEE)
广义估算方程(Generalized Estimating Equations, GEE)是一种用于处理相关性数据(如时间序列数据、分层数据等)的统计方法,特别适用于纵向数据或重复测量数据的分析。GEE是在广义线性模型(Generalized Linear Models, GLM)的基础上发展而来的,旨在解决数据之间的相关性问题。
主要特点
- 处理相关性:GEE能够有效处理重复测量或分层数据中的相关性,避免了传统线性回归模型对数据独立性的严格要求。
- 稳健性:即使在协方差结构指定不完全正确的情况下,GEE仍能提供渐近正确的参数估计和可信区间。这使得GEE在处理缺失数据或观测次数不均等的情况下表现出色。
- 灵活性:GEE可以适用于多种类型的反应变量,并且允许多种类型的自变量。
应用场景
- 纵向数据分析:例如,研究同一组对象在不同时间点的表现(如临床试验中的患者反应)。
- 多重比较:在进行多重假设检验时,GEE能够提供对组内相关性的考虑,从而更准确地评估处理效果。
- 缺失数据处理:在面对缺失数据时,GEE能够有效利用可用数据进行分析,而不需要完全的数据集。
对齐秩转换(Aligned Rank Transform, ART)
ART适用于处理不符合正态分布假设的数据。ART的主要原理是通过对数据进行对齐(Alignment)和排序(Ranking),使其能够用于传统的方差分析(ANOVA),同时能够分析主效应和交互效用。
程序原理
从原理上,该算法基于五个基本步骤:
(1)计算残差
\(residual = Y – cell mean\)其中,cell mean的算法示例如下:
(2)计算所有主效应和交互效应的估计效应值(这一步参见Wobbrock的文章,见文末)
(3)计算对齐后的Y’
\(Y’ = residual + estimated effect\)(4)对Y’进行排序,得到Y”
(5)对Y”数据进行正常的ANOVA即可
具体实操:
其实如果严格按照上述的流程来做的话,数据分析流程实际上是十分复杂的,因此,ART的作者在论文中提到自己开发一个工具,并且我在来链接中也找到了他们做的转换工具,可以一键将初始数据转换为Y”数据,这样经过转换我们仅需要在SPSS中执行分析即可,工具链接可见:ARTool (washington.edu)。
接下来举个例子,假如现在有两个自变量分别为A(被试间两水平)、B(被试内两水平),一个因变量Y(连续变量)。
由于我们的数据未通过正态性检验与方差齐性检验,因此,现在考虑使用ART分析方法。
(1)使用ART作者Wobbrock开发的工具,计算出A、B、A*B(交互作用) 的对齐秩次,分别标记为ART(Y) for A,ART(Y) for B, ART(Y) for A*B。
(2)将数据导入SPSS,注意,由于B为被试内变量,因此仍然按照被试内变量的方式是排列,如下图:
(3)执行重复测量ANOVA(重要!)
这里要注意,ART的主效应、交互效应是分开单独做的。
例如,想要做B的主效应,在选择主体内变量时仅选择ART_for B的值,在输出结果中,也仅看B的主效应(其他例如A、A*B都不看!)
依次类推,共做三次,分别做出A、B与A*B三个效应即可。
注意事项:
如果是完全被试间设计,就按照被试间设计的SPSS分析方法来。
对于该方法的使用,其实可能也存在一些问题。例如Luepsen, H. (2017)2在其文章中就指出,当平均每个处理组的样本量大于10时,应该尽量避免使用ART,因为这可能会导致一类错误的概率上升。当然,后续Elkin et al., (2021)3对ART又进行了一次校准,成为ART-C,如果感兴趣,也可以进一步了解一下。
相关链接:
- Aligned Rank Transform ANOVA | Real Statistics Using Excel (real-statistics.com)
- ARTool (washington.edu)
参考文献
- Wobbrock, J. O., Findlater, L., Gergle, D., & Higgins, J. J. (2011). The aligned rank transform for nonparametric factorial analyses using only anova procedures. Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, 143–146. https://doi.org/10.1145/1978942.1978963 ↩︎
- Luepsen, H. (2017). The aligned rank transform and discrete variables: A warning. Communications in Statistics-Simulation and Computation, 46(9), 6923-6936. ↩︎
- Elkin, L.A., Kay, M., Higgins, J.J. and Wobbrock, J.O. (2021). An aligned rank transform procedure for multifactor contrast tests. Proceedings of the ACM Symposium on User Interface Software and Technology (UIST ’21). Virtual Event (October 10-14, 2021). New York: ACM Press, pp. 754-768. ↩︎
(注:以上内容系本人原创,创作不易,如若转载敬请注明出处,感谢!)
如果内容对你有所帮助,也欢迎赞助一杯咖啡~