摘要新世纪头20年,国内心理学11本专业期刊一共发表了213篇统计方法研究论文。研究范围主要包括以下10类(按论文篇数排序):结构方程模型、测验信度、中介效应、效应量与检验力、纵向研究、调节效应、探索性因子分析、潜在类别模型、共同方法偏差和多层线性模型。对各类做了简单的回顾与梳理。结果发现,国内心理统计方法研究的广度和深度都不断增加,研究热点在相互融合中共同发展;但综述类论文比例较大,原创性研究论文比例有待提高,研究力量也有待加强。
关键词心理统计,文献计量,内容分析
1前言
统计分析在心理学研究中发挥着重要作用。崔丽霞和郑日昌(2001)对1981~1998年发表在《心理学报》、《心理科学》和《心理发展与教育》上的论文所使用的研究方法进行了回顾:经常被使用的定量分析方法是显著性检验,包括正态检验、t检验、χ2检验和F检验。焦璨、黄泽娟等(2010)对1998~2008年发表在《心理学报》和《心理科学》上使用了统计方法的论文进行了文献分析:使用最多的依次是方差分析,t检验和相关分析;多元统计使用最多的是因子分析。此外,还有研究者对特定统计方法在心理学研究中的使用情况进行文献分析(例如,范津砚等,2003;赵必华,顾海根,2010;方杰等,2013;唐文清,方杰等,2014)。上述研究都是对统计方法在心理学研究中的应用情况进行文献分析,未见有对心理统计方法研究的文献分析。本文对2001~2020这20年间发表在国内心理学11本专业期刊(见表1)上的心理统计方法研究论文进行回顾和述评,将有助读者总览过去20年国内心理统计方法研究的总体情况和发展趋势,认识存在的问题和不足,对于心理统计学的发展很有意义。本文不涉及国内研究者发表在非心理学期刊上的论文或者海外期刊上的论文。为了节省篇幅,本文没有使用英文期刊文献,有需要的读者可以通过本文参考文献查找到相关英文期刊文献。
2研究方法
2.1论文来源及入选标准
论文来自国内11本心理学专业期刊(见表1)上的心理统计方法论文。以中国知网(https://www.cnki.net/)全文数据库为数据源,出版年限设为2001年1月1日~2020年12月31日,检索得到的心理统计方法类论文为研究对象。心理测量的方法研究(包括概化理论、项目反应理论和认知诊断理论)和元分析方法研究不在检索范围内。最终获得符合条件的论文213篇,发表期刊和年份的具体分布见表1。其中,发文最多的期刊前4位依次是:《心理科学》63篇,《心理科学进展》55篇,《心理学报》35篇和《心理学探新》34篇。从出版时间上看,2001~2005年35篇,2006~2010年40篇,2011~2015年85篇,2016~2020年53篇。后10年的发文数(138篇)远多于前10年(75篇),仅2011~2015这5年间发表的就超过了之前10年的总和。但是,相比2011~2015年,2016~2020年发文数有所下降。
2.2编码
根据内容所涉及的最主要统计方法对文章进行编码和归类。有5篇以上文章讨论同一方法的归为一类(每类可视为一个研究热点),否则归为“其他”类。有关结构方程模型(structuralequationmodel)39篇、测验信度(reliability)27篇、中介效应(mediationeffect)25篇(其中包含中介与调节的整合分析5篇)、效应量(effectsize)与检验力(testingpower)23篇、纵向(追踪)研究(longitudinalstudy)18篇、调节效应(moderationeffect)15篇(其中包含中介与调节的整合分析5篇)、探索性因子分析(exploratoryfactoranalysis)11篇、潜在类别分析(latentclassanalysis)10篇、共同方法偏差(commonmethodbias)8篇、多层线性模型(hierarchicallinearmodel)8篇、其他34篇。
3结果
新世纪头20年,国内心理统计方法研究按论文篇数形成了10个研究热点,下面做一个简单回顾。
3.1结构方程模型
心理统计方法研究中,有关结构方程模型(验证性因子模型是其特例)的论文最多,可以分为5个方面:1)模型拟合评价和模型选择;2)测量指标的合并(即题目打包);3)模型估计;4)测量不变性;5)结构方程建模的拓展。
温忠麟、侯杰泰和马什赫伯特(2004)指出,一个好的拟合指数应当具有3个特征,即与样本容量N无关、惩罚复杂的模型和对误设模型敏感。通过比较,他们建议使用NNFI(也称为TLI)和CFI(临界值为0.9),RMSEA(临界值为0.08)。郭庆科等(2007,2008)比较了不同的拟合指标在验证性因子分析的模型拟合中的表现,还利用模拟方法得出新的拟合指数临界值标准,但温忠麟和侯杰泰(2008)用简单的Z检验说明检验的临界值标准是不能通过模拟研究来确定的。温涵和梁韵斯(2015)建议报告RMSEA、NNFI和SRMR,并指出当NNFI准则(临界值0.9)接受了模型,则无需报告CFI。王阳等(2020)建议将等效性检验用于结构方程模型评价。该方法将推断统计元素融入了CFI和RMSEA,可以用于单个模型拟合评价和测量不变性检验。还有,柳恒超等(2007)讨论了嵌套模型情况下的模型选择(如似然比检验法)和非嵌套模型情况下的模型选择问题(如AIC指标法)。
卞冉等(2007)从题目组合的基本逻辑、优缺点以及组合方法等方面对题目组合的研究进行了概括。吴艳和温忠麟(2011a)系统述评了因子法、相关法、对称法、随机法等6种打包策略,给出了打包法的前提条件,即单维和同质;建议对于多维量表,在子量表内打包。
相关知识推荐:投心理学论文的期刊有哪些
测量不变性(等价性)是指观测指标和潜变量(因子)之间的关系在相比较的各个组间等同。白新文和陈毅文(2004)介绍了测量等价性的概念及其研究历史、在结构方程模型中测量等价性所要满足的5个条件和模型优劣判定的拟合度指数。刘军和吴维库(2005)介绍了测量不变性的各种形式,并演示了应用结构方程模型评估测量不变性的过程。郑显亮等(2011)通过一个实例演示了如何进行二阶因子模型的测量等价性检验。李冲和刘红云(2011)考察了样本量、组间样本量对比情况、阈值差异程度、量表长度等因素对等级数据的测量不变性检验效果的影响。刘红云和李冲等(2012)比较了单维测验情境下基于分类数据的验证性因子模型和基于项目反应理论的测量不变性检验方法,以及多维测验情境下基于分类数据的验证性因子模型和基于多维项目反应理论模型的卡方检验方法的差异。温聪聪等(2019)讨论了当截距恒定假设因其过于苛刻而无法满足时,可以使用对齐法,通过检验设定的模型参数的近似恒定性而进行跨群组因子均值比较。
梁莘娅和杨艳云(2016)比较了稳健极大似然估计和贝叶斯估计在结构假设和分布假设不满足时的验证性因子分析中的表现,结果发现当数据呈非正态分布时,贝叶斯估计法更优。但当样本量不足且数据呈正态分布时,稳健极大似然估计法更好。因子分析假设观测变量是连续和正态分布的,观测变量和因子是线性相关的。如果假设违背,还可以采用项目反应理论进行题目因子分析(吴瑞林,涂冬波,2013;俞宗火等,2006)。刘红云等人比较了分类数据的验证性因子分析和项目反应理论在单维和多维题目因子分析的参数估计中的表现(刘红云,李美娟等,2012;刘红云,骆方等,2012)。
结构方程建模的拓展主要体现在验证性因子分析模型的拓展,包括探索性结构方程模型,因子混合模型、高阶因子模型和双因子模型。麦玉娇和温忠麟(2013)介绍了探索性结构方程模型及其主要功能和优势。探索性结构方程模型的测量模型类似于探索性因子分析(允许有跨因子负荷),同时保留了验证性因子分析的功能。陈宇帅等(2015)介绍了因子混合模型的数学模型、基本原理,归纳了因子混合模型的主要优势以及实际应用。因子混合模型是验证性因子模型和潜在类别模型的整合,它能描述不同潜在类别的因子模型。
双因子模型是一种既有全局因子又可以有多个局部因子的模型(温忠麟,叶宝娟,2011)。顾红磊等(2014)讨论了双因子模型在信度研究、平衡量表、探索性因子分析等方面的应用。双因子模型的研究主要分为三个方面。第一、双因子模型和高阶因子模型的比较(徐霜雪等,2017;温忠麟等,2019),研究什么情况下使用双因子模型进行预测比较好。第二、双因子模型和随机截距因子分析模型的比较(韦嘉等,2016)。第三、利用双因子模型给出报告测验总分和维度分的策略,多维量表何时可以合成总分,何时只能报告各维度合成分数(刘玥,刘红云,2017;顾红磊,温忠麟,2017)。
结构方程模型的其它拓展方向如下。王晓丽等(2011)指出,根据指标和潜变量之间的关系,结构方程的测量模型可分为形成性测量模型(指标影响潜变量)和反映性测量模型(潜变量影响指标)。任学柱等(2017)使用结构方程建模预设路径模型,此模型可用于认知心理学的实验数据分析。还有研究者使用结构方程建模行动者−对象互依性模型,用于成对数据(如夫妻数据、亲子数据)分析(李育辉,黄飞,2010)和成对模式(主体模式、客体模式、对偶模式与对比模式)检验(刘畅,伍新春,2017)。王孟成、邓俏文和毕向阳(2017)以一个验证性因子分析为例,介绍了贝叶斯结构方程建模的分析过程。张沥今等(2019)介绍了几类常用的贝叶斯结构方程模型及其应用现状。
此外,还有其他讨论结构方程模型的论文(方平等,2001;方平等,2002;李旭等,2001;赵必华,顾海根,2010;郑文智,吴文毅,2014)。至于中介模型、调节模型、纵向模型和多层线性模型中的结构方程建模研究参见本文的相应部分。
3.2信度分析
信度分析类的研究主要包括3个方面:α系数与内部一致性、同质性的辨析;信度的置信区间研究;多层和纵向数据的信度研究。
传统教科书将α系数称为内部一致性信度或者同质性系数,这其实是个误解。孟庆茂和刘红云(2002)讨论了α系数作为测验同质性信度的局限性(也见刘红云,2008)。温忠麟和叶宝娟(2011)明确指出α系数既不能用来衡量测验的内部一致性,也不能用来衡量测验的同质性;在很一般的条件下,α系数和同质性系数都不超过内部一致性信度(又称为合成信度),后者不超过测验信度。
屠金路等(2005)展示了如何使用Bootstrap法进行单维测验合成信度的区间估计。叶宝娟和温忠麟(2011)比较了Bootstrap法、Delta法和直接用统计软件输出的标准误在计算单维测验合成信度的置信区间中的表现,推荐用Mplus软件估计Delta法的单维测验合成信度的置信区间。杨强等(2014b)给出了SPSS软件窗口操作计算单维测验的合成信度的方法。叶宝娟和杨强(2015)探讨了如何用Delta法计算一般的单维测验合成信度及其置信区间。叶宝娟等(2013)在变化系数模型下推出合成信度元分析点估计及区间估计的方法。叶宝娟和温忠麟(2013b)还比较了α系数的7种区间估计方法。
屠金路等(2010)推导出一个多维测验合成分数的信度估计公式。叶宝娟和温忠麟(2012b)探讨了如何用Delta法估计多维测验合成信度及其置信区间。杨强等(2014a)比较了Delta法与Bootstrap法在估计多维测验合成信度的置信区间中的表现。王孟成和叶宝娟(2014)展示了用Mplus软件实现多维量表各种信度的计算。
在决定将多维测验分数合并成测验总分时,应当考虑测验同质性高低,一般认为同质性系数超过0.5,合成总分才有意义(温忠麟等,2018)。叶宝娟和温忠麟(2012a)探讨了如何用Delta法估计多维测验的同质性系数的置信区间,并与Bootstrap法计算的结果进行比较,发现两者差异很小。顾红磊和温忠麟(2014)发现项目表述效应(由项目表述方式的差异引起的与测量内容无关的系统变异)对自陈测验的同质性系数有影响。
叶宝娟等(2012)介绍了4种追踪研究中测验信度的估计方法。叶宝娟和温忠麟(2013c)用两水平验证性因子分析导出一个信度公式进行两水平单维测验的信度估计。田雪垠等(2019)使用Mplus软件展示了如何利用两水平验证性因子分析计算两水平多维测验的信度估计。
对其他信度的研究包括评分者信度(孙晓敏,张厚粲,2005)、质性研究中的编码者信度(徐建平,张厚粲,2005)、信度的概括化(关丹丹,张厚粲,2004)。此外,还有其他讨论信度分析的论文(安胜利,陈平雁,2001;顾海根,李超,2005;关丹丹等,2005;关守义,2009;焦璨等,2008;刘拓,戴晓阳,2011),有兴趣的读者可以参考。
3.3中介效应分析
中介效应分析是用来理解自变量X对因变量Y的影响是如何通过中介变量M实现的。温忠麟、张雷等(2004)率先引入简单中介模型并讨论其检验步骤,推动了国内中介效应分析的方法研究和应用。中介效应的方法学研究主要从4个方面展开:检验方法;中介效应量;中介模型的拓展;类别变量的中介效应检验。
中介效应的检验方法研究始于逐步法,依次检验法和Sobel法都可以是逐步法中的关键一步(温忠麟,张雷等,2004)。方杰、张敏强和李晓鹏(2011)综述了后来发展的乘积分布法、Bootstrap法和贝叶斯法(又称马尔科夫链蒙特卡罗法),方杰和张敏强(2012,2013)用模拟方法比较了这三种方法在简单中介分析中的表现,以及参数和非参数Bootstrap法在简单中介分析中的表现。温忠麟和叶宝娟(2014a)提出了一个包含依次检验和Bootstrap法的中介效应检验程序。方杰和温忠麟(2018a)比较了MonteCarlo法、参数Bootstrap法和贝叶斯法在2-1-1多层中介分析中的表现。
对于中介效应量,方杰等(2012)介绍了4种中介效应的效应量,即中介效应占总效应的比例PM、中介效应和直接效应的比RM、以及两个定义比较复杂的2Rmed和2k。温忠麟等(2016)明确指出,2Rmed和2k没有单调性,不适合作为中介效应量,他们建议报告ab的标准化估计值,当ab和c符号一致时才能使用PM作为中介效应量。
简单中介模型被拓展到多重中介模型、多层中介模型、中介与调节的整合模型和纵向数据的中介模型。柳士顺和凌文辁(2009)介绍了多重中介效应模型,并用Sobel法进行显变量的多重中介模型分析。方杰、温忠麟、张敏强和孙配贞(2014)建议通过增加辅助变量,利用Bootstrap法进行潜变量的多重中介模型分析。方杰等(2010)介绍了显变量的多层中介效应模型分析方法。方杰、温忠麟、张敏强和任皓(2014)进一步介绍了如何利用多层结构方程模型进行潜变量的多层中介效应模型分析。刘红云等(2011)发现当数据符合1-1-1随机中介效应模型时,使用1-1-1固定中介效应模型进行多层中介分析将导致错误的中介效应估计。
有调节的中介是指中介过程(X→M→Y)受到调节变量Z的影响,即中介效应大小会随着调节变量Z的不同取值而变化。温忠麟等(2006)讨论了如何用依次检验法检验后半路径受到调节的中介模型。温忠麟和叶宝娟(2014b)评述了3种有调节的中介模型的分析方法:依次检验法、系数乘积的区间检验法和中介效应差异检验法。方杰、张敏强等(2014)介绍了如何用系数乘积的区间检验法(贝叶斯法)进行有调节的中介模型检验。方杰和温忠麟(2018b)进一步阐述了如何使用潜调节结构方程方法进行潜变量的有调节的中介模型检验。
有中介的调节模型意味着自变量X对因变量Y的效应受到调节变量Z的影响,而调节效应(至少部分地)通过中介变量M对因变量Y起作用。温忠麟等(2006)探讨了如何用依次检验法检验有中介的调节模型。叶宝娟和温忠麟(2013a)系统地评述了检验有中介的调节模型的5种方法。另外,刘国芳等(2018)介绍了基于交叉滞后面板模型、潜变量增长模型和潜变量分数变化模型的纵向中介效应检验。
如果自变量为k个类别(k≥3),中介变量和因变量为连续变量的中介效应检验,方杰等(2017)建议将多类别自变量进行虚拟编码,考察k−1个相对中介效应是否显著。王阳和温忠麟(2018)介绍了两水平被试内设计(即自变量是二分类别变量(如实验组和控制组),中介变量和因变量是各重复测量二次的连续变量)的中介效应检验。如果中介变量和(或)因变量为类别变量,应该用Logistic回归取代通常的线性回归进行中介效应检验(刘红云等,2013;方杰等,2017)。刘红云等(2013)考察了因变量类别数对中介效应检验结果的影响,发现随着类别数的增加,Logistic回归与通常线性回归的差别越来越小。方杰等(2017)介绍了中介变量或(和)因变量为类别变量的中介效应检验的发展过程(即尺度统一的过程)。此外,还有其他讨论中介效应的方法论文(卢谢峰,韩立敏,2007;杜岸政等,2014;甘怡群,2014;江程铭,李纾,2015),有兴趣的读者可以参考。
3.4效应量和检验力
效应量(又称效果量)和检验力(又称统计功效)都和假设检验问题密切相关,因此将假设检验问题在此一并讨论。吴艳和温忠麟(2011b)讨论了检验力与两类错误率和效应量的关系,提供了一个可操作的统计分析流程。吕小康(2012)介绍了假设检验思想的提出者Fisher与Neyman-Pearson在假设检验问题上的分歧。仲晓波的系列研究述评了假设检验受到的批评和争议,并建议用效应值置信区间表示心理学实验数据分析的结果,这样能弥补传统假设检验的备择假设不可证伪以及只能提供定性结论的不足(仲晓波等,2008;仲晓波,2010a;2010b;2015;2016)。胡传鹏等(2016)指出,过度依赖虚无假设检验是心理学研究可重复性不高的深层原因之一(但也有非统计学根源,骆大森,2017)。刘佳等(2018)建议完善虚无假设检验流程来提高心理学研究的可重复性。胡传鹏等(2018)建议将贝叶斯因子(对零假设H0或者备择假设H1的支持程度)作为一种零假设检验的替代和(或)补充方法。——论文作者:温忠麟1方杰2沈嘉琦1谭倚天1李定欣1马益铭1
转载请注明来自:http://www.lunwencheng.com/lunwen/jgu/20266.html