结构方程建模中的多组分析
测试子人群效应
多组分析(MGA)是一种统计技术,它允许研究人员通过启用具有群组特定估计或群组间相等估计的结构方程模型(SEM)来研究子人群或人口分段之间的差异。
利用MGA可以研究变量的平均值、回归、载荷、方差和协方差之间的差异,因为所有这些参数都可以在SEM中进行建模。因此,即使其他建模技术(例如方差分析或交互作用的回归)可以调查分组变量的作用,但这些技术在SEM中比MGA不够灵活。
图1. 多组分析的概述和推断策略。作者提供的图像。
多组分析的常见用途
无论何时有兴趣探索群体差异,MGA都可以成为一种有用的工具。当数据收集到个体上时,群体通常是根据具有少量级别的因素(例如性别、种族、职业、家庭状况、健康状况等)来定义的,但也可以根据其他各种因素来定义,具体取决于领域、数据和分析背景。以下是在几个不同领域中可以用MGA回答的问题的一些例子:
消费者研究
- 产品的满意度(或质量)在人口分段之间是否不同?
人力资源分析
- 员工绩效(或动机)在公司分支或部门之间是否相等?
医疗保健
- 基于药品制造商,患者报告的结果是否不同?
市场营销
- 新的营销活动是否在不同地理区域内有效地提高了品牌声誉?
心理学
- 情感体验是否存在跨文化差异?
教育
- 女性和男性的学术成就的增长是否相等?
在多个群体中测量未观察到的变量
所有上述问题都涉及到未观察到的变量(例如满意度、绩效等),也称为潜变量。由于这些变量无法直接观察,因此它们很难测量。
图2. 比较未观察到(潜在)变量和观察到变量的测量。作者提供的图像。
其中一个困难是不同的群体可能对这些变量有不同的概念。问问自己:
什么是满意度?
什么是良好的绩效?
你的回答是否可能与具有不同生活经历的人不同?
很多时候,答案是肯定的。
幸运的是,我们可以通过实证测试来确定不同群体是否以类似的方式概念化潜在变量。这种测试是在SEM框架中通过MGA进行的,被称为因子不变性(又称测量不变性)测试。因子不变性测试对于确保跨群体比较有效非常关键;因此,如果存在潜变量,则必须在比较回归或平均值之前进行这些测试(即结构参数)。
图3. 建模未观察到的变量的挑战在于它们可能在子人群之间没有测量到相同的事物。作者提供的图像。
测试参数之间的差异
为了测试不同群体之间的参数差异,研究人员通常会在群体之间拟合具有和不具有相等约束的SEM。然后,使用似然比检验(等同于卡方差异检验)和其他适合度统计量(例如比较适合度指数和平均误差平方根)来比较两个结果模型,以评估是否对模型拟合施加约束会导致统计显着的恶化。如果模型的拟合没有显着恶化,则保留具有相等约束的模型,并得出结论认为所考虑的人群在测试的参数上没有显着差异。相反,如果模型的拟合显着恶化,则保留没有约束的模型(即每个群体都可以拥有自己的估计值),并得出结论认为所考虑的人群在测试的参数上存在显着差异。
下面的图示展示了MGA在一个简单的线性回归的两组示例中的策略。该图显示了在一个参数上放置的等式约束。模型1具有零自由度(即,它是完全饱和的),而模型2具有来自等式约束的一个自由度。这些模型基于它们的卡方差异进行比较,其差异也服从自由度为1(跨模型自由度差异)的卡方分布。可以通过同时对多个参数施加等式约束来进行不太具体的测试。
图4. 一个简单线性回归的两组示例中MGA的策略。作者提供的图片。
SEM是作为确认性模型开发的。也就是说,人们制定假设,将其转化为可测试的统计模型,并使用推断来确定数据是否支持假设。这种方法也应用于MGA,并且对于避免大型I型错误率(导致在研究人群中没有真正存在的统计效应)至关重要。因此,不建议进行跨组的所有可能比较。
MGA估计的直觉
免责声明:以下段落是为希望加深对MGA理解的方法学家准备的。本节假定读者已全面了解全信息最大似然估计器。此外,此处概述的步骤仅用于解释MGA背后的逻辑。实际上,按照这些步骤进行MGA将是低效的,因为统计软件应使用简化此过程的算法。
MGA的估计与具有缺失数据的简单SEM的估计没有区别。在MGA-SEM的标准实现中,用户提交他们想要分析的数据以及一个分组变量,该变量指示每个观测所属的组。使用分组变量需要进行简单的数据操作步骤,以设置用于多组分析的分析。下图展示了提交进行分析的数据以及进行MGA的数据重构。
图5. 用户输入的数据以及为进行多组分析重构的数据。作者提供的图片。
由此产生的数据现在可以使用全信息最大似然作为估计量,以确保所有行在数据中被提交进行分析,尽管存在缺失数据。从重构的数据中得出的一些便利结果是:
- 任何给定行的对数似然仅受到非缺失单元格的影响,因此将所有“Group 0”行的对数似然相加会产生该组的对数似然。类似地,将所有“Group 1”行的对数似然相加将产生第1组的对数似然。每个组的对数似然用于估计整个模型的卡方统计量,该统计量量化每个组的不匹配。
- 缺失值的模式禁止跨组变量的任何参数估计(例如,Var1_0和Var1_1的协方差不可估计),这是不重要的,因为MGA关注的是跨组效应的比较而不是跨组估计。
- “香草SEM”允许对参数设置等式约束。因此,使用重构的数据在SEM中,可以指定具有每个组变量子集的两个相同模型,并且可以在组之间的等效参数上放置等式约束。重申一遍,所有这些都可以在标准SEM中完成,而不需要要求软件明确地进行MGA。
幸运的是,想要进行MGA-SEM的用户不需要执行这些步骤!SEM软件通过允许用户指定分组变量来使拟合多组模型变得非常简单。然而,进行数据操作(图5)并使用标准SEM进行MGA-SEM将加深您对该主题的理解。要了解更多信息,请查看下面引用的资源。
JMP中应用多组分析的逐步示例
用于因子(测量)不变性的多组分析的书籍章节:
Widaman,K。F.,& Olivera-Aguilar,M。(2022)。使用确认性因子分析研究测量不变性。结构方程模型手册,367。
使用替代拟合指数进行不变性测试的期刊文章:
陈凡凡(2007)。适合度指数对测量不变性缺乏敏感性。结构方程建模:多学科杂志,14(3),464-504。
本文最初于2023年2月27日在JMP用户社区上发表。