一种最优结构方程模型自动生成方法与流程

文档序号：13422312阅读：1131来源：国知局

本发明一般涉及计算机分析处理结构方程模型的领域，具体涉及一种最优结构方程模型自动生成方法。

背景技术：

结构方程模型是一种非常通用的、主要的线性统计建模技术，广泛应用于心理学、经济学、社会学、行为科学等领域的研究。这些等领域的研究中，研究人员经常会碰到研究中涉及的变量并不能准确、直接地测量。这种变量我们称之为潜变量，例如智力、学习动机、家庭社会经济地位、顾客满意度、顾客忠诚度等等。这些潜变量并不能直接准确测量，但可以通过某些间接的手段去估算它，即使用一些观测指标去测量那些潜变量。例如，在研究学生的学业成就方面的问题时，研究人员可以以学生的语文、数学、外语等科目的成绩去作为学生学业成就的指标。传统的统计分析方法并不能很好地处理这些潜变量，而结构方程模型就能同时很好地处理这些潜变量及其指标。相对来说，结构方程模型是一个包含面很广的数学模型，它可以分析一些涉及潜变量的非常复杂的关系。

现有的结构方程模型分析方法，从应用者的角度，都需要研究者根据应用领域的理论或者经验，提出一个基本的结构方程模型，继而利用统计分析软件，计算模型的拟合程度，分析模型的不足，再手动修正模型。在模型修正后模型仍然无法拟合，或者失去理论意义的情况下，甚至需要重新建立模型。这个过程需要研究者具有一定的专业基础，而且需要大量的反复验证实验，费时费力，让很多研究者望而却步。随着结构方程模型的应用范围的逐渐扩大，越来越多领域的研究者希望利用结构方程模型进行统计分析。最优结构方程模型自动生成方法将有助于解决用户使用结构方程模型的问题。

技术实现要素：

本发明针对当前结构方程模型建模技术的不足，提供了一种最优结构方程模型自动生成方法。本发明的目的在于在只确定结构方程模型的测量模型的情况下，迅速的生成所有结构模型，然后根据拟合指数的拟合情况来评判结构方程模型得分，并获取得分最高的n个模型，具体技术方案如下。

最优结构方程模型自动生成方法，包括以下步骤：

(a)存储预设的测量模型；

(b)根据步骤(a)的测量模型规模，遍历全局空间中所有的结构模型，每次选取一种结构模型，并且结合步骤(a)的测量模型，构建对应的结构方程全模型；

(c)将步骤(b)中的结构方程全模型作为输入，使用极大似然估计法估计参数，并计算出该模型的拟合指数；

(d)循环操作步骤(b)和(c)，直至搜索完全局空间中的结构模型；在遍历过程中给每个结构模型评分；

(e)根据拟合指数接受范围，计算模型得分，并按照得分高低排序，保存得分最高的结构方程全模型。

上述最优结构方程模型自动生成方法，步骤(a)中，采用特定数据结构存储结构方程的全模型，包括模型中的所有观测变量、所有潜在变量、变量归属关系和每个归属关系上的因子载荷量。设计的数据结构包括三个属性：1个观测变量列表，1个潜在变量列表，和一个二维矩阵。其中二维矩阵的行数为潜在变量的数量，列数为观测变量和潜在变量的总个数。

上述最优结构方程模型自动生成方法，步骤(b)中，设计了特定的遍历方法。该方法首先根据待分析的结构方程模型的潜在变量的数量m，计算由所有结构关系构成的全局空间大小n，其中n=3^m(m-1)/2。然后使用0~n-1的三进制表示方式来表示对应全局空间中的一种结构关系。例如假设潜在变量的个数为3，则全局空间的大小为n=3^3(3-1)/2=27。使用0~26的其中一个数字的三进制表述方式来表示全局变量的一种关系，即第1种结构关系为000(3)，第2种结构关系为001(3)，...第27种结构关系为222(3)。假设以上潜变量构成的有向图为g=<v,e>，v=｛v1,v2,v3｝，三进制数的数字‘0’表示不存在边，‘1’表示存在正向边，‘2’表示反向边，即‘011’表示v1v2间不存在关系，v1→v3，v2→v3。以此类推。确定了结构关系后，把关系按照有向图01邻接矩阵的形式存储在(a)设计的数据结构中。

上述最优结构方程模型自动生成方法，其特征在于(c)中设计了(a)中的数据结构转换为r语言中的结构方程模型模型构造语句的方法。待分析的结构方程模型，是使用r语言sem软件包中的结构方程模型定义语句定义的。把(a)中数据结构的数据转换成模型定义语言，传给r语言处理，并使用极大似然估计法得出估计参数和拟合指数。

上述最优结构方程模型自动生成方法，其特征在于(e)中，设计了一种结构方程模型评分方法。根据预先设定好的测量模型、结构模型和数据矩阵，可以计算出一系列拟合指数值。本方法利用结构方程模型的拟合指数值，来为结构方程模型打分。具体打分方式是，该模型的得分等于符合拟合指数的适配范围的拟合指数个数的总和。即一个模型的拟合指数中，有越多拟合指数符合接受范围，模型得分越高。例如，假设根据10个拟合指数打分，如果有8个拟合指数的值是符合该拟合指数的适配范围的，则给该模型打8分。

上述最优结构方程模型自动生成方法，其特征在于(e)中设计了筛选出最优的结构方程全模型的筛选方法。本方法把结构方程模型的得分当作键，得分越高，模型越好。因此利用最小堆的结构来存储结构方程模型，首先建立大小为n的堆，n为最优结构方程模型的个数，每次传入一个结构方程模型，若模型的得分比根节点的得分低，抛弃掉该模型；相反如果该模型的得分比根节点高，则剔除根节点，把该模型插进堆中并且重新建堆。一直输入直到全局空间所有的结构方程模型都遍历一遍，得到堆中的n个模型为最优的n个模型。

与现有技术相比，本发明具有如下优点和技术效果：

现在的结构方程模型分析方法，从应用者的角度，都需要研究者根据应用领域的理论或者经验，提出一个包含测量模型和结构模型的结构方程模型，继而利用统计分析软件，计算模型的拟合程度，分析模型的不足，再手动修正模型。在模型修正后模型仍然无法拟合，或者失去理论意义的情况下，甚至需要重新建立模型。这个过程需要研究者具有一定的专业基础，而且需要大量的反复验证实验，费时费力，让很多研究者望而却步。本发明并不需要提前设定结构方程模型的结构模型，在不知道结构模型的情况下，可以利用此方法迅速的生成所有结构模型，然后应用者可以根据感兴趣的拟合指数来得到最优的结构方程模型。

附图说明

图1为实施方式中二维矩阵的观测变量和潜在变量的归属关系示意图。

图2为实施方式中最优结构方程模型自动生成方法的流程图。

具体实施方式

以下结合附图对本发明的实施方式作进一步说明，但本发明的实施不限于此，需指出的是，以下若有未特别详细说明之过程，均是本领域技术人员可参照现有技术实现或理解的。

如图2，最优结构方程模型自动生成方法的主要流程包括以下步骤：

(a)读入用户设置的测量模型，数据文件；

(b)进行测量模型存储；

(c)搜索空间中所有结构模型，并计算拟合指数；

(d)给所有模型计算得分，并按照得分高低排序；

(e)保存最优的所有模型。

步骤(a)允许用户通过网页界面设置测量模型，包括设置所有观测变量、所有潜在变量、变量归属关系和每个归属关系上的因子载荷量。同时上传格式为excel的数据文件，要求该数据文件里的数据有特定的格式。述最优结构方程模型自动生成方法，步骤(a)中，采用特定数据结构存储结构方程的全模型，包括模型中的所有观测变量、所有潜在变量、变量归属关系和每个归属关系上的因子载荷量。设计的数据结构包括三个属性：1个观测变量列表，1个潜在变量列表，和一个二维矩阵。其中二维矩阵的行数为潜在变量的数量，列数为观测变量和潜在变量的总个数。如图1所示。其中左半部分为潜变量之间构成的有向图的01邻接矩阵，右半部分表示潜变量与观测变量之间的归属关系。在右半部分中，矩阵的元素值aij代表潜变量i与观测变量j之间存在归属关系，并且固定因子载荷量为值aij。若元素值aij为“-9999”代表潜变量i与观测变量j之间存在归属关系，但是因子载荷量待估计。若元素值aij不存放值，则代表潜变量i与观测变量j之间不存在归属关系。

步骤(b)采用矩阵的结构存储测量模型，矩阵的行代表的是潜在变量，行数等于潜在变量的个数。矩阵的列代表的是潜在变量和观察变量，列数等与潜在变量个数加上观察变量的个数。矩阵的前半部分元素代表结构模型，后半部分代表测量模型，用特定的元素值来代表归属关系和结构关系。上述最优结构方程模型自动生成方法，步骤(b)中，设计了特定的遍历方法。该方法首先根据待分析的结构方程模型的潜在变量的数量m，计算由所有结构关系构成的全局空间大小n，其中n=3^m(m-1)/2。然后使用0~n-1的三进制表示方式来表示对应全局空间中的一种结构关系。例如假设潜在变量的个数为3，则全局空间的大小为n=3³⁽³^-1)/2=27。使用0~26的其中一个数字的三进制表述方式来表示全局变量的一种关系，即第1种结构关系为000(3)，第2种结构关系为001(3)，...第27种结构关系为222(3)。假设以上潜变量构成的有向图为g=<v,e>，v=｛v1,v2,v3｝，三进制数的数字‘0’表示不存在边，‘1’表示存在正向边，‘2’表示反向边，即‘011’表示v1v2间不存在关系，v1→v3，v2→v3。以此类推。确定了结构关系后，把关系按照有向图01邻接矩阵的形式存储在(a)设计的数据结构中。

步骤(c)采用穷举搜索的方法，列举出步骤(b)中设置的测量模型对应的所有结构模型，并把它们作为完整的全模型，逐一进行分析。使用r语言中的sem程序包，使用极大似然估计方法，估算模型所有的待估计参数值，并由此计算出拟合指数。例如在用户设置的测量模型中，潜变量的个数为n，每两个潜在变量之间的关系有3种，则该模型存在n(n-1)/2个不同的潜变量对。则全局空间的大小为3的n(n-1)/2次方。搜索完全局空间的结构模型指的是分别把0到3的n(n-1)/2次方转换为表示一种结构关系的字符串。再根据该结构关系构建结构方程全模型。

步骤(d)中模型得分是根据该模型符合拟合指数的接受范围的个数的多少来计算的。一个模型的拟合指数中，有越多拟合指数符合接受范围，模型得分越高。使用特殊的数据结构存储模型，并且根据模型得分将模型排序，得到得分最高的n个模型为最优的n个模型。

如上即可较好地实现本发明并取得所述技术效果。本发明并不需要提前设定结构方程模型的结构模型，在不知道结构模型的情况下，可以利用此方法迅速的生成所有结构模型，然后应用者可以根据感兴趣的拟合指数来得到最优的结构方程模型。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄翰;胡友成;郝志峰
技术所有人：华南理工大学
我是此专利的发明人

上一篇：基于居民健康卡的支付系统及支付方法与流程
上一篇：一种用于精准预测胃癌患者预后的系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。