一种多值定性比较分析数据处理方法

文档序号:10613346阅读:919来源:国知局
一种多值定性比较分析数据处理方法
【专利摘要】本发明涉及一种多值定性比较分析数据处理方法,它采用如下的步骤方法:选取想要被分析的解释变量和被解释变量,通过计算Nc(ri)来进行初步筛选候选规则;通过计算Cc(ri)来进行进一步筛选,然后计算Complex及Parsimonious分析结果,再使用反设事实计算,生成初步Intermediate分析结果。随后,fm-QCA会自动计算每条规则的相关覆盖率和一致性,并对其可信度进行印证;得到最终的Intermediate分析结果。它具用支持多值解释变量及被解释变量的数据,实现多值逻辑化简,Intermediate solution自动生成和引入候选项集一致性检测,提高分析精度等优点。
【专利说明】
一种多值定性比较分析数据处理方法
技术领域
[0001] 本发明涉及一种多值定性比较分析数据处理方法。
【背景技术】
[0002] 定性比较分析方法(Qualitative Comparative Analysis,简称Q C A)是由国际 著名社会学家、政治学家Ragin于1987年提出的数据分析方法。该方法能够分析因素及因 素组合(Configuration)对事件结果影响关系,从而帮助寻找更好的事件归因解释,适用 于国家外交危机、国际战争爆发、社会革命事件等重大事件分析。该方法白提出以来,在国 际上得到了广泛应用,其中Dixon在2004年将其应用到工业领域[2] ;Amenta在2005年
[3] 、Hagan&Hansford_Bowles 在 2005 年[4]、Osa&Corduneanu_Huci 在 2003 年[5]分别将 其应用到社会运动的研究;Wickham-Crowley在1991年将其应用于社会革命研究[7]。该 方法相比回归分析等其他分析方法具有独到优势,在社会学及国际政治学领域占有重要地 位。
[0003] 对于国际QCA领域而言,当前知名QCA方法包括csQCA、fsQCA以及mvQCA。其中 csQCA支持布尔数据集,fsQCA支持模糊数据集,mvQCA支持多值数据集。在研究中我们发 现,对于众多社会学、政治学问题,多值数据具有更好的解释力度。但csQCA、fsQCA不能 支持多值数据分析,mvQCA虽能导出分析结果,却不能给出最具参考意义的Intermediate solution。同时由于其内部算法原因,不能实现完备的多值逻辑化简,也不能支持被解释变 量为多值的情况,从而导致最终分析结果不能满足社会学、政治学专家分析需要。对于国 内而言,目前多值定性比较分析方法研究及其软件领域仍处于一片空白,亟待出现相应方 法弥补空缺。

【发明内容】

[0004] 本发明的目的在于针对现有技术的缺陷和不足,提供一种框架统一,设计合理、使 用方便的一种多值定性比较分析数据处理方法,它所提出的多值定性比较的数据分析方法 (fm-QCA),成功克服了现有QCA方法在多值定性比较分析领域的不足;它具用支持被解释 变量及解释变量均为多值数据,实现多值逻辑化简,Intermediate solution自动生成和引 入候选项集一致性检测,提高分析精度等优点。
[0005] 为实现上述目的,本发明采用的技术方案是:
[0006] 本发明所述的一种多值定性比较分析数据处理方法,它采用如下的步骤方法:
[0007] 1)选择解释变量和被解释变量:
[0008] 步骤1 :收集相关的需要分析的大量数据;
[0009] 步骤2 :针对具体的需分析的情况,从步骤一选择与其相关联的数据;
[0010] 步骤3 :分析开始前需要选取想要被分析的解释变量和被解释变量;
[0011] 2)生成候选规则:
[0012] 步骤4 :根据步骤三所选取的解释和被解释变量,fm-QCA自动生成候选规则, 通过Njri)来进行初步筛选来实现;该规则被进一步检验后将被用于生成Complex及 Parsimonious 分析结果;
[0013] 3)计算凡〇^)来进行初步筛选:
[0014] 步骤5 :Njri)是用来筛选候选规则是否有真实案例支撑的一个重要指标,该指标 能够筛选出具有相符案例的规则,其计算方法如下:
[0015]
[0016] j ·
[0017] 步骤6 :设定筛选阈值λ,该筛选阈值λ可由人为指定,只有那些真实案例支撑数 大于或等于阈值λ的规则才会被用于生成最终结果,形成候选规则A ;
[0018] 步骤7 :而那些小于该值的候选规则B则会被保留下来,设定为Remainders,并且 参与到Intermediate结果生成中;
[0019] 4)计算来进行进一步筛选:
[0020] 步骤8 :根据步骤6,对于真实案例支撑数大于或等于阈值λ的规则的候选规则 Α,利用(;(Γι)来进一步筛选。该(;(Γι)是候选规则的一致性筛选指标,其计算方法如下:
[0023] 步骤9 :在多值情况中,考虑到被解释变量的组合情况,此时可用C' e(ri)来代替 Cjri)的计算过程,如下:
[0021]
[0022]
[0024]
[0025] 步骤10 :设定筛选阈值μ,该筛选阈值μ同样可由用户指定,利用步骤9的计算 方法,只有一致性大于或等于μ的规则会被用于生成Intermediate结果,形成候选规则 C;
[0026] 步骤11 :小于筛选阈值μ的候选规则D则会被丢掉,设定为Drop Rule ;
[0027] 5)计算 Complex 及 Parsimonious 分析结果,如下:
[0028] 步骤12 :生成用于产生Complex及Parsimonious分析结果的规则集合,方法如下 乂丄、"scpx i\spas7 ·
[0029] Rcpx= S(Ra)
[0030]
[0031]
[0032]
[0033]
[0034]
[0035] 步骤 13 :生成 Complex 及 Parsimonious 分析结果:
[0036] Complex分析结果由由上述4)中保留的候选规则C进行逻辑化简而生成的;
[0037] Parsimonious分析结果由4)中保留的候选规则C及3)中的Remainders共同进 行多值逻辑化简而得到;
[0038] 6)反设事实计算:其采如下步骤:
[0039] 步骤14 :Ihtermediate分析结果综合了 Complex及Parsimonious两个分析结果;
[0040] 步骤15 :根据步骤14,将专家的知识考虑在内,形成最有意义的分析结果;
[0041] 步骤16 :在fm-QCA方法中,利用反设事实技术,该技术能够确定一个Remainder 在现实中是否容易出现或很难出现;
[0042] 基于反事实,4)中保留的候选规则C及部分经过反设事实推理而得到的部分 Remainders可以归并到一起,并通过多值逻辑化简从而生成Intermediate分析结果,具体 如下Rsitm:
[0043]
[0048] 8)计算覆盖率和一致性,其采用如下步骤:
[0049] 步骤17 :生成Intermediate分析结果后,fm-QCA会自动计算每条规则的相关覆盖 率和一致性,并对其可信度进行印证;
[0050] 9)得到最终的Intermediate分析结果,其如下步骤:
[0051] 步骤18 :只有覆盖率和一致性达到一定标准的规则才会保留下来成为最终的结 果,而不符合的规则将被舍弃,经过这个过程后,Intermediate结果将变为可信任的最终分 析结果,该结果能够揭示出我们想要得到的解释变量及被解释变量之间的关系,帮助我们 分析结果之间的内在因果关系。
[0052] 采用上述结构后,本发明有益效果为:本发明所述的一种多值定性比较分析数据 处理方法,它采用多值定性比较的数据分析方法(fm-QCA),成功克服了现有QCA方法在多 值定性比较分析领域的不足;它具用支持被解释变量及解释变量均为多值数据,实现多值 逻辑化简,Intermediate solution自动生成和引入候选项集一致性检测,提高分析精度等 优点。
【附图说明】
[0053] 图1是本发明的流程示意图;
[0054] 图2是本发明的分析结果以选项卡显示的样式示例图;
[0055] 图3是本发明的简单多值数据集的简易逻辑化简过程的示意图。
【具体实施方式】
[0056] 下面结合附图对本发明作进一步的说明。
[0057] 如图1所示,本发明所述的一种多值定性比较分析数据处理方法,
[0058] 它采用如下的步骤方法:
[0059] 1)选择解释变量和被解释变量:
[0060] 步骤1 :收集相关的需要分析的大量数据;
[0061] 步骤2 :针对具体的需分析的情况,从步骤一选择与其相关联的数据;
[0062] 步骤3 :分析开始前需要选取想要被分析的解释变量和被解释变量;
[0063] 2)生成候选规则:
[0064] 步骤4 :根据步骤三所选取的解释和被解释变量,fm-QCA自动生成候选规则, 通过Njri)来进行初步筛选来实现;该规则被进一步检验后将被用于生成Complex及 Parsimonious 分析结果;
[0065] 3)计算凡〇^)来进行初步筛选:
[0066] 步骤5 :Ν。(Γι)是用来筛选候选规则是否有真实案例支撑的一个重要指标,该指标 能够筛选出具有相符案例的规则,其计算方法如下:
[0067]
[0068]
[0069] 步骤6 :设定筛选阈值λ,该筛选阈值λ可由人为指定,只有那些真实案例支撑数 大于或等于阈值λ的规则才会被用于生成最终结果,形成候选规则A ;
[0070] 步骤7 :而那些小于该值的候选规则B则会被保留下来,设定为Remainders,并且 参与到Intermediate结果生成中;
[0071] 4)计算CcO^)来进行进一步筛选:
[0072] 步骤8 :根据步骤6,对于真实案例支撑数大于或等于阈值λ的规则的候选规则 Α,利用(;(Γι)来进一步筛选。该(;(Γι)是候选规则的一致性筛选指标,其计算方法如下:
[0075] 步骤9 :在多值情况中,考虑到被解释变量的组合情况,此时可用C' e(ri)来代替 Cjri)的计算过程,如下:
[0073]
[0074]
[0076]
[0077] 步骤10 :设定筛选阈值μ,该筛选阈值μ同样可由用户指定,利用步骤9的计算 方法,只有一致性大于或等于μ的规则会被用于生成Intermediate结果,形成候选规则 C;
[0078] 步骤11 :小于筛选阈值μ的候选规则D则会被丢掉,设定为Drop Rule ;
[0079] 5)计算 Complex 及 Parsimonious 分析结果,如下:
[0080] 步骤12 :生成用于产生Complex及Parsimonious分析结果的规则集合,方法如下 乂丄、"sepxiVspas^ ·
[0081]
[0082]
[0083]
[0084]
[0085]
[0086]
[0087] 步骤 13 :生成 Complex 及 Parsimonious 分析结果:
[0088] Complex分析结果由由上述4)中保留的候选规则C进行逻辑化简而生成的;
[0089] Parsimonious分析结果由4)中保留的候选规则C及3)中的Remainders共同进 行多值逻辑化简而得到;
[0090] 6)反设事实计算:其采如下步骤:
[0091] 步骤14 :Intermediate分析结果综合了 Complex及Parsimonious两个分析结果;
[0092] 步骤15 :根据步骤14,将专家的知识考虑在内,形成最有意义的分析结果;
[0093] 步骤16 :在fm-QCA方法中,利用反设事实技术,该技术能够确定一个Remainder 在现实中是否容易出现或很难出现;
[0094] 基于反事实,4)中保留的候选规则C及部分经过反设事实推理而得到的部分 Remainders可以归并到一起,并通过多值逻辑化简从而生成Intermediate分析结果,具体 如下Rsitm:
[0095]
[0096]
[0097]
[0098]
[0099]
[0100] 7)计算覆盖率和一致性,其采用如下步骤:
[0101] 步骤17 :生成Intermediate分析结果后,fm-QCA会自动计算每条规则的相关覆盖 率和一致性,并对其可信度进行印证;
[0102] 8)得到最终的Intermediate分析结果,其如下步骤:
[0103] 步骤18 :只有覆盖率和一致性达到一定标准的规则才会保留下来成为最终的结 果,而不符合的规则将被舍弃,经过这个过程后,Intermediate结果将变为可信任的最终分 析结果,该结果能够揭示出我们想要得到的解释变量及被解释变量之间的关系,帮助我们 分析结果之间的内在因果关系。
[0104] 本发明fm-QCA多值定性比较分析方法能够同时处理被解释变量和解释变量均为 多值的QCA数据,并包含了多值逻辑化简、Intermediate solution自动生成以及一致性、 覆盖率计算等功能。弥补了目前多值QCAOwQCA方法)不能处理被解释变量为多值,且不 能多值逻辑化简的不足,其优点具体如下:
[0105] (1)支持被解释变量及解释变量均为多值数据
[0106] fm-QCA通过对待分析数据集的预处理,能够支持被解释变量及解释变量均为多值 的数据集,弥补了 mvQCA仅能支持解释变量为多值的不足。对于被解释变量为多值情况, fm-QCA将自动调用被解释变量为多值的分析算法,并将分析结果以选项卡形式呈现给专家 学者(如图2);而mvQCA则不能分析此类数据。
[0107] (2)多值逻辑化简
[0108] fm-QCA扩展了经典Quine-McClusky布尔化简算法,实现了新型多值逻辑化简功 能,从而使得得到的QCA分析结果达到最简,为专家学者提供最为直接、最为有效的分析结 果,相比mvQCA具有长足进步;如图3,展示了简单多值数据集的简易逻辑化简过程。
[0109] (3) Intermediate solution 自动生成
[0110] QCA运算将产生Complex、Parsimonious以及Intermediate三组解集,分别表示 了对结果解释的不同程度。其中Complex solution以及Parsimonious solution由计算 机自动计算生成,Intermediate solution介于Complex及Parsimonious之间,如图2及 TablelV简单数据示意,该结果综合了计算机分析及专家分析而生成,故而也是专家最为看 重的分析结果。
[0111] TABLE IV
[0112] INTERMEDIATE SOLUTION WITH USER PREFERENCE
[0113]
[0114] 在mvQCA中,由于其算法局限性,不能直接生成Intermediate solution,从而削 减了最终结果的指导意义。
[0115] fm-QCA通过创造性扩展QCA方法,很好地克服了这个问题,从而能够综合专家分 析结果,运算得出多值QCA的Intermediate solution方案,为专家学者提供最具参考价值 的分析结果。
[0116] (4)引入候选项集一致性检测,提高分析精度
[0117] 在mvQCA运算中,当候选项具有相同解释变量和不同被解释变量值时,该项将被 直接标记为C(Contradiction),进而不能参与逻辑化简,从而造成精度损失。fm-QCA对于 候选项集引入了一致性检测分析,并根据用户所给筛选阈值来确定该候选项的取舍,从而 使得分析精度高于mvQCA。下表中Tablell、Tablelll分别为同一简单数据集在mvQCA、 fm-QCA中的预处理结果,可见fm-QCA具有更高的分析精度及灵活性。
[0118] TABLE II
[0119] CANDIDATE RULES IN Mv/QCA
[0120]
[0121] TABLE III
[0122] CANDIDATE RULES IN FM-QCA
[0123]
[0124] 我们进行了多值定性比较分析方法的研咒工作并创造性地提出了 fm-QCA(Fully functional multiple-valued QCA)多值定性比较的数据分析方法。fm-QCA成功克服了现 有QCA方法在多值定性比较分析领域的不足,得到了社会学、国际政治学领域专家的高度 认同。
[0125] 本发明所述的一种多值定性比较分析数据处理方法,它采用多值定性比较的数据 分析方法(fm-QCA),成功克服了现有QCA方法在多值定性比较分析领域的不足;它具用支 持被解释变量及解释变量均为多值数据,实现多值逻辑化简,Intermediate solution自动 生成和引入候选项集一致性检测,提高分析精度等优点。
[0126] 以上所述仅是本发明的较佳实施方式,故凡依本发明专利申请范围所述的构造、 特征及原理所做的等效变化或修饰,均包括于本发明专利申请范围内。
【主权项】
1. 一种多值定性比较分析数据处理方法,其特征在于:它采用如下的步骤方法: 1) 选择解释变量和被解释变量: 步骤1 :收集相关的需要分析的大量数据; 步骤2 :针对具体的需分析的情况,从步骤一选择与其相关联的数据; 步骤3 :分析开始前需要选取想要被分析的解释变量和被解释变量; 2) 生成候选规则: 步骤4:根据步骤Ξ所选取的解释和被解释变量,fm-QCA自动生成候选规则,通 过Ncbi)来进行初步筛选来实现;该规则被进一步检验后将被用于生成Complex及 Parsimonious 分析结果; 3) 计算Ntbi)来进行初步筛选: 步骤5 :Nt(ri)是用来筛选候选规则是否有真实案例支撑的一个重要指标,该指标能够 筛选出具有相符案例的规则,其计算方法如下:步骤6 :设定筛选阔值λ,该筛选阔值λ可由人为指定,只有那些真实案例支撑数大于 或等于阔值λ的规则才会被用于生成最终结果,形成候选规则A ; 步骤7 :而那些小于该值的候选规则B则会被保留下来,设定为Remainders,并且参与 到Intermediate结果生成中; 4) 计算Ctbi)来进行进一步筛选: 步骤8:根据步骤6,对于真实案例支撑数大于或等于阔值λ的规则的候选规则A,利 用Ctbi)来进一步筛选。该Ctbi)是候选规则的一致性筛选指标,其计算方法如下:步骤9:在多值情况中,考虑到被解释变量的组合情况,此时可用C' E(ri)来代替 Ctbi)的计算过程,如下:步骤10 :设定筛选阔值μ,该筛选阔值μ同样可由用户指定,利用步骤9的计算方法, 只有一致性大于或等于μ的规则会被用于生成Intermediate结果,形成候选规则C; 步骤11 :小于筛选阔值μ的候选规则D则会被丢掉,设定为化op Rule ; 5) 计算Complex及Parsimonious分析结果,如下: 步骤12 :生成用于产生Complex及Parsimonious分析结果的规则集合,方法如下(R,cpx Rspas): R〇px= S(R J Rscpx= ir|r e Rcpx八 Nc(r) > 1}R' remamders= ir|r e Remainders 八 J(r) = 1} Rpas二 S{R a UR' remainders} Rspas= ir|r e Rpas八 Nc(r) > 1}; 步骤13 :生成Complex及Parsimonious分析结果: Complex分析结果由由上述4)中保留的候选规则C进行逻辑化简而生成的; Parsimonious分析结果由4)中保留的候选规则C及3)中的Remainders共同进行多 值逻辑化简而得到; 6) 反设事实计算:其采如下步骤: 步骤14 :Intermediate分析结果综合了 Complex及Parsimonious两个分析结果; 步骤15 :根据步骤14,将专家的知识考虑在内,形成最有意义的分析结果; 步骤16 :在fm-QCA方法中,利用反设事实技术,该技术能够确定一个Remainder在现 实中是否容易出现或很难出现; 基于反事实,4)中保留的候选规则C及部分经过反设事实推理而得到的部分 Remainders可W归并到一起,并通过多值逻辑化简从而生成Intermediate分析结果,具体 如下R' itm=S(RiJ Rsitm= ir|r e R' um八 Nc(r)>l} 7) 计算覆盖率和一致性,其采用如下步骤: 步骤17 :生成Intermediate分析结果后,fm-QCA会自动计算每条规则的相关覆盖率和 一致性,并对其可信度进行印证; 8)得到最终的Intermediate分析结果,其如下步骤: 步骤18 :只有覆盖率和一致性达到一定标准的规则才会保留下来成为最终的结果,而 不符合的规则将被舍弃,经过运个过程后,Intermediate结果将变为可信任的最终分析结 果,该结果能够掲示出我们想要得到的解释变量及被解释变量之间的关系,帮助我们分析 结果之间的内在因果关系。
【文档编号】G06N5/04GK105976033SQ201510106031
【公开日】2016年9月28日
【申请日】2015年3月11日
【发明人】武轲, 唐世平, 蒲戈光, 吴敏
【申请人】武轲, 唐世平
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1