Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法

文档序号：6622224阅读：1601来源：国知局

Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法
【专利摘要】本发明公开了一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法，其特点是：以贝叶斯概率论为基点，以马尔可夫蒙特卡洛（MCMC）随机模拟方法为导向，基于多重填补法的缺失值处理，应用于任意缺失模式的Meta分析数据缺失状态下，实现将缺失值处理与常规Meta分析中缺失数据集的一体化整合。该方法可最大程度的拟合缺失数据，以尽可能地保证提取数据的完整性和后续标准统计的可行性，显著提升Meta分析的统计检验效能，增强系统评价结果的稳健性和可靠性，增强对系统综述评价的科学性和全面性。
【专利说明】Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法

【技术领域】
[0001] 本发明涉及医学统计学领域，尤其涉及一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法。

【背景技术】
[0002] 在生物医学领域，Meta分析是对具有相同研究目的的多个独立小样本的临床试验及基础实验研究的结果进行系统分析和定量综合，以提高统计检验的效能和增加效应值估计的精确度，解决各研究结果的不一致性以及寻求新的假说。Meta分析在临床诊断技术准确性的评估和优选、临床治疗效果的评价和优化、病因学因果关联的评估、疾病预防干预的评价、疾病防治的成本效益分析、卫生经济学研究、卫生服务评价、卫生决策及卫生管理评价中有着广泛而深刻的应用价值，有助于将有限的医疗资源更为合理地运用在那些已经在适当设计的评估中表现出有效的卫生健康服务的方式上。
[0003] 在Meta分析中，对纳入的独立小样本的临床试验及基础实验研究进行数据提取及分析过程中，因个别临床研究在采集、填写、录入等过程中的随机因素或人为因素，往往有部分数据的删失以至于不能提取到需要研究的全部相关数据。缺失数据对Meta分析的统计和研究推论往往造成不利影响：由于受试者部分数据的缺失，使得受试者的数据在统计分析时无效或不可靠，以致有效样本量减少，继而导致临床结果的可靠性难以得到保障和研究结论出现偏差。当前对于研究数据的缺失，常规采取联系其研究的原作者，以索取更为详细的相关资料和数据，但是因为研究发表的年代差距因素或者实验本身的局限性因素等诸多因素，缺失的数据往往未能得以完好的补充；有时在联系原作者索取未果情况下，不得已要将有缺失数据的某研究排除。尤其当完全观测数据和不完全观测数据存在系统差异时，常规处理方法得到的结果通常不能代表整体，这样可增大Meta分析的统计方差，降低检验效能，影响系统评价的稳定性和可信度，降低评估的精确性和损耗随机化的效果，以致作出偏倚性结论，无法得到科学合理的解释。

【发明内容】

[0004] 本发明主要目的在于提供一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法，其特征在于以贝叶斯概率论为基点，以马尔可夫蒙特卡洛 (Markov Chain Monte Carlo algorithm，MCMC)随机模拟方法为导向，基于多重填补法的缺失值处理，应用于任意缺失模式的Meta分析数据缺失状态下，实现将缺失值处理与常规 Meta分析中数据提取缺失的一体化整合。在Meta分析对数据提取的过程中，基于Meta分析数据缺失状态下的假设，以贝叶斯理论为原理，以缺失值处理分析为解决策略，以缺失的定量及等级资料为填充对象，以马尔可夫蒙特卡洛随机模拟方法为导向，以多重填补法作为缺失数据处理与模型的契合点，最大程度的拟合缺失数据集，弥补纳入研究数据缺失的不足，以尽可能地保证提取数据的完整性和后续标准统计的可行性，显著提升Meta分析的统计检验效能，增强系统评价结果的稳健性和可靠性，避免了在Meta分析中独立研究因数据缺失而被排除的局限性，增强对系统综述评价的科学性和全面性。
[0005] 本发明的有益效果为：Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法，有效论证了缺失值处理在Meta分析数据缺失状态下应用的可行性，强化了马尔可夫蒙特卡洛随机模拟方法在多重填补缺失处理中应用，也开创了在Meta 分析数据缺失状态下缺失值处理的先例。缺失值处理在Meta分析的数据处理中的应用，最大程度的保证提取数据的完整性，能够解决有缺失数据资料中相对普遍的问题，尤其当数据呈任意缺失模式时，可以运用MCMC模型来处理复杂的数据缺失问题，提高统计效率；还可有效避免均值填充法易使变量分布扭曲，使替代后的分布更接近真值。该方法是对缺失处理在循证医学领域的拓展和创新，也是对现有Meta分析的发展和完善，有利于使Meta分析更加科学规范化、精确具体化和综合全面化。

【专利附图】

【附图说明】
[0006] 附图1为本发明的一种实施例的示意图。

【具体实施方式】
[0007] 本发明的具体方法由以下实施例及其附图1给出。
[0008] 附图1是根据本发明提出的Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法的流程图。下面结合图1详细说明依据本发明提出的具体方法。
[0009] (1)马尔可夫蒙特卡洛(MCMC)导向的多重填补法主要包括3个关键步骤：分别是对目标估计量的估计（即对研究变量的某种估计)，嵌入借补值、创建完全数据集（即主要完成对借补值的估计)，以及合并对目标估计量的估计结果。其中，对缺失数据的借补值的估计正是目标估计量的估计的关键所在。
[0010] (2)从贝叶斯概率论出发，多重填补用Ymis的后验预测分布表征Ymis的相关信息， MCMC方法可借助马尔可夫链构造或者模拟该后验分布。应用MCMC方法构造一个有效的马尔可夫链，从而获得对该概率分布伪随机抽样。根据给定的参数Θ初始值Θ 及Y(As，多次迭代得到马氏链（Y(1)mis，e(1))，（Y (2)mis，θ?)，…，以1^，θω)，…。从马氏链中可抽得一个数据扩充链Y (k)mis，Y(2k)mis，Y(3k)mis，…，Y(nk)mis…。可从数据扩充链中得到Ymis，当 k足够大时马氏链在（Ymis，Θ | Y(As)处收敛，并且得到邻近的、相互独立的两个借补值。
[0011] (3)当预处理服从多元正态分布的数据时，MCMC须进行以下三步：初始值：计算已有观测数据的均值与协方差矩阵，以便估计参数的后验分布；I-步：依据与既定Ymis分布进行伪随机抽样，从中逐次收集借补值；P-步：根据与缺失数据借补值 Y(k+1)mis 求得 9(k+1)。
[0012] (4)多重借补的有限次借补：在理想状态下，重复借补理论认为，无限次的借补时，该估计的均值正是对缺失数据的估计。基于论证有限次借补公式RE=1A1+λ/ m)为有限次借补时相对效率，MI的高效估计与借补的数量、缺失数据的比率之间关系密切。优良的估计参数还要求尽可能小的标准误估计、尽量窄的置信区间等。实践中，良好的置信区间与假设检验均需要进行一定数量的借补，那么允许的条件下应用多重填补法处理数据时应进行10次或者更多次的借补。
【权利要求】
1. 一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法，其特征在于，以马尔可夫蒙特卡洛(MCMC)随机模拟方法为导向，基于多重填补法的缺失值处理，应用于任意缺失模式的Meta分析数据缺失状态下，实现将缺失值处理与常规Meta 分析中缺失数据集的一体化整合。
2. 如权利要求1所述的一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法，特征在于，在Meta分析对纳入研究的数据提取的过程中，基于 Meta分析数据缺失状态下的假设，以贝叶斯概率论为基点，以缺失值处理分析为解决策略，以缺失的定量及等级资料为填充对象，以马尔可夫蒙特卡洛(MCMC)随机模拟方法为导向，以多重填补作为缺失数据处理与模型的契合点，以尽可能最大程度的拟合Meta分析缺失数据集。
【文档编号】G06F19/00GK104091094SQ201410376311
【公开日】2014年10月8日申请日期:2014年8月3日优先权日:2014年8月3日
【发明者】刘鸿申请人:刘鸿, 周洁

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘鸿
技术所有人：刘鸿;周洁
我是此专利的发明人

上一篇：一种多路径稳定性和磁盘性能检查方法
上一篇：一种用于轴承故障诊断的最优噪声参数选择的elmd算法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。