Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法

文档序号:6622224阅读:1601来源:国知局
Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法
【专利摘要】本发明公开了一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方法,其特点是:以贝叶斯概率论为基点,以马尔可夫蒙特卡洛(MCMC)随机模拟方法为导向,基于多重填补法的缺失值处理,应用于任意缺失模式的Meta分析数据缺失状态下,实现将缺失值处理与常规Meta分析中缺失数据集的一体化整合。该方法可最大程度的拟合缺失数据,以尽可能地保证提取数据的完整性和后续标准统计的可行性,显著提升Meta分析的统计检验效能,增强系统评价结果的稳健性和可靠性,增强对系统综述评价的科学性和全面性。
【专利说明】Meta分析数值缺失状态下MCMC模拟导向的基于多重填补 法的缺失值处理的方法

【技术领域】
[0001] 本发明涉及医学统计学领域,尤其涉及一种Meta分析数值缺失状态下MCMC模拟 导向的基于多重填补法的缺失值处理的方法。

【背景技术】
[0002] 在生物医学领域,Meta分析是对具有相同研究目的的多个独立小样本的临床试验 及基础实验研究的结果进行系统分析和定量综合,以提高统计检验的效能和增加效应值估 计的精确度,解决各研究结果的不一致性以及寻求新的假说。Meta分析在临床诊断技术准 确性的评估和优选、临床治疗效果的评价和优化、病因学因果关联的评估、疾病预防干预的 评价、疾病防治的成本效益分析、卫生经济学研究、卫生服务评价、卫生决策及卫生管理评 价中有着广泛而深刻的应用价值,有助于将有限的医疗资源更为合理地运用在那些已经在 适当设计的评估中表现出有效的卫生健康服务的方式上。
[0003] 在Meta分析中,对纳入的独立小样本的临床试验及基础实验研究进行数据提取 及分析过程中,因个别临床研究在采集、填写、录入等过程中的随机因素或人为因素,往往 有部分数据的删失以至于不能提取到需要研究的全部相关数据。缺失数据对Meta分析的 统计和研究推论往往造成不利影响:由于受试者部分数据的缺失,使得受试者的数据在统 计分析时无效或不可靠,以致有效样本量减少,继而导致临床结果的可靠性难以得到保障 和研究结论出现偏差。当前对于研究数据的缺失,常规采取联系其研究的原作者,以索取更 为详细的相关资料和数据,但是因为研究发表的年代差距因素或者实验本身的局限性因素 等诸多因素,缺失的数据往往未能得以完好的补充;有时在联系原作者索取未果情况下,不 得已要将有缺失数据的某研究排除。尤其当完全观测数据和不完全观测数据存在系统差异 时,常规处理方法得到的结果通常不能代表整体,这样可增大Meta分析的统计方差,降低 检验效能,影响系统评价的稳定性和可信度,降低评估的精确性和损耗随机化的效果,以致 作出偏倚性结论,无法得到科学合理的解释。


【发明内容】

[0004] 本发明主要目的在于提供一种Meta分析数值缺失状态下MCMC模拟导向的基于多 重填补法的缺失值处理的方法,其特征在于以贝叶斯概率论为基点,以马尔可夫蒙特卡洛 (Markov Chain Monte Carlo algorithm,MCMC)随机模拟方法为导向,基于多重填补法的 缺失值处理,应用于任意缺失模式的Meta分析数据缺失状态下,实现将缺失值处理与常规 Meta分析中数据提取缺失的一体化整合。在Meta分析对数据提取的过程中,基于Meta分 析数据缺失状态下的假设,以贝叶斯理论为原理,以缺失值处理分析为解决策略,以缺失的 定量及等级资料为填充对象,以马尔可夫蒙特卡洛随机模拟方法为导向,以多重填补法作 为缺失数据处理与模型的契合点,最大程度的拟合缺失数据集,弥补纳入研究数据缺失的 不足,以尽可能地保证提取数据的完整性和后续标准统计的可行性,显著提升Meta分析的 统计检验效能,增强系统评价结果的稳健性和可靠性,避免了在Meta分析中独立研究因数 据缺失而被排除的局限性,增强对系统综述评价的科学性和全面性。
[0005] 本发明的有益效果为:Meta分析数值缺失状态下MCMC模拟导向的基于多重填补 法的缺失值处理的方法,有效论证了缺失值处理在Meta分析数据缺失状态下应用的可行 性,强化了马尔可夫蒙特卡洛随机模拟方法在多重填补缺失处理中应用,也开创了在Meta 分析数据缺失状态下缺失值处理的先例。缺失值处理在Meta分析的数据处理中的应用,最 大程度的保证提取数据的完整性,能够解决有缺失数据资料中相对普遍的问题,尤其当数 据呈任意缺失模式时,可以运用MCMC模型来处理复杂的数据缺失问题,提高统计效率;还 可有效避免均值填充法易使变量分布扭曲,使替代后的分布更接近真值。该方法是对缺失 处理在循证医学领域的拓展和创新,也是对现有Meta分析的发展和完善,有利于使Meta分 析更加科学规范化、精确具体化和综合全面化。

【专利附图】

【附图说明】
[0006] 附图1为本发明的一种实施例的示意图。

【具体实施方式】
[0007] 本发明的具体方法由以下实施例及其附图1给出。
[0008] 附图1是根据本发明提出的Meta分析数值缺失状态下MCMC模拟导向的基于多重 填补法的缺失值处理的方法的流程图。下面结合图1详细说明依据本发明提出的具体方 法。
[0009] (1)马尔可夫蒙特卡洛(MCMC)导向的多重填补法主要包括3个关键步骤:分别是 对目标估计量的估计(即对研究变量的某种估计),嵌入借补值、创建完全数据集(即主要完 成对借补值的估计),以及合并对目标估计量的估计结果。其中,对缺失数据的借补值的估 计正是目标估计量的估计的关键所在。
[0010] (2)从贝叶斯概率论出发,多重填补用Ymis的后验预测分布表征Ymis的相关信息, MCMC方法可借助马尔可夫链构造或者模拟该后验分布。应用MCMC方法构造一个有效的 马尔可夫链,从而获得对该概率分布伪随机抽样。根据给定的参数Θ初始值Θ 及Y(As, 多次迭代得到马氏链(Y(1)mis,e(1)),(Y (2)mis,θ?),…,以1^,θω),…。从马氏链中可 抽得一个数据扩充链Y (k)mis,Y(2k)mis,Y(3k)mis,…,Y(nk)mis…。可从数据扩充链中得到Ymis,当 k足够大时马氏链在(Ymis,Θ | Y(As)处收敛,并且得到邻近的、相互独立的两个借补值。
[0011] (3)当预处理服从多元正态分布的数据时,MCMC须进行以下三步: 初始值:计算已有观测数据的均值与协方差矩阵,以便估计参数的后验分布;I-步:依 据与既定Ymis分布进行伪随机抽样,从中逐次收集借补值;P-步:根据与缺失数据 借补值 Y(k+1)mis 求得 9(k+1)。
[0012] (4)多重借补的有限次借补:在理想状态下,重复借补理论认为,无限次的借补时, 该估计的均值正是对缺失数据的估计。基于论证有限次借补公式RE=1A1+λ/ m)为有限次 借补时相对效率,MI的高效估计与借补的数量、缺失数据的比率之间关系密切。优良的估 计参数还要求尽可能小的标准误估计、尽量窄的置信区间等。实践中,良好的置信区间与 假设检验均需要进行一定数量的借补,那么允许的条件下应用多重填补法处理数据时应进 行10次或者更多次的借补。
【权利要求】
1. 一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填补法的缺失值处理的方 法,其特征在于,以马尔可夫蒙特卡洛(MCMC)随机模拟方法为导向,基于多重填补法的缺失 值处理,应用于任意缺失模式的Meta分析数据缺失状态下,实现将缺失值处理与常规Meta 分析中缺失数据集的一体化整合。
2. 如权利要求1所述的一种Meta分析数值缺失状态下MCMC模拟导向的基于多重填 补法的缺失值处理的方法,特征在于,在Meta分析对纳入研究的数据提取的过程中,基于 Meta分析数据缺失状态下的假设,以贝叶斯概率论为基点,以缺失值处理分析为解决策略, 以缺失的定量及等级资料为填充对象,以马尔可夫蒙特卡洛(MCMC)随机模拟方法为导向, 以多重填补作为缺失数据处理与模型的契合点,以尽可能最大程度的拟合Meta分析缺失 数据集。
【文档编号】G06F19/00GK104091094SQ201410376311
【公开日】2014年10月8日 申请日期:2014年8月3日 优先权日:2014年8月3日
【发明者】刘鸿 申请人:刘鸿, 周洁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1