一种基于自动深度置信网络的门诊量预测方法及系统与流程

文档序号:11134420阅读:420来源:国知局
一种基于自动深度置信网络的门诊量预测方法及系统与制造工艺

本发明涉及智慧医疗技术领域,特别是一种基于自动深度置信网络的门诊量预测方法及其应用该方法的系统。



背景技术:

门诊量预测对于提高医疗效率和医疗质量具有重大意义,特别是对于大型综合性医院,科学预测和准确分析医院门诊量的动态变化,能够为医院领导制定门诊工作计划和统筹安排医护人员提供决策依据,进而可以减少患者的候诊时间,提高工作效率、经济效益和社会效益。

但是,对医院门诊量的准确预测是极为困难的。医院的门诊量与季节的变动、气候的变化等诸多因素息息相关,因此,门诊量数据具有高度的非线性性质,从而导致传统的线性或概率模型不能表现出其在应对突发疾病预测/季节性疾病的良好效果。



技术实现要素:

本发明为解决上述问题,提供了一种基于自动深度置信网络的门诊量预测方法及系统,能够较大的提高门诊量预测的准确性,更有利于医院门诊工作的统筹安排,从而提高门诊的工作效率。

为实现上述目的,本发明采用的技术方案为:

一种基于自动深度置信网络的门诊量预测方法,其包括以下步骤:

10.从医院挂号系统收集每天的门诊量,得到历史门诊量数据;

20.对所述历史门诊量数据进行微分变换的预处理,得到微分数据;

30.根据所述微分数据自动构建深度置信网络结构,该深度置信网络包括输入层、隐层、输出层,通过分析所述微分数据的相关性自动计算所述输入层的节点数目,通过分析所述微分数据的稀疏性自动计算所述隐层的节点数目,并通过使用无监督学习方法进行构建所述输出层;

40.根据所述历史门诊量数据所对应的不同时间序列对所述微分数据进行聚类,并根据聚类结果进行自动创建分组,得到不同时间序列的分组数据;

50.根据所述分组数据对所述深度置信网络进行训练,得到门诊量预测模型;

60.调用所述门诊量预测模型对指定时间序列进行门诊量的预测,根据该指定时间序列获取对应时间序列的分组数据,并根据该分组数据得到预测结果;

70.对所述预测结果进行所述预处理的逆变换,得到预测门诊量。

优选的,所述的步骤20中,还进一步对所述微分数据进行归一化的预处理,所述的步骤70对所述预测结果进行所述预处理的逆变换,包括微分逆变换和反归一化处理。

优选的,所述的步骤30中,通过分析所述微分数据的相关性自动计算所述输入层的节点数据,是通过计算所述微分数据的各个数据项与其周围数据项之间的相关性,统计得到相关性较高的数据项的数目,并将该相关性较高的数据项的数目作为所述输入层的节点数目。

优选的,所述的步骤30中,通过分析所述微分数据的稀疏性自动计算所述隐层的节点数目,是根据所述聚类结果自动计算所述微分数据的稀疏性,并根据该稀疏性进行计算第一层隐层的节点数目,微分数据越稀疏,则隐层节点数目越多;然后将第一层隐层的节点数目的一半作为第二层隐层的节点数目,依次类推,直至隐层的节点数目小于预设阈值时,将该隐层作为最上层隐层。

优选的,采用Relu函数作为所述深度置信网络的隐层的激活函数。

优选的,所述的步骤40中,对所述微分数据进行聚类,是使用基于密度分布函数的聚类方法对所述微分数据进行聚类,并根据聚类结果从每个聚类中随机选择一个样本进行自动创建分组,分组的个数等于聚类的个数。

优选的,所述的步骤50中,根据所述分组数据对所述深度置信网络进行训练,是采用两步法的训练方法:

51.预训练:采用无监督学习自底向上进行分层训练;

52.反向微调:使用反向传播算法对所述深度置信网络的输入层和隐层进行微调。

另外,本发明还提供一种基于自动深度置信网络的门诊量预测系统,其包括:

数据采集模块,用于从医院挂号系统收集每天的门诊量,得到历史门诊量数据;

预处理模块,用于对所述历史门诊量数据进行微分变换的预处理,得到微分数据;

网络构建模块,其根据所述微分数据自动构建深度置信网络结构,该深度置信网络包括输入层、隐层、输出层,通过分析所述微分数据的相关性自动计算所述输入层的节点数目,通过分析所述微分数据的稀疏性自动计算所述隐层的节点数目,并通过使用无监督学习方法进行构建所述输出层;

分组模块,用于根据所述历史门诊量数据所对应的不同时间序列对所述微分数据进行聚类,并根据聚类结果进行自动创建分组,得到不同时间序列的分组数据;

训练模块,其根据所述分组数据对所述深度置信网络进行训练,得到门诊量预测模型;

预测模块,其调用所述门诊量预测模型对指定时间序列进行门诊量的预测,根据该指定时间序列获取对应时间序列的分组数据,并根据该分组数据得到预测结果;

逆变换模块,用于对所述预测结果进行所述预处理的逆变换,得到预测门诊量。

优选的,所述网络构建模块进行构建深度置信网络结构,是通过计算所述微分数据的各个数据项与其周围数据项之间的相关性,统计得到相关性较高的数据项的数目,并将该相关性较高的数据项的数目作为所述输入层的节点数目。

优选的,所述网络构建模块进行构建深度置信网络结构,是根据所述聚类结果自动计算所述微分数据的稀疏性,并根据该稀疏性进行计算第一层隐层的节点数目,微分数据越稀疏,则隐层节点数目越多;然后将第一层隐层的节点数目的一半作为第二层隐层的节点数目,依次类推,直至隐层的节点数目小于预设阈值时,将该隐层作为最上层隐层。

本发明的有益效果是:

本发明的一种基于自动深度置信网络的门诊量预测方法及系统,所述深度置信网络具有使用方便、训练简单的优点,并且,能够为医院门诊量预测提供可靠依据,预测误差小,特别适用于长线预测。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明一种基于自动深度置信网络的门诊量预测方法的流程简图;

图2为本发明一种基于自动深度置信网络的门诊量预测系统的结构示意图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

目前,基于人工神经网的时序预测模型在许多领域都有广泛的应用。但是,目前国内外还没有对医院门诊病人的未来的访问的相关数据进行有效的预测分析的相关应用。

典型的人工神经网络通常由输入层、隐藏层和输出层三层组成。每层之间通过“神经元”进行链接,层间权重被看作是输出层对输入层的反馈。通常使用反向传播算法(BP)来训练人工神经网络,并取得层间权重。然而,当人工神经网络(ANN)很复杂的时候,例如某一层的神经元的数量非常庞大,人工神经网络常常引起过度拟合的问题,这时候反向传播的方法就会失效。深度网络(DN)能够有效解决人工神经网络的这种过度拟合的问题,深度网络的方法是来源于动物解剖学的启发。动物解剖学发现哺乳动物大脑对外部信息的处理是分阶层的,高阶层通过抽象低阶层的信息来提取信息。例如,当一个人观察公路上正在行驶的汽车时,大脑低阶层首先提取眼睛所看到的汽车外部边沿轮廓,中间层根据低层提取抽象出汽车的形状,高层根据中间层的信息抽象和理解汽车的动作行为,因此,深度网络比人工神经网络隐藏了更多的层数,这些阶层提供了更多的输入信息抽象的层次。

人工神经网络可以通过反向传播方法进行训练,但是深度网络是很难通过这种方法训练的,因为这时反向传播算法的初始边界条件是很难确定,当使用反向传播进行训练深度网络时候会导致局部收敛甚至发散。目前,辛顿(Hinton)提出了一种创新的方法来训练深度网络,他提出了两步训练法,即无监督的预训练和有监督的反向传播来训练深度网络,取得了意的效果。这种方法的核心是在预训练阶段寻找到适合的初始边界条件,以便为应用于第二阶段的反向传播算法。使用这种方法比较成功的深度网络有两种:深度置信网络(DBN)和自动编码网络(AE),这两种网络被广泛应用于分类和辨识方向上的研究。

近年来,基于时序预测的深度网络得到了一些应用。例如,用自动编码叠加去噪(SDAE)去预测室内的温度,这种方法比传统的人工神经网络效果明显要好;用基于自动深度置信网络的时序预测和粒子群算法(POS)来发现每一层的学习速率和单元数量等。

然而这些方法在实际使用中存在以下的一些问题:

使用困难。这两种方法都是用户自定义深度,自定义深度需要数据依赖,并且不同的数据类型不能相互匹配利用。

训练复杂。这两种都需要确定训练期的网络结构,也就是每一层的单元数量,一般使用最优化的方法来寻找最优组合,有时候需要成千上万次的训练,系统开销比较大。

为了克服以上现有技术的不足,本发明提出一种新型的金字塔型深度置信网络时序预测方法,并把这种新方法应用到医院门诊量的控制管理,取得良好的效果。

深度置信网络是深度网络的一种类型,它包括一个输入层,若干隐层和一个输出层,隐层代表给定输入层的不同抽象水平,高阶层比低阶层有更高的抽象水平。输出层的选择是有应用依赖的,例如,在分类应用中,输出层储备输入层的分类标签,各层的组成是由几个受限的玻尔兹曼机网络组成的,一个玻尔兹曼机产生随机神经网络,这个网络能够学习超过它输入设置的概率分布。

如图1所示,本发明的一种基于自动深度置信网络的门诊量预测方法,其包括以下步骤:

10.从医院挂号系统收集每天的门诊量,得到历史门诊量数据;

20.对所述历史门诊量数据进行微分变换的预处理,得到微分数据;

30.根据所述微分数据自动构建深度置信网络结构,该深度置信网络包括输入层、隐层、输出层,通过分析所述微分数据的相关性自动计算所述输入层的节点数目,通过分析所述微分数据的稀疏性自动计算所述隐层的节点数目,并通过使用无监督学习方法进行构建所述输出层;

40.根据所述历史门诊量数据所对应的不同时间序列对所述微分数据进行聚类,并根据聚类结果进行自动创建分组,得到不同时间序列的分组数据;

50.根据所述分组数据对所述深度置信网络进行训练,得到门诊量预测模型;

60.调用所述门诊量预测模型对指定时间序列进行门诊量的预测,根据该指定时间序列获取对应时间序列的分组数据,并根据该分组数据得到预测结果;

70.对所述预测结果进行所述预处理的逆变换,得到预测门诊量。

所述的步骤20中,还进一步对所述微分数据进行归一化的预处理,所述的步骤70对所述预测结果进行所述预处理的逆变换,包括微分逆变换和反归一化处理。

所述的步骤30中,通过分析所述微分数据的相关性自动计算所述输入层的节点数据,是通过计算所述微分数据的各个数据项与其周围数据项之间的相关性,统计得到相关性较高的数据项的数目,并将该相关性较高的数据项的数目作为所述输入层的节点数目。所述的步骤30中,通过分析所述微分数据的稀疏性自动计算所述隐层的节点数目,是根据所述聚类结果自动计算所述微分数据的稀疏性,并根据该稀疏性进行计算第一层隐层的节点数目,微分数据越稀疏,则隐层节点数目越多;然后将第一层隐层的节点数目的一半作为第二层隐层的节点数目,依次类推,直至隐层的节点数目小于预设阈值时,本实施例中,所述预设阈值优选为10至20之间的范围,然后将该隐层作为最上层隐层。优选的,采用Relu函数作为所述深度置信网络的隐层的激活函数,这种非饱和的激活函与传统的sigmoid激活函数相比收敛速度更快,能够提高深度网络的训练速度。

所述的步骤40中,对所述微分数据进行聚类,是使用基于密度分布函数的聚类方法对所述微分数据进行聚类,并根据聚类结果从每个聚类中随机选择一个样本进行自动创建分组,分组的个数等于聚类的个数。

所述的步骤50中,根据所述分组数据对所述深度置信网络进行训练,是采用两步法的训练方法:

51.预训练:采用无监督学习自底向上进行分层训练;

52.反向微调:使用反向传播算法对所述深度置信网络的输入层和隐层进行微调。

智能分层的预训练能够为反向传播提供适合的初值,这种方法在每个单一的RMB中进行,每-RMB的参数被学习和存储。训练的结果作为高层的输入,通过成链的训练,DBN的每一层都会提供一个适合的初值后续的微调训练,这种两步法是一种无监督式的方法,除了最低层,其他层输入都不需要额外的输入。通过两步法训练后,利用微调过程来调整参数,该过程是有监督的。神经网络的输出与给定的输出比较,比较的差值用来自动调整深度置信网络的权值和偏差值。

如图2所示,本发明还提供一种基于自动深度置信网络的门诊量预测系统,其包括:

数据采集模块A,用于从医院挂号系统收集每天的门诊量,得到历史门诊量数据;

预处理模块B,用于对所述历史门诊量数据进行微分变换的预处理,得到微分数据;

网络构建模块C,其根据所述微分数据自动构建深度置信网络结构,该深度置信网络包括输入层、隐层、输出层,通过分析所述微分数据的相关性自动计算所述输入层的节点数目,通过分析所述微分数据的稀疏性自动计算所述隐层的节点数目,并通过使用无监督学习方法进行构建所述输出层;

分组模块D,用于根据所述历史门诊量数据所对应的不同时间序列对所述微分数据进行聚类,并根据聚类结果进行自动创建分组,得到不同时间序列的分组数据;

训练模块E,其根据所述分组数据对所述深度置信网络进行训练,得到门诊量预测模型;

预测模块F,其调用所述门诊量预测模型对指定时间序列进行门诊量的预测,根据该指定时间序列获取对应时间序列的分组数据,并根据该分组数据得到预测结果;

逆变换模块G,用于对所述预测结果进行所述预处理的逆变换,得到预测门诊量。

本实施例中,所述网络构建模块进行构建深度置信网络结构,是通过计算所述微分数据的各个数据项与其周围数据项之间的相关性,统计得到相关性较高的数据项的数目,并将该相关性较高的数据项的数目作为所述输入层的节点数目。并且,是根据所述聚类结果自动计算所述微分数据的稀疏性,并根据该稀疏性进行计算第一层隐层的节点数目,微分数据越稀疏,则隐层节点数目越多;然后将第一层隐层的节点数目的一半作为第二层隐层的节点数目,依次类推,直至隐层的节点数目小于预设阈值时,将该隐层作为最上层隐层。

一方面,采用本发明的门诊量预测方法和预测系统,所述输入层的节点数目是根据所述微分数据的相关性自动计算得到的,所述隐层的节点数目是根据所述微分数据的稀疏性自动计算得到的,从而形成一种动态自定义深度的方法,用户不需要随时自定义深度,易于应用。

另一方面,本发明采用聚类算法进行自动创建分组,得到分组数据,并根据所述分组数据对所述深度置信网络进行训练,得到门诊量预测模型,本发明通过采用简单有效的决定网络结构的策略,用户不必再寻找最优化组合的结构,训练更简单。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。并且,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1