一种基于深度信念网络的医院门诊量预测方法与流程

文档序号:12599823阅读:756来源:国知局

本发明属于深度学习和医疗管理领域,具体涉及一种基于深度信念网络的医院门诊量预测方法。



背景技术:

随着我国医疗改革越来越深入,对智能化、高效化、现代化医院的需求变得越来越迫切。医院门诊是病患接受医院诊疗工作的基础环节,是医院面向社会的窗口。对医院门诊量的精准预测有助于后续医疗工作的顺利展开,因此实现医院门诊量的预测是建立现代智能化医院的重要基石。通过对医院门诊量数据的深入挖掘,建立一个门诊量预测模型,能够有效帮助医院对医疗资源实现高效管理和合理分配。

传统的门诊量预测方法主要有ARIMA模型、BP神经网络、曲线回归拟合法以及支持向量机等预测方法,这些方法模型建立在一定规模的门诊量数据上,取得了一些预测结果,但是随着大数据时代的来临使得医疗数据的规模越来越大,同时随着对医疗管理方面的逐步重视,越来越多的医疗管理人员参与到医疗数据挖掘中,使得医疗数据的“量”和“质”都有了极大的改善,然而现有的一些门诊量预测模型例如BP神经网络和支持向量机等预测模型很难对海量的医疗数据进行完全有效的信息挖掘,无法获得最佳的预测效果。

人工神经网络作为数据挖掘技术中较早应用成功的算法之一,在数据预测方面有着强大的优势。它通过网络训练数据样本,将数据中概括出来的知识,分别存储于网络中各神经元中,构成网络知识,再通过该知识来预测相似因素的结果。目前基于神经网络的数据预测的研究中,大多采用了BP网络算法或者其它的浅层网络模型,而浅层网络模型容易陷入局部极值,也就是极值会收敛到局部的最小点,从而导致网络训练失败。

深度学习作为一种新兴的机器学习算法,由人工神经网络模型发展而来,可以包含很多隐含层,能够在大规模的数据集中学习、识别数据的结构和分布。因为深层神经网络强大的特征学习能力,在图像分类、语音识别、文本语言识别等方面得到了极大的应用。同时深度学习作为一种人工神经网络模型的发展,它在数据预测的应用中也能得到很好地效果。Lv Y等人提出了一种基于深度自编码网络模型的交通流预测模型,第一次将自编码模型堆叠起来提取交通流特征用于预测并且取得了理想的预测精度;Hu等人利用深度神经网络强大的非线性映射能力,成功的将深度学习理论应用到了短期风速预测中,并通过仿真证明了深度神经网络在风速预测中的优越性;张艳红等人提出了一种基于深度神经网络的社会媒体网络模型来预测社会媒体网络间的链接分析,对于描述网络间的整体特征有极大的帮助。Hossain M的团队建立了一个堆积降噪自编码模型来预测美国内达华州天气,得到了不错的结果。



技术实现要素:

为了克服现有的门诊量预测方法难以对大规模的医疗管理数据进行有效分析和规律挖掘,没有考虑各门诊科室间的相互影响关系以及门诊量预测精度差等问题,本发明提出了一种预测精度较高的基于深度信念网络的医院门诊量预测方法。

本发明解决其技术问题所采用的技术具体步骤是:

一种基于深度信念网络的医院门诊量预测方法,包括以下步骤:

步骤一:医疗管理数据收集和统计,收集医疗管理数据,所述医疗管理数据包括病患姓名编号、挂号的科室类型、患者的病情、挂号的日期和问诊的医师等;对医院各科室的门诊量数据进行分类统计,将门诊量数据按照门诊科室类型划分为M组,并将每组数据按一定的时间段统计出N条门诊量数据,生成了一个A*M*N的门诊量数据集(l1;l2;l3……lN-A+1)以及对应的标签数据集M*N(y1;y2;y3……yN-A+1);其中A是常数,表示用第Ti-1,Ti-2……Ti-A个时间段门诊量数据预测第Ti个时间段的门诊量(1<A<i<<N);

步骤二:构建一个基于深度信念网络的预测模型,该模型的输入层有A*M个输入,B个隐藏层,一个逻辑回归层和一个输出层,其中逻辑回归层叠加在第B个隐藏层之上以预测门诊量;输出层有R个输出表示R个科室的门诊量预测值,0<R≤M;深度信念网络由多个受限玻尔兹曼机组成,而受限玻尔兹曼机由一个显层和一个隐层构成,即将上述深度信念网络中的输入层作为显层,第一个隐藏层作为隐层构成了第一个受限玻尔兹曼机,以此类推,直至第i-1个隐藏层作为显层和第i个隐藏层作为隐层构成了第i个受限玻尔兹曼机,0<i<B;

步骤三,用无监督贪婪逐层算法训练整个深度信念网络,即逐个训练受限玻尔兹曼机,单个受限玻尔兹曼机使用对比散度算法训练来获取显层和隐层之间的最佳权重值;用门诊量数据集A*M*N(l1;l2;l3……lN-A+1)作为输入,训练第一个受限玻尔兹曼机;第一个受限波尔兹曼机训练结束后再训练第2个受限玻尔兹曼机;以此类推,直至训练完所有的受限波尔兹曼机,将训练得到的结果作为深度信念网络模型权重参数的初值;

步骤四:将深度信念网络最后一层的输出特征向量作为逻辑回归层的输入向量,门诊量数据集中的标签数据集M*N(y1;y2;y3……yN-A+1)作为输出,进行有监督训练,用反向传播算法根据优化目标函数来微调深度信念网络和逻辑回归层内部的权重参数,其中Ppre(i)表示第i次优化得到的预测值,Preal(i)表示和第i次优化对应的真实值,当目标函数收敛或者达到训练迭代次数时停止训练,保存微调后整个网络的权重参数,获得基于深度信念网络的门诊量预测模型;

步骤五:在训练好的门诊量预测模型中输入医院各个科室的历史门诊量数据集,得到的输出结果就是医院相应科室的预测门诊量数据。

本发明的有益效果为:通过对过往医院门诊量数据进行训练得到的具有深度结构的神经网络可以对数据进行更深入的挖掘和分析,识别各科室各个时间段内的门诊量数据间的内在关系,有效提取数据间的隐藏分层特征,节省了大量人工提取数据特征的工作量,可以实现对未来时间段内医院门诊量的结果预测。

具体实施方式

下面对本发明做进一步说明。

一种基于深度信念网络的医院门诊量预测方法,包括以下步骤:

步骤一:医疗管理数据收集和统计。收集医疗管理数据,所述医疗管理数据包括病患姓名编号、挂号的科室类型、患者的病情、挂号的日期和问诊的医师等;对医院各科室的门诊量数据进行分类统计,将门诊量数据按照门诊科室类型划分为M组,每组数据表示一个科室的所有的门诊信息,并将每个科室的门诊信息按一定的时间段统计出N条门诊量数据,每条数据表示在一段时间内的门诊量。最后生成一个A*M*N的门诊量数据集(l1;l2;l3……lN-A+1)以及对应的标签数据集M*N(y1;y2;y3……yN-A+1);其中A是常数,表示用第Ti-1,Ti-2……Ti-A个时间段门诊量数据预测第Ti个时间段的门诊量(1<A<i<<N)。

步骤二:构建一个基于深度信念网络的预测模型。根据统计得到的门诊量数据集构建深度信念网络模型,使得该模型的输入层有A*M个输入,B个隐藏层,一个逻辑回归层和一个输出层,其中逻辑回归层叠加在第B个隐藏层之上以预测未来的门诊量;输出层有R个输出表示R个科室的门诊量预测值,0<R≤M,一般来说输出个数远少于门诊量数据集中科室的数目。

深度信念网络由多个受限玻尔兹曼机组成,受限玻尔兹曼机则由一个显层和一个隐层构成,即将上述深度信念网络中的输入层作为显层,第一个隐藏层作为隐层构成了第一个受限玻尔兹曼机,以此类推,直至第i-1个隐藏层作为显层和第i个隐藏层作为隐层构成了第i个受限玻尔兹曼机,0<i<B。

步骤三,用无监督贪婪逐层算法训练整个深度信念网络,深度信念网络可以由多个受限玻尔兹曼机叠加组成,它的训练过程就是逐个训练受限玻尔兹曼机,单个受限玻尔兹曼机通常使用对比散度算法来训练,也就是让受限玻尔兹曼机来拟合训练样本的分布,以此来得到最佳的偏置向量a(显层)和b(隐层)以及权值矩阵W(显层和隐层之间的权值矩阵)。

用门诊量数据集A*M*N(l1;l2;l3……lN-A+1)作为输入,训练第一个受限玻尔兹曼机;第一个受限波尔兹曼机训练结束后再训练第2个受限玻尔兹曼机;以此类推,直至训练完所有的受限波尔兹曼机,将训练得到的结果作为深度信念网络模型初始化权重参数。

步骤四:将深度信念网络最后一层的输出特征向量作为逻辑回归层的输入向量,门诊量数据集中的标签数据集M*N(y1;y2;y3……yN-A+1)作为输出,进行有监督训练,用反向传播算法根据优化目标函数来微调深度信念网络和逻辑回归层内部的权重参数,其中Ppre(i)表示第i次优化得到的预测值,Preal(i)表示和第i次优化对应的真实值,也就是说输入的样本是有标签的,根据得到的输出结果和实际结果之间的差去调整前面各层的权重参数,直至收敛。当目标函数收敛或者达到训练迭代次数时停止训练,保存微调后整个网络的权重参数。获得基于深度信念网络的门诊量预测模型。

步骤五:在训练好的门诊量预测模型中输入医院各个科室的历史门诊量数据集,得到的输出结果就是医院相应科室的预测门诊量数据。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1