一种针对医疗多模态大数据的预处理及特征提取方法与流程

文档序号:13448167阅读:2389来源:国知局

本发明涉及医疗大数据领域,具体而言,涉及医院多模态大数据的预处理及特征提取。



背景技术:

随着社会的发展,医疗技术也相应地不断得到提高。国内医院几乎都建立了属于自己的数据仓库,并不断地积累各种疾病信息的数据和历史记录大自身的数据库中,其内容都达到了相当大的规模。这对每一个医院机构来说,是一笔重要的信息资源。为行业人员提供疾病信息的帮助,观察疾病历年来的演变规律及发展趋势,都起到了举足轻重的重要性。然而现如今各个医疗机构都面临着这样的困境,就是如何去分析疾病多模态的大数据,提高疾病信息的利用率,并且准确地找出需要的信息,做出高明的决策。



技术实现要素:

为了解决医疗多模态大数据的预处理及特征提取的难题,本发明提出了一种针对医院分析多模态大数据的方法,并提出设计多密度量化器,采用遗传算法和bp遗传算法等技术进行预测分析。

一种针对医疗多模态大数据的预处理及特征提取方法,如图1所示,包括如下步骤:

步骤1.利用s-g平滑法对医院的多模态数据进行预处理。在待处理点前后选取一段数据。连续奇数个点组成单个窗口并将其排序,取中间值作为平滑值。

步骤2.获取处理后的数据,利用多模态数据的特征的信息量化的方法,采集该医疗机构的多模态大数据,结合网络传输的负载能力,设计多密度量化器

步骤3.基于相关系数分析的局部回归方法,利用多维偏最小二乘算法构建数据模型,采用ga-bp建模的方法,并结合卷积神经网络的方法,提取患者历史数据数据中有价值的信息

步骤4推导出疾病数据的新型信息提取算法,得到患者疾病的动态演化规律,对疾病做出性能评估指标,以及为患者提出滚动优化的方案。

附图说明

图1.一种针对医疗多模态大数据的预处理及特征提取方法的示意图。

具体实施方式

所述的s-g平滑法,其特征在于首先选择好合适的窗口,然后根据多项式拟合法,对每一个窗口内的数据进行平滑处理,将计算得到的平滑值代替对应的窗口数据,然后时间增加的方向依次移动一个数据点,形成新的窗口,直到遍历所有的数据点为止;

其具体的方法是在三维荧光光谱中选取一个矩阵平滑窗口,使得窗口包含(2p+1)×(2q+1)个数据点,其窗口的数据点可以表示为:

(a-p,b-q,x(a-p,b-q,))…(a-p,b0,x(a-p,b0,)),…,(a-p,bq,x(a-p,bq,))…..

(a0,b-q,x(a0,b-q,))…(a0,b0,x(a0,b0,)),…,(a0,bq,x(a0,bq,))…..

(ap,b-q,x(ap,b-q,))…(ap,b0,x(ap,b0,)),…,(ap,bq,x(ap,bq,))

其中am(m=-p,…,p)为第m个发射光谱波长,bn(n=-q,…,q)为第n个激发光谱波长,x(am,bn)(m=-p,…,p,n=-q,…,q)为数据点(am,bn)的荧光强度。

其中窗口内各点的平滑值计算公式为:

所述的多密度量化器,其特征在于能够根据传输网络的情况,动态调节量化器的设定值。由于实际传输网络的情况是动态的,多密度量化器保证最大效率量化数据,达到对多模态大数据的高效传输。通过将量化处理后的数据写成输出值加上一个高斯噪声的形式,即:

然后求出相应时刻的负载度,并根据历史大数据统计数据变化的窗口值,结合数据仓库所需要的精度和负载设计多密度量化器。

所述的多维偏最小二乘算法构建数据模型,其特征在于多维偏最小二乘是一种多维数据模型,在进行回归模型建立过程中,可以得到与各维直接相关的载荷向量,并对模型的各维做独立解释,得到回归模型,可表示为:

其中,x为多模态大数据处理后生成的矩阵,f是组分数,t是得分矩阵,大小为i行f列,wj和wk分别是j方向和k方向的权重矩阵,大小分别为j行f列和k行f列。

当进行预测的操作时,将多模态数据矩阵xw(i×j×k),进行计算可以得到预测结果:将xw降维到二维矩阵xw(i×jk),求解出预测变量ynew的值

所述ga-bp建模的方法,其特征在于采用遗传算法和bp算法(ga-bp)轮流对得到的回归模型进行训练,依据疾病的相关指标,选取其中有价值的数据包,代入遗传算法模型进项建模,直到看到网络收敛。

其中bp网络学习流程为选择3层bp网络的拓扑结构,其输入层神经元选取量化后的多模态数据,然后网络化输入归一化样本数据,参照预测样本的仿真效果,当预测值均方根误差达到一定指标就提前停止训练,直接输出训练好的bp网络模型。

所述卷积神经网络方法,其特征在于采用了前后传输的输出值,反向传播权重和偏置,内部的神经网络中相邻之间额神经单元采用部分连接,使上层的部分神经元,通过神经网络内部的神经元进行感知,有助于从医疗多模态大数据中抽取深层次的知识,从而建立针对多模态大数据的深度认识。

首先第一步建立卷积神经网络,其作用就是能够发现数据的局部特征,然后利用卷积神经网络中的map,共用一个卷积神经网络核。其中每一个map都是由多个神经单元组成。

接着通过实现特征数据与输出层的全连接,利用后传播神经网络的方式调整权重和偏置。可以通过梯度下降法来求解神经网络。因为在实际应用中,梯度下降法往往能够得到令人满意的结果。

卷积神经网络核其实就是权重的含义,在实际计算过程中不用单独计算,而是固定大小的权重矩阵去图像上匹配。权重共享策略减少了需要训练的参数,使得训练出来的模型的泛华能力更强。

以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。



技术特征:

技术总结
本发明提出一种针对医疗机构分析多模态大数据的分析方法。主要是针对医院数据库中患者的多模态大数据的分析。可以综合考虑多个模态信息数据,有效地避免传统数据分析过程中,传输网络受限情况的发生,并保证实时反馈用户信息。所建立的多维偏最小二乘模型,并结合卷积神经网络方法,能够减少信息损失,得到稳定的预测模型,为医院提供更加详尽且准确的分析报告。

技术研发人员:鲁仁全;张金涛;吴元清
受保护的技术使用者:广东工业大学
技术研发日:2017.07.25
技术公布日:2018.01.12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1