本发明涉及医疗大数据领域,具体而言,涉及医院多模态大数据的预处理及特征提取。
背景技术:
随着社会的发展,医疗技术也相应地不断得到提高。国内医院几乎都建立了属于自己的数据仓库,并不断地积累各种疾病信息的数据和历史记录大自身的数据库中,其内容都达到了相当大的规模。这对每一个医院机构来说,是一笔重要的信息资源。为行业人员提供疾病信息的帮助,观察疾病历年来的演变规律及发展趋势,都起到了举足轻重的重要性。然而现如今各个医疗机构都面临着这样的困境,就是如何去分析疾病多模态的大数据,提高疾病信息的利用率,并且准确地找出需要的信息,做出高明的决策。
技术实现要素:
为了解决医疗多模态大数据的预处理及特征提取的难题,本发明提出了一种针对医院分析多模态大数据的方法,并提出设计多密度量化器,采用遗传算法和bp遗传算法等技术进行预测分析。
一种针对医疗多模态大数据的预处理及特征提取方法,如图1所示,包括如下步骤:
步骤1.利用s-g平滑法对医院的多模态数据进行预处理。在待处理点前后选取一段数据。连续奇数个点组成单个窗口并将其排序,取中间值作为平滑值。
步骤2.获取处理后的数据,利用多模态数据的特征的信息量化的方法,采集该医疗机构的多模态大数据,结合网络传输的负载能力,设计多密度量化器
步骤3.基于相关系数分析的局部回归方法,利用多维偏最小二乘算法构建数据模型,采用ga-bp建模的方法,并结合卷积神经网络的方法,提取患者历史数据数据中有价值的信息
步骤4推导出疾病数据的新型信息提取算法,得到患者疾病的动态演化规律,对疾病做出性能评估指标,以及为患者提出滚动优化的方案。
附图说明
图1.一种针对医疗多模态大数据的预处理及特征提取方法的示意图。
具体实施方式
所述的s-g平滑法,其特征在于首先选择好合适的窗口,然后根据多项式拟合法,对每一个窗口内的数据进行平滑处理,将计算得到的平滑值代替对应的窗口数据,然后时间增加的方向依次移动一个数据点,形成新的窗口,直到遍历所有的数据点为止;
其具体的方法是在三维荧光光谱中选取一个矩阵平滑窗口,使得窗口包含(2p+1)×(2q+1)个数据点,其窗口的数据点可以表示为:
(a-p,b-q,x(a-p,b-q,))…(a-p,b0,x(a-p,b0,)),…,(a-p,bq,x(a-p,bq,))…..
(a0,b-q,x(a0,b-q,))…(a0,b0,x(a0,b0,)),…,(a0,bq,x(a0,bq,))…..
(ap,b-q,x(ap,b-q,))…(ap,b0,x(ap,b0,)),…,(ap,bq,x(ap,bq,))
其中am(m=-p,…,p)为第m个发射光谱波长,bn(n=-q,…,q)为第n个激发光谱波长,x(am,bn)(m=-p,…,p,n=-q,…,q)为数据点(am,bn)的荧光强度。
其中窗口内各点的平滑值计算公式为:
所述的多密度量化器,其特征在于能够根据传输网络的情况,动态调节量化器的设定值。由于实际传输网络的情况是动态的,多密度量化器保证最大效率量化数据,达到对多模态大数据的高效传输。通过将量化处理后的数据写成输出值加上一个高斯噪声的形式,即:
然后求出相应时刻的负载度,并根据历史大数据统计数据变化的窗口值,结合数据仓库所需要的精度和负载设计多密度量化器。
所述的多维偏最小二乘算法构建数据模型,其特征在于多维偏最小二乘是一种多维数据模型,在进行回归模型建立过程中,可以得到与各维直接相关的载荷向量,并对模型的各维做独立解释,得到回归模型,可表示为:
其中,x为多模态大数据处理后生成的矩阵,f是组分数,t是得分矩阵,大小为i行f列,wj和wk分别是j方向和k方向的权重矩阵,大小分别为j行f列和k行f列。
当进行预测的操作时,将多模态数据矩阵xw(i×j×k),进行计算可以得到预测结果:将xw降维到二维矩阵xw(i×jk),求解出预测变量ynew的值
所述ga-bp建模的方法,其特征在于采用遗传算法和bp算法(ga-bp)轮流对得到的回归模型进行训练,依据疾病的相关指标,选取其中有价值的数据包,代入遗传算法模型进项建模,直到看到网络收敛。
其中bp网络学习流程为选择3层bp网络的拓扑结构,其输入层神经元选取量化后的多模态数据,然后网络化输入归一化样本数据,参照预测样本的仿真效果,当预测值均方根误差达到一定指标就提前停止训练,直接输出训练好的bp网络模型。
所述卷积神经网络方法,其特征在于采用了前后传输的输出值,反向传播权重和偏置,内部的神经网络中相邻之间额神经单元采用部分连接,使上层的部分神经元,通过神经网络内部的神经元进行感知,有助于从医疗多模态大数据中抽取深层次的知识,从而建立针对多模态大数据的深度认识。
首先第一步建立卷积神经网络,其作用就是能够发现数据的局部特征,然后利用卷积神经网络中的map,共用一个卷积神经网络核。其中每一个map都是由多个神经单元组成。
接着通过实现特征数据与输出层的全连接,利用后传播神经网络的方式调整权重和偏置。可以通过梯度下降法来求解神经网络。因为在实际应用中,梯度下降法往往能够得到令人满意的结果。
卷积神经网络核其实就是权重的含义,在实际计算过程中不用单独计算,而是固定大小的权重矩阵去图像上匹配。权重共享策略减少了需要训练的参数,使得训练出来的模型的泛华能力更强。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。