一种针对医疗多模态大数据的预处理及特征提取方法与流程

文档序号：13448167阅读：2389来源：国知局

本发明涉及医疗大数据领域，具体而言，涉及医院多模态大数据的预处理及特征提取。

背景技术：

随着社会的发展，医疗技术也相应地不断得到提高。国内医院几乎都建立了属于自己的数据仓库，并不断地积累各种疾病信息的数据和历史记录大自身的数据库中，其内容都达到了相当大的规模。这对每一个医院机构来说，是一笔重要的信息资源。为行业人员提供疾病信息的帮助，观察疾病历年来的演变规律及发展趋势，都起到了举足轻重的重要性。然而现如今各个医疗机构都面临着这样的困境，就是如何去分析疾病多模态的大数据，提高疾病信息的利用率，并且准确地找出需要的信息，做出高明的决策。

技术实现要素：

为了解决医疗多模态大数据的预处理及特征提取的难题，本发明提出了一种针对医院分析多模态大数据的方法，并提出设计多密度量化器，采用遗传算法和bp遗传算法等技术进行预测分析。

一种针对医疗多模态大数据的预处理及特征提取方法，如图1所示，包括如下步骤：

步骤1.利用s-g平滑法对医院的多模态数据进行预处理。在待处理点前后选取一段数据。连续奇数个点组成单个窗口并将其排序，取中间值作为平滑值。

步骤2.获取处理后的数据，利用多模态数据的特征的信息量化的方法，采集该医疗机构的多模态大数据，结合网络传输的负载能力，设计多密度量化器

步骤3.基于相关系数分析的局部回归方法，利用多维偏最小二乘算法构建数据模型，采用ga-bp建模的方法，并结合卷积神经网络的方法，提取患者历史数据数据中有价值的信息

步骤4推导出疾病数据的新型信息提取算法，得到患者疾病的动态演化规律，对疾病做出性能评估指标，以及为患者提出滚动优化的方案。

附图说明

图1.一种针对医疗多模态大数据的预处理及特征提取方法的示意图。

具体实施方式

所述的s-g平滑法，其特征在于首先选择好合适的窗口，然后根据多项式拟合法，对每一个窗口内的数据进行平滑处理，将计算得到的平滑值代替对应的窗口数据，然后时间增加的方向依次移动一个数据点，形成新的窗口，直到遍历所有的数据点为止；

其具体的方法是在三维荧光光谱中选取一个矩阵平滑窗口，使得窗口包含(2p+1)×(2q+1)个数据点，其窗口的数据点可以表示为：

(a-p,b-q,x(a-p,b-q,))…(a-p,b0,x(a-p,b0,)),…,(a-p,bq,x(a-p,bq,))…..

(a0,b-q,x(a0,b-q,))…(a0,b0,x(a0,b0,)),…,(a0,bq,x(a0,bq,))…..

(ap,b-q,x(ap,b-q,))…(ap,b0,x(ap,b0,)),…,(ap,bq,x(ap,bq,))

其中am(m＝-p,…,p)为第m个发射光谱波长，bn(n＝-q,…,q)为第n个激发光谱波长，x(am,bn)(m＝-p,…,p，n＝-q,…,q)为数据点(am,bn)的荧光强度。

其中窗口内各点的平滑值计算公式为：

所述的多密度量化器，其特征在于能够根据传输网络的情况，动态调节量化器的设定值。由于实际传输网络的情况是动态的，多密度量化器保证最大效率量化数据，达到对多模态大数据的高效传输。通过将量化处理后的数据写成输出值加上一个高斯噪声的形式，即：

然后求出相应时刻的负载度，并根据历史大数据统计数据变化的窗口值，结合数据仓库所需要的精度和负载设计多密度量化器。

所述的多维偏最小二乘算法构建数据模型，其特征在于多维偏最小二乘是一种多维数据模型，在进行回归模型建立过程中，可以得到与各维直接相关的载荷向量，并对模型的各维做独立解释，得到回归模型，可表示为：

其中，x为多模态大数据处理后生成的矩阵，f是组分数，t是得分矩阵，大小为i行f列，w^j和w^k分别是j方向和k方向的权重矩阵，大小分别为j行f列和k行f列。

当进行预测的操作时，将多模态数据矩阵x^w(i×j×k),进行计算可以得到预测结果：将x^w降维到二维矩阵x^w(i×jk)，求解出预测变量ynew的值

所述ga-bp建模的方法，其特征在于采用遗传算法和bp算法(ga-bp)轮流对得到的回归模型进行训练，依据疾病的相关指标，选取其中有价值的数据包，代入遗传算法模型进项建模，直到看到网络收敛。

其中bp网络学习流程为选择3层bp网络的拓扑结构，其输入层神经元选取量化后的多模态数据，然后网络化输入归一化样本数据，参照预测样本的仿真效果，当预测值均方根误差达到一定指标就提前停止训练，直接输出训练好的bp网络模型。

所述卷积神经网络方法，其特征在于采用了前后传输的输出值，反向传播权重和偏置，内部的神经网络中相邻之间额神经单元采用部分连接，使上层的部分神经元，通过神经网络内部的神经元进行感知，有助于从医疗多模态大数据中抽取深层次的知识，从而建立针对多模态大数据的深度认识。

首先第一步建立卷积神经网络，其作用就是能够发现数据的局部特征，然后利用卷积神经网络中的map,共用一个卷积神经网络核。其中每一个map都是由多个神经单元组成。

接着通过实现特征数据与输出层的全连接，利用后传播神经网络的方式调整权重和偏置。可以通过梯度下降法来求解神经网络。因为在实际应用中，梯度下降法往往能够得到令人满意的结果。

卷积神经网络核其实就是权重的含义，在实际计算过程中不用单独计算，而是固定大小的权重矩阵去图像上匹配。权重共享策略减少了需要训练的参数，使得训练出来的模型的泛华能力更强。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变形或修改，这并不影响本发明的实质内容。

技术特征：

技术总结
本发明提出一种针对医疗机构分析多模态大数据的分析方法。主要是针对医院数据库中患者的多模态大数据的分析。可以综合考虑多个模态信息数据，有效地避免传统数据分析过程中，传输网络受限情况的发生，并保证实时反馈用户信息。所建立的多维偏最小二乘模型，并结合卷积神经网络方法，能够减少信息损失，得到稳定的预测模型，为医院提供更加详尽且准确的分析报告。

技术研发人员：鲁仁全;张金涛;吴元清
受保护的技术使用者：广东工业大学
技术研发日：2017.07.25
技术公布日：2018.01.12

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：鲁仁全;张金涛;吴元清
技术所有人：广东工业大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。