本发明涉及医学影像处理技术领域,尤其涉及一种医学影像数据的分析方法及系统。
背景技术:
医疗机构的医学图像产出数据量十分庞大,而图像数据往往包含大量潜在信息。目前医疗市场主要依靠人工判读分析医学图像,效率较低且能挖掘的信息有限,无法充分利用数据资源。近年来,随着深度学习的快速发展,机器学习各领域包括计算机视觉迅速被深度学习占领,深度学习已经在图像识别、语音识别等领域取得了令人瞩目的成果。作为机器学习中的重要方法之一,其强大的自动特征提取复杂模型构建以及图像处理能力,非常适合处理医学影像数据分析所面临的新问题,引起了生物医学领域研究人员的广泛关注。目前在深度学习在医学影像领域采用的技术主要是卷积神经网络,其普遍结构如图1所示。目前,基于人工智能技术的影像诊断系统主要利用的是卷积神经网络技术,相比于传统的图像技术,不仅规避了人为定义特征的繁琐步骤,而且还能获取相比于底层特征(例如颜色、纹理、结构等)更高层的语义特征,模拟人脑视觉处理过程。
尽管卷积神经网络相比于传统的特征提取技术具有较明显的优势,但是仍然存在以下不足之处:其一,目前的系统不具备治疗方案推荐功能,仅仅停留在诊断层面上,并没有考虑后期更重要的应对方案。其二,目前采用的卷积神经网络都是基于有标签数据,利用误差逆传播的算法实现的,训练耗时长,且需要大量有标签的样本数据。并且,随着卷积神经网络的隐层数量增加,模型前几层的特征学习能力特别差,无法学习到有效特征。
综上可知,现有技术在实际使用上显然存在不便与缺陷,所以有必要加以改进。
技术实现要素:
针对上述的缺陷,本发明的目的在于提供一种医学影像数据的分析方法及系统,其可以实现影像诊断的功能,还提供后期的方案推荐。
为了实现上述目的,本发明提供一种医学影像数据的分析方法,包括以下步骤:
获取医学影像信息;
基于不同部位将所述医学影像信息分类处理;
基于分类后的医学影像信息,建立对应各部位的医学模型;
对所述医学模型训练处理;
保存模型参数。
根据本发明的医学影像数据的分析方法,所述保存模型参数步骤后还包括:
基于保存的模型参数以及接收新的医学影像信息诊断处理;
根据诊断结果推荐治疗方案。
根据本发明的医学影像数据的分析方法,所述对所述医学模型训练处理步骤包括:
从无标签的数据样本中抽取局部的图像块进行无监督特征学习,获得一组特征向量;
将所述特征向量应用于卷积神经网络的训练中,并采用有标签数据对模型参数进行微调处理。
根据本发明的医学影像数据的分析方法,所述方法还包括:
用训练完成的模型对测试数据提取特征,训练分类器,并验证来评估模型的准确率、特异性及敏感度。
本发明还提供一种医学影像数据的分析系统,包括:
信息获取模块,用于从医学影像信息系统获取医学影像信息;
信息分类模块,用于基于不同部位将所述医学影像信息分类处理;
模型建立模块,用于基于分类后的医学影像信息,建立对应各部位的医学模型;
模型训练模块,用于对所述医学模型训练处理;
模型保存模块,用于保存模型参数。
根据本发明的医学影像数据的分析系统,还包括:
模型诊断模块,用于根据保存的模型参数以及接收新的医学影像信息诊断处理;
方案推送模块,用于根据诊断结果推荐治疗方案。
根据本发明的医学影像数据的分析系统,所述模型训练模块包括:
无监督学习单元,用于从无标签的数据样本中抽取局部的图像块进行无监督特征学习,获得一组特征向量;
参数微调单元,用于将所述特征向量应用于卷积神经网络的训练中,并采用有标签数据对模型参数进行微调处理。
根据本发明的医学影像数据的分析系统,还包括,检测模块,用于根据训练完成的模型对测试数据提取特征,训练分类器,并验证来评估模型的准确率、特异性及敏感度。
本发明通过从医学影像信息系统获取医学影像信息,并基于不同部位将所述医学影像信息分类处理,然后基于分类后的医学影像信息,建立对应各部位的医学模型,对所述医学模型训练处理,最后保存模型参数。更好的是,本发明还可以基于保存的模型参数以及接收新的医学影像信息诊断处理,并根据诊断结果推荐治疗方案。借此,本发明不仅实现影像诊断的功能,还提供后期的方案推荐。
附图说明
图1是现有技术的影像诊断系统结构示意图;
图2是本发明的医学影像数据的分析系统结构示意图;
图3是本发明一实施例的模型训练模块结构示意图;
图4是本发明一实施例的模型算法示意图;
图5是本发明的医学影像数据的分析方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
参见图2,本发明提供了一种医学影像数据的分析系统,其包括:信息获取模块10、信息分类模块20、模型建立模块30、模型训练模块40及模型保存模块50,其中:
信息获取模块10,用于从医学影像信息系统获取医学影像信息。
所述医学影像信息包括但不限于核磁、CT、DR、超声、各种X光机等设备产生的图像,这些图像通过DICOM3.0国际标准接口以数字化的方式作为模型的输入信息。
信息分类模块20,用于基于不同部位将所述医学影像信息分类处理。
由于人体部位数据的非统一性,本发明将各部位的影像信息分类,将同一部位的影像作为一小类,便于后续的模型计算与处理。
模型建立模块30,用于基于分类后的医学影像信息,建立对应各部位的医学模型。各个模型的建立是基于分类后的数据,所以各个模型之间是相互独立的,可以并行训练。
模型训练模块40,用于对所述医学模型训练处理。
模型保存模块50,用于保存模型参数。
本发明基于分类数据的模型建立与计算,为后续的诊断提供数据保障。
更进一步的,该系统还可以设置:
模型诊断模块60,用于根据保存的模型参数以及接收新的医学影像信息诊断处理。
方案推送模块70,用于根据诊断结果推荐治疗方案。
对于训练好的模型,可以从新的医学影像中提取图像特征,并通过分类器判断其是否出现异常,系统根据诊断结果找在临床信息系统中与病人最为相似的临床表现为其推荐治疗方案,借此可以参考该系统的诊断结果及治疗推荐,给病人作出诊断及适合的治疗方案。
本发明的一优选实施例中,结合图3和图4,所述模型训练模块40包括:
无监督学习单元41,用于从无标签的数据样本中抽取局部的图像块进行无监督特征学习,获得一组特征向量。无监督式学习(Unsupervised Learning)是人工智能网络的一种算法(algorithm),其目的是去对原始资料进行分类,以便了解资料内部结构。有别于监督式学习网络,无监督式学习网络在学习时并不知道其分类结果是否正确,亦即没有受到监督式增强(告诉它何种学习是正确的)。其特点是仅对此种网络提供输入范例,而它会自动从这些范例中找出其潜在类别规则。当学习完毕并经测试后,也可以将之应用到新的案例上。
本发明的无监督学习可以通过自动编码器实现。人工神经网络(ANN)本身就是具有层次结构的系统,如果给定一个神经网络,假设其输出与输入是相同的,然后训练调整其参数,得到每一层中的权重。自然地,就得到了输入I的几种不同表示(每一层代表一种表示),这些表示就是特征。自动编码器就是一种尽可能复现输入信号的神经网络。为了实现这种复现,自动编码器就必须捕捉可以代表输入数据的最重要的因素,找到可以代表原信息的主要成分。具体的,自动编码器将初始影像信息作为输入,训练第一层,然后将第一层的输出作为第二层的输入并学习,第三层同理。自动编码器将初始影像信息作为输入,通过第一层到第二层的编码,实现特征学习,以及第二层到第三层的解码,实现图像信息的还原。图4中上半部分的三层即是本发明的一具体实施例。
参数微调单元42,用于将所述特征向量应用于卷积神经网络的训练中,并采用有标签数据对模型参数进行微调处理。
卷积神经网络(Convolutional Neural Network,CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。由于该网络避免了对图像的复杂前期预处理,可以直接输入原始图像,因而得到了更为广泛的应用。
一般地,CNN的基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其它特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。
CNN主要用来识别位移、缩放及其他形式扭曲不变性的二维图形。由于CNN的特征检测层通过训练数据进行学习,所以在使用CNN时,避免了显示的特征抽取,而隐式地从训练数据中进行学习;再者由于同一特征映射面上的神经元权值相同,所以网络可以并行学习,这也是卷积网络相对于神经元彼此相连网络的一大优势。卷积神经网络以其局部权值共享的特殊结构在语音识别和图像处理方面有着独特的优越性,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,特别是多维输入向量的图像可以直接输入网络这一特点避免了特征提取和分类过程中数据重建的复杂度。
本发明对基础卷积神经网络提出改进,将深度学习中无监督特征学习与卷积神经网络相结合,不仅能够应用更多无标签数据样本,而且能够增强卷积神经网络的特征学习能力,降低模型训练难度。
本发明还可以设置一检测模块,用于根据训练完成的模型对测试数据提取特征,训练分类器,并验证来评估模型的准确率、特异性及敏感度。
对于无监督特征学习,本发明预先在一个小的样本空间中训练一个特征提取器,允许它以自适应无监督的方式处理这些无标记样本提取一些基本的特征,揭示观测数据的一些重要内部结构和规律,并将这些特征用于进一步的分类中,借此大大节省时间和精力。另外,针对隐含层数的设定,可以采用在某些中间隐层后接分类器的方法,若中间隐层与后面隐层训练出的分类器效果差异不大,则可以说明较少隐层数的模型已经足够提取到高层特征了。
本发明不仅实现了影像诊断的功能,还考虑到了后期治疗方案的推荐,对于患者来说具有更大的意义,同时采用的核心算法是无监督特征学习的卷积神经网络,具有更强的特征学习能力。在算法处理器上采用图形处理器GPU,作为一个专门的图形处理,可以加速模型的训练过程。
参见图5,本发明提供了一种医学影像数据的分析方法,其可以通过如图2所示的系统实现,该方法包括:
步骤S501,从医学影像信息系统获取医学影像信息。
所述医学影像信息包括但不限于核磁、CT、DR、超声、各种X光机等设备产生的图像,这些图像通过DICOM3.0国际标准接口以数字化的方式作为模型的输入信息。
步骤S502,基于不同部位将所述医学影像信息分类处理。
由于人体部位数据的非统一性,本发明将各部位的影像信息分类,将同一部位的影像作为一小类,便于后续的模型计算与处理。
步骤S503,基于分类后的医学影像信息,建立对应各部位的医学模型。各个模型的建立是基于分类后的数据,所以各个模型之间是相互独立的,可以并行训练。
步骤S504,对所述医学模型训练处理。
步骤S505,保存模型参数。本发明基于分类数据的模型建立与计算,为后续的诊断提供数据保障。
步骤S506,用于根据保存的模型参数以及接收新的医学影像信息诊断处理。
步骤S507,用于根据诊断结果推荐治疗方案。
对于训练好的模型,可以理解为对应人体局部正常情况的状态,在接收新的医学影像信息后,可以根据正常参数及新的数据诊断其是否出现异常,系统根据诊断结果找在临床信息系统中与病人最为相似的临床表现为其推荐治疗方案,借此可以参考该系统的诊断结果及治疗推荐,给病人作出诊断及适合的治疗方案。
进一步的,步骤S504包括:
从无标签的数据样本中抽取局部的图像块进行无监督特征学习,获得一组特征向量;以及
将所述特征向量应用于卷积神经网络的训练中,并采用有标签数据对模型参数进行微调处理。
当然,本发明还可以用训练完成的模型对测试数据提取特征,训练分类器,并验证来评估模型的准确率、特异性及敏感度。
本发明对基础卷积神经网络提出改进,将深度学习中无监督特征学习与卷积神经网络相结合,不仅能够应用更多无标签数据样本,而且能够增强卷积神经网络的特征学习能力,降低模型训练难度。
综上所述,本发明通过从医学影像信息系统获取医学影像信息,并基于不同部位将所述医学影像信息分类处理,然后基于分类后的医学影像信息,建立对应各部位的医学模型,对所述医学模型训练处理,最后保存模型参数。更好的是,本发明还可以基于保存的模型参数以及接收新的医学影像信息诊断处理,并根据诊断结果推荐治疗方案。借此,本发明不仅实现影像诊断的功能,还提供后期的方案推荐。
当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。