数据处理方法、装置及电子设备与流程

文档序号:17466079发布日期:2019-04-20 05:31阅读:145来源:国知局
数据处理方法、装置及电子设备与流程

本发明涉及医疗数据处理技术领域,具体而言,涉及数据处理方法、装置及电子设备。



背景技术:

乳腺癌是女性最常见的恶性肿瘤之一,以其高发病率、高死亡率严重威胁女性身体健康。然而,其发病机理不确定和病情隐匿,使得早期乳腺癌很难被发现。

目前医学影像技术是诊断乳腺癌的主要手段。然而,对乳腺医疗图像的分析却依赖于专业医护人员。但是专业医护人员的数量相对较少,而患癌人数又在不断增多。海量的医学影像数据不仅给工作人员带来疲劳,还容易导致误诊率的上升。

因此,亟需一种辅助专业医护人员对乳腺医疗图像进行分析的方法。



技术实现要素:

本发明实施例的目的在于提供一种数据处理方法、装置及电子设备,用于自动对乳腺医疗图像进行分析,为专业医护人员提供可靠的参考数据。

为了实现上述目的,本发明实施例采用的技术方案如下:

第一方面,本发明实施例提供了一种数据处理方法,应用于电子设备,所述电子设备包括乳腺数据分析模型,所述方法包括:将待分析医疗图像划分为多个子图块;利用所述乳腺数据分析模型对每一所述子图块进行分类处理,以获取对应的预测评分;基于每一所述子图块对应的预测评分,确定所述待分析医疗图像对应的分类结果。

第二方面,本发明实施例提供了一种数据处理装置,应用于电子设备,所述电子设备包括乳腺数据分析模型,所述装置包括:划分模块,用于将待分析医疗图像划分为多个子图块;处理模块,用于利用所述乳腺数据分析模型对每一所述子图块进行分类处理,以获取对应的预测评分;确定模块,用于基于每一所述子图块对应的预测评分,确定所述待分析医疗图像对应的分类结果。

第三方面,本发明实施例提供一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行时执行前述的数据处理方法的步骤。

相对现有技术,本发明实施例提供的一种数据处理方法,通过将待分析医疗图像划分为多个子图块,再利用所述乳腺数据分析模型对每一所述子图块进行分类处理,以获取对应的预测评分,基于每一所述子图块对应的预测评分,确定所述待分析医疗图像对应的分类结果。通过先将待分析医疗图像划分为子图块,便于乳腺数据分析模型进行特征提取,再根据特征提取结果分析出待分析医疗图像对应的分类结果,将基于医疗图像水平的乳腺分析问题转化为基于子图块水平的乳腺分析问题,提高了识别的准确性,更加适于乳腺类医疗图像数据的分析,便于为专业医护人员提供可靠的参考数据,减轻专业医护人员的工作负担,辅助提高乳腺癌早期诊断准确率。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例提供的应用场景示意图。

图2示出了本发明实施例提供的电子设备的方框示意图。

图3示出了本发明实施例提供的数据处理方法的步骤流程图。

图4示出了本发明实施例提供的乳腺数据分析模型的结构示意图。

图5示出了本发明实施例提供的数据处理方法的步骤流程图的另一部分。

图6示出了本发明实施例提供的数据处理装置的示意图。

图标:100-电子设备;101-存储器;102-通信接口;103-处理器;104-总线;200-tcga服务器;300-数据处理装置;301-划分模块;302-处理模块;303-确定模块;304-获取模块;305-训练模块。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本发明的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。

乳腺癌是女性最常见的恶性肿瘤之一,以其高发病率、高死亡率严重威胁女性身体健康。然而,其发病机理不确定和病情隐匿,使得早期乳腺癌很难被发现。目前医学影像技术是诊断乳腺癌的主要手段。

伴随着医学影像技术的发展,临床实际中产生了大量医学影像数据,同时也包含绝大数的干扰信息,高效准确的挖掘出疾病信息对于疾病诊断至关重要。就核磁共振影像技术来说,病人一次检测有十几种扫描序列,产生的图像数据更是多达上千张。而从影像数据中挖掘出有效信息,主要依赖于专业医护人员的专业技术和主观经验。

同时,由于乳腺在其症状的隐匿性,加上mri影像数据的多序列特点,对医生的技术水平和专业知识和临床经验都有极高的要求,需要医生较高的耐压力和专注力。这些高强度的工作难免会给医生带来视觉和心理疲劳导致诊断错误,对于病人来说更是承担了极大风险,如果误判断为假阴性,患者会错过最佳治疗时间而造成更大的损失。

因此,本发明实施例提供了一种数据处理方法、装置及电子设备,用于改善上述问题。

利用神经网络对癌症筛查与诊断的原理是:将癌症相关的病理数据分别进行数据清理、数据集成、数据变换、数据规约等处理。然后,针对结构化数据直接采用神经网络进行特征选择和提取,针对非结构化数据,进行病灶分割特征提取。再组合特征,利用分类器训练与验证,最后利用经验系统进行癌症推理引擎,实现诊断、预警和提示。

需要说明的是,医疗图像具有与自然图像不同的特点,比如病灶只占整个图像的一小部分,而且病灶的发生对周围的组织会产生影响。而且,医疗图像以多切片形式组织,这些切片组合起来可以很好的描述器官组织的立体结构。再加之,医疗图像的全尺寸、无标注的特点,直接利用深度学习模型对其进行特征提取准确度不高,难以识别。本发明实施例提供的数据处理方法则通过将基于医疗图像水平的乳腺分析问题转化为基于图像块水平的乳腺分析问题,进而得到最终可靠的分析结果。通过大量测试验证,在针对乳腺类医疗图像的分析识别上具有显著的性能提升,有助于乳腺癌早期诊断。

请参照图1,图1示出了本发明实施例提供的数据处理方法的应用场景图。图1中所示的电子设备100与tcga服务器200通信连接。

上述tcga服务器200用于存储癌症相关的病理数据。癌症相关的病理数据可以包括癌症诊断记录、临床数据、基因数据、影像数据等。

请参照图2,图2示出了本发明实施例提供的电子设备100的方框示意图。电子设备100可以是,但不限于个人电脑(personalcomputer,pc)、服务器、分布式部署的计算机等等。可以理解的是,电子设备100也不限于物理服务器,还可以是物理服务器上的虚拟机、基于云平台上构建的虚拟机等能提供与所述服务器或者虚拟机有相同功能的计算机。

电子设备100的操作系统可以是,但不限于,windows系统、linux系统等。上述电子设备100包括存储器101、通信接口102、处理器103和总线104,所述存储器101、通信接口102和处理器103通过总线104连接,处理器103用于执行存储器101中存储的可执行模块,例如计算机程序。其中,存储器101可能包含高速随机存取存储器(ram:randomaccessmemory),也可能还包括非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器。通过至少一个通信接口102(可以是有线或者无线)实现该电子设备100与外部设备之间的通信连接。

总线104可以是isa总线104、pci总线104或eisa总线104等。图2中仅用一个双向箭头表示,但并不表示仅有一根总线104或一种类型的总线104。

其中,存储器101用于存储程序,例如图6所示的数据处理装置300。该数据处理装置300包括至少一个可以软件或固件(firmware)的形式存储于所述存储器101中或固化在所述电子设备100的操作系统(operatingsystem,os)中的软件功能模块。所述处理器103在接收到执行指令后,执行所述程序以实现本发明上述实施例揭示的数据处理方法。存储器101内还可以用于存储乳腺数据分析模型。

处理器103可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器103中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器103可以是通用处理器,包括中央处理器(centralprocessingunit,简称cpu)、网络处理器(networkprocessor,简称np)等;还可以是数字信号处理器(dsp)、专用集成电路(asic)、现成可编程门阵列(fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

第一实施例

请参照图3,图3示出了本发明实施例提供的数据处理方法流程图,应用于电子设备100。数据处理方法包括以下步骤:

步骤s101,将待分析医疗图像划分为多个子图块。

在本发明实施例中,上述待分析医疗图像可以是利用医学影像技术获得的图像数据。上述医学影像技术可以包括乳腺钼靶x线摄影(mammography,mm)、超声(ultrasonography,us)、计算机断层扫描(computedtomography,ct)、动态增强核磁共振影像(magneticresonanceimaging,mri)和正电子发射断层扫描(positronemissiontomography,pet-ct)等方式。上述各类医学影像技术各具优势,比如:乳腺钼靶价格低廉,成像简单、快速的优点是检测乳腺癌最基本、最有效的一种检查方法。利用x射线透射性穿过乳房区域投影到探测器上而得到全乳的密度图像,对为钙化点的较敏感。超声成像(us)主要是利用了超声波的束射性,反射与及衰减特性,通过对反射信号的接收处理以得到乳房内部的病变组织图像,是广泛应用乳腺实时成像的检查方式。其对乳房中的实性及囊性肿块有较好的检出能力。

进一步地,上述待分析医疗图像有别于普通图像数据,其具有高像素、全尺寸、无标注等特点。显然,于待分析医疗图像而言,无法直接作为乳腺数据分析模型的输入数据。可选地,依据乳腺数据分析模型的输入层的尺寸,对待分析医疗图像进行划分,以获得多个子图块。例如,输入层的尺寸为128×128×3,则将待分析医疗图像划分为多个128×128×3的子图块。

需要说明的是,上述乳腺数据分析模型优选为卷积神经网络。乳腺数据分析模型包括多个处理层,例如,可以包括输入层、卷积层、池化层、inception层、线性全连接层、softmax输出层等。

需要说明的是,卷积神经网络的卷积层中的神经元只和部分的邻层神经元相连,卷积神经网络利用局部空间相关性,将每一层的神经元与其相邻的前一层的局部区域的神经元相连,这种连接方式被称为局部连接或者稀疏连接,该方式极大地减少了权值数量,降低了模型复杂度和训练难度。

作为一种实施方式,上述乳腺数据分析模型可以包括1个输入层、6个卷积层、2个池化层、3个inception层、2个线性全连接层、1个softmax输出层。

步骤s102,利用乳腺数据分析模型对每一子图块进行分类处理,以获取对应的预测评分。

在本发明实施例中,依次将每一子图块输入乳腺数据分析模型,进过乳腺数据分析模型的特征提取及分析,对应的预测评分。具体地,乳腺数据分析模型结构如图4所示,乳腺数据分析模型的输入层与第一层卷积层连接的输入侧连接,第一层卷积层(即图中conv.layer(1))的输出侧与featuremap的输入侧连接,featuremap的输出侧与第二层卷积层(即图中conv.layer(2))的输入侧连接,第二层卷积层的输出侧与第三层卷积层(即图中conv.layer(3)的输入层连接,第三层卷积层的输出侧与第一池化层(即图中poolinglayer(3))的输入侧连接,第一池化层的输出侧后接第四层卷积层(即图中conv.layer(4))、第五层卷积层(即图中conv.layer(5))和第六层卷积层(即图中conv.layer(6)),第四层卷积层、第五层卷积层和第六层卷积层后接第一层inception层、第二层inception层、第三层inception层,第一层inception层(即图中inception.layer(7))、第二层inception层(即图中inception.layer(8))、第三层inception层(即图中inception.layer(9))后接第二池化层(即图中poolinglayer(10)),第二池化层后接两个线性全连接层,线性全连接层后接softmax输出层。作为一种实施方式,本发明中个卷积层的卷积核大小可以是3×3,步长为1或2。第一池化层大小为3×3,滑动步长为2,第二池化层大小8×8,滑动步长分别为1。

将子图块从乳腺数据分析模型的输入层输入,将子图块归一化到[0,1]之间,再依次经过其他各处理层的处理,从softmax输出层输出分析结果。softmax输出层的输出类型数量可以为两个。

可以理解的,可以设置乳腺数据分析模型的输出类别为两个不同字符,每个字符表征一种分析结果,例如,输出类别为0和1,0代表一种分析结果,即不存在乳腺癌病灶特征;1代表另一种分析结果,即存在乳腺癌病灶特征。上述预测评分可以是识别出子图块属于每种输出类别的概率。

步骤s103,基于每一子图块对应的预测评分,确定所述待分析医疗图像对应的分类结果。

在本发明实施例中,由于单个子图块的预测评分并不能完全表征整个待分析医疗图像的分析结果,因此,需要对每一子图块对应的预测评分进行整体分析,以获得针对待分析医疗图像的分类结果。上述分析结果可以理解为待分析医疗图像通过乳腺数据分析模型得到的标准分析结果的输出类别。

可选地,上述对每一子图块对应的预测评分进行整体分析的方式可以是,可以根据每一子图块对应的预测评分进行融合处理,以获得表征所述待分析医疗图像的最终评分;根据所述最终评分,评估所述待分析医疗图像的所述分类结果。

作为一种实施方式,上述根据每一子图块对应的预测评分进行融合处理的方式可以是:根据每一子图块对应的预测评分,利用公式:

计算表征所述待分析医疗图像的最终评分,其中,o代表最终评分,ai代表赋予第i个子图块的融合权重,ai≥0且oi代表第i个子图块对应的预测评分。从而,平衡每个子图块对最终评分的贡献大小。

可以理解的是,上述乳腺数据分析模型可以是预选存储的,也可以是自主训练获得的。在所述乳腺数据分析模型为自主训练获得时,如图5所示,上述数据处理方法可以包括以下步骤:

步骤s201,从tcga服务器200获取样本病理图像数据。

在本发明实施例中,电子设备100可以从tcga服务器200获取乳腺癌相关的病理数据,并将其中病理图像数据作为样本病理图像数据。

步骤s202,基于样本病理图像数据对初始模型进行训练,以获得乳腺数据分析模型。

在本发明实施例中,上述步骤s202可以包括:

(1)对样本病理图像数据进行预处理,以获得多个样本子图块。具体地,依次对所述样本病理图像数据进行数据清理处理、数据集成处理、数据变换处理及数据规约处理。将处理后的样本病理图像数据划分为多个样本子图块。

(2)将样本病理图像数据的分类标签赋予对应的样本子图块。需要说明的是,样本病理图像数据对应的分类标签已经被确定,将样本病理图像数据对应的每一个样本子图块均赋予与其相同的分类标签。

(3)利用初始模型对每一样本子图块进行分类评估,以获取对应的所述预测评分。

在本发明实施例中,初始模型可以是预选存储的结构适于乳腺图像数据特征提取的卷积神经网络。需要说明的是,该初始模型也包括多个处理层,每一处理层的输出侧均经过一个relu激活函数:relu(x)=max(0,x),其可以使损失函数收敛加快,同时,其具有稀疏性,并且可以很大程度上防止模型梯度消失。上述初始模型采用的损失函数为:

其中,所述fnet(yt(i),w)为初始模型的输出值,上述输出值可以是分析结果属于预设的输出类别的概率;所述代表样本的实际的分类标签,其对应的取值可以预先定义,例如,样本病理图像数据的分类标签表示未患乳腺癌则对应的分类标签的取值可以设置为0,样本病理图像数据的分类标签表示患乳腺癌则对应的分类标签的取值可以设置为1。w代表权重参数,即共享权重矩阵;n代表样本数量。

(4)基于每一样本病理图像数据对应的所述样本子图块的预测评分,以获得样本病理图像数据的所述最终评分。

可选地,上述于每一样本病理图像数据对应的所述样本子图块的预测评分,以获得样本病理图像数据的所述最终评分的方式可以是,可以根据每一样本子图块对应的预测评分进行融合处理,以获得表征所述样本病理图像数据的最终评分;根据最终评分,评估待分析医疗图像的所述分类结果。

作为一种实施方式,上述根据每一样本子图块对应的预测评分进行融合处理可以是:根据每一样本子图块对应的预测评分,利用公式:

计算表征所述样本病理图像数据的最终评分,其中,o代表最终评分,ai代表赋予第i个样本子图块的融合权重,ai≥0且oi代表第i个样本子图块对应的预测评分。从而,平衡每个样本子图块对最终评分的贡献大小。

(5)根据样本病理图像数据的所述最终评分调整所述初始模型的参数,以获得所述乳腺数据分析模型。需要说明的是,样本病理图像数据真实的分类标签是已知的,利用初始模型的输出值、样本对应的真实的分类标签,结合损失函数,对初始模型的参数进行调整,以获得乳腺数据分析模型。

第二实施例

请参照图6,图6示出了本发明实施例提供的数据处理装置300的方框示意图。数据处理装置300应用于电子设备100,其包括划分模块301、处理模块302及确定模块303。

划分模块301,用于将待分析医疗图像划分为多个子图块。

在本发明实施例中,上述划分模块301可以用于执行上述步骤s101。

处理模块302,用于利用所述乳腺数据分析模型对每一所述子图块进行分类处理,以获取对应的预测评分。

在本发明实施例中,上述处理模块302可以用于执行上述步骤s102。

确定模块303,用于基于每一所述子图块对应的预测评分,确定所述待分析医疗图像对应的分类结果。

在本发明实施例中,上述确定模块303可以用于执行上述步骤s103。

可选地,所述确定模块303具体用于:

根据每一所述子图块对应的预测评分进行融合处理,以获得表征所述待分析医疗图像的最终评分;根据所述最终评分,评估所述待分析医疗图像的所述分类结果。

可选地,所述电子设备100内预先存储一初始模型,所述电子设备100与tcga服务器200通信连接,所述装置还包括:获取模块304和训练模块305。

获取模块304,用于从所述tcga服务器200获取样本病理图像数据。

在本发明实施例中,上述获取模块304可以用于执行上述步骤s201。

训练模块305,用于基于所述样本病理图像数据对所述初始模型进行训练,以获得所述乳腺数据分析模型。

在本发明实施例中,上述训练模块305可以用于执行上述步骤s202。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

综上所述,本发明提供的一种数据处理方法、装置及电子设备。其中,上述数据处理方法及装置应用于电子设备,所述电子设备包括乳腺数据分析模型,所述方法包括:将待分析医疗图像划分为多个子图块;利用所述乳腺数据分析模型对每一所述子图块进行分类处理,以获取对应的预测评分;基于每一所述子图块对应的预测评分,确定所述待分析医疗图像对应的分类结果。通过先将待分析医疗图像划分为子图块,便于乳腺数据分析模型进行特征提取,再根据特征提取结果分析出待分析医疗图像对应的分类结果,将基于医疗图像水平的乳腺分析问题转化为基于子图块水平的乳腺分析问题,提高了识别的准确性,更加适于乳腺类医疗图像数据的分析,便于为专业医护人员提供可靠的参考数据,减轻专业医护人员的工作负担,辅助提高乳腺癌早期诊断准确率。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1