甲状腺结节分析方法、装置、计算机设备及可读存储介质与流程

文档序号:17796441发布日期:2019-05-31 20:48阅读:158来源:国知局
甲状腺结节分析方法、装置、计算机设备及可读存储介质与流程

本发明涉及计算机领域,特别是涉及一种甲状腺结节分析方法、装置、计算机设备及可读存储介质。



背景技术:

甲状腺是颈部的内分泌腺,由两个由峡部连接的叶片组成,甲状腺能够分泌甲状腺激素,主要影响代谢率和蛋白质合成,甲状腺也能够产生降钙素激素,在钙稳态中起着重要的作用。

而现有技术中对甲状腺疾病的诊断,由于缺乏功能完善的甲状腺检测装置,导致诊断过程十分费时费力,通常需要经验丰富的医生去判断,准确性受机器设备及经验影响较大。

可见,现有技术中对甲状腺疾病的诊断方法还存在着费时费力,诊断结果不够准确的技术问题。



技术实现要素:

本发明实施例提供一种甲状腺结节分析方法,旨在解决上述背景技术中提到的现有技术对甲状腺疾病的诊断中还存在的过程费时费力、结果不够准确的技术问题。

本发明实施例提供一种甲状腺结节分析方法,所述方法包括:

接收用户输入的甲状腺结节分析参数,所述甲状腺结节分析参数包括用户基本信息以及甲状腺基本信息,所述甲状腺基本信息包括甲状腺回声、内部成分、纵横比、钙化、实时组织弹性成像以及颈部淋巴结状态等;

根据所述甲状腺结节分析参数以及训练生成的甲状腺结节分析模型确定用户甲状腺结节恶性风险并输出,所述训练生成的甲状腺结节分析模型是基于随机森林算法或者基于神经网络算法训练生成。

本发明实施例还提供一种甲状腺结节分析装置,包括:

甲状腺结节分析参数接收单元,用于接收用户输入的甲状腺结节分析参数,所述甲状腺结节分析参数包括用户基本信息以及甲状腺基本信息,所述甲状腺基本信息包括甲状腺回声、内部成分、纵横比、钙化、实时组织弹性成像以及颈部淋巴结状态等;

甲状腺结节恶性风险输出单元,用于根据所述甲状腺结节分析参数以及训练生成的甲状腺结节分析模型确定用户甲状腺结节恶性风险并输出,所述训练生成的甲状腺结节分析模型是基于随机森林算法或基于神经网络算法训练生成。

本发明实施例还提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上述所述的甲状腺结节分析方法的步骤。

本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如上述所述的甲状腺结节分析方法的步骤。

本发明实施例提供的甲状腺结节分析方法,通过接收用户输入的甲状腺结节分析参数,所述甲状腺结节分析参数包括用户基本信息以及甲状腺基本信息,并根据接收的甲状腺结节分析参数以及训练生成的甲状腺结节分析模型直接确定用户甲状腺结节恶性风险并输出。本发明实施例提供的甲状腺结节分析方法,直接用户输入相应的信息即可直接输出诊断结果,诊断过程十分方便快捷,并且诊断过程中使用的甲状腺结节分析模型是基于随机森林算法或者基于神经网络算法训练生成,具有较高的稳定性,有效的保证了输出的甲状腺结节风险的准确率。

附图说明

图1为本发明实施例提供的一种甲状腺结节分析方法的步骤流程图;

图1(a)为本发明实施例提供的一种甲状腺结节分析参数输入界面;

图2为本发明实施例提供的一种训练生成基于随机森林的甲状腺结节分析模型的方法的步骤流程图;

图3为本发明另一种实施例提供的训练生成基于随机森林的甲状腺结节分析模型的方法的步骤流程图;

图4为本发明实施例提供的生成甲状腺结节分析决策树的步骤流程图;

图5为本发明实施例提供的一种训练生成基于神经网络算法的甲状腺结节分析模型的方法的步骤流程图;

图6为本发明实施例提供的一种甲状腺结节分析装置的结构示意图;

图7为本发明另一种实施例提供的甲状腺结节分析装置的结构示意图;

图8为本发明另一种实施例提供的随机森林算法训练单元的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例提供的甲状腺结节分析方法,基于大数据与人工智能学习算法,通过采集2064个来自暨南大学第一附属医院的甲状腺病例实验数据作为样本,基于人工智能学习算法训练生成稳定性强、准确率高的甲状腺结节分析模型,使得后续再进行甲状腺结节诊断时,能够根据用户输入的甲状腺结节分析参数以及训练生成的甲状腺结节分析模型直接确定并输入用户的甲状腺结节恶性风险,有效地提高了甲状腺结节诊断的效率以及准确率。

图1为本发明实施例提供的一种甲状腺结节分析方法的步骤流程图,详述如下。

步骤s101,接收用户输入的甲状腺结节分析参数。

在本发明实施例中,所述甲状腺结节分析参数包括用户基本信息以及甲状腺基本信息,所述用户基本信息包括用户性别以及年龄,所述甲状腺基本信息包括甲状腺回声、内部组成、纵横比、钙化、实时组织弹性呈像以及颈部淋巴结信息,结合下述图4的相关内容可知,上述所列出的甲状腺基本信息的经验熵相对较大。

作为本发明的一个优选实施例,为进一步提高甲状腺结节分析方法诊断甲状腺疾病的准确率,所述甲状腺基本信息还包括甲状腺结节大小、边界、形状、彩色多普勒血流信号、甲状腺包膜信息、声晕信息以及既往甲状腺疾病信息,结合下述图4的相关内容可知,上述所列出的甲状腺基本信息的经验熵相对较小。

在本发明实施例中,所述用户可以通过相应的页面直接输入所述甲状腺结节分析参数,对于甲状腺基本信息的选择项已在所述页面展示,例如,一种可行的甲状腺结节分析参数输入界面请参阅图1(a)。

步骤s102,根据所述甲状腺结节分析参数以及训练生成的甲状腺结节分析模型确定用户甲状腺结节恶性风险并输出。

在本发明实施例中,所述训练生成的甲状腺结节分析模型是基于随机森林算法或者基于神经网络算法训练生成。

在本发明实施例中,基于人工智能学习能够迅速对疾病进行精确的诊断。

在本发明实施例中,无论是基于随机森林算法还是基于神经网络算法训练生成甲状腺结节分析模型都需要采集大量的样本实验数据,样本实验数据越丰富,训练生成的甲状腺结节分析模型稳定性越强、准确率也越高。其中,本发明实施例提供的甲状腺结节分析模型中,训练生成甲状腺结节分析模型所使用的样本数据是通过采集的2064个来自暨南大学第一附属医院的甲状腺病例实验数据分析获取的。

在本发明实施例中,所述甲状腺结节分析方法对甲状腺疾病诊断的准确率接近90%。

在本发明实施例中,训练生成基于随机森林的甲状腺结节分析模型的流程示意图请参阅图2~图4及其解释说明。

本发明实施例提供的甲状腺结节分析方法,通过接收用户输入的甲状腺结节分析参数,所述甲状腺结节分析参数包括用户基本信息以及甲状腺基本信息,并根据接收的甲状腺结节分析参数以及训练生成的甲状腺结节分析模型直接确定用户甲状腺结节恶性风险并输出。本发明实施例提供的甲状腺结节分析方法,直接用户输入相应的信息即可直接输出诊断结果,诊断过程十分方便快捷,并且诊断过程中使用的甲状腺结节分析模型是基于随机森林算法或者基于神经网络算法训练生成,具有较高的稳定性,有效的保证了输出的甲状腺结节恶性风险的准确率。

图1(a)为本发明实施例提供的一种甲状腺结节分析参数输入界面。

在本发明实施例中,对于每一种甲状腺结节分析参数,界面已展示相应的选择项,用户直接根据需求点击相应选择项即可。

图2为本发明实施例提供的一种训练生成基于随机森林的甲状腺结节分析模型的方法的步骤流程图,详述如下。

随机森林是指利用多棵决策树对样本进行训练并预测的一种算法,也就是说随机森林算法是一个包含多个决策树的算法。对于每一棵决策树都可以对结果进行一次预测,而随机森林正是通过多个决策树输出,并对输出的结果进行投票,从而有效地解决了单一决策树可能存在的过拟合的问题。

步骤s201,获取多个甲状腺结节分析训练样本以及与所述甲状腺结节分析训练样本对应的甲状腺结节恶性风险。

在本发明实施例中,所述获取的多个甲状腺结节分析训练样本即为前述步骤s102解释说明中提到的通过采集的2064个来自暨南大学第一附属医院的甲状腺病例实验数据分析获取的,进一步的,一般抽取80%用作训练样本,剩余的20%用作测试样本,所述测试样本的用处具体请参阅图3示出的另一种训练生成基于随机森林的甲状腺结节分析模型的方法流程图及其解释说明。

在本发明实施例中,所述获取的甲状腺结节分析训练样本中包括了具体的甲状腺结节分析参数,进一步的,还获取了与每一个训练样本相应的甲状腺结节恶性风险。

步骤s202,根据所述多个甲状腺结节分析训练样本并按照预设的规则生成多个甲状腺结节分析训练样本集合。

作为本发明的一个可行实施例,根据预设的随机抽样的规则抽取预设数量的甲状腺结节分析训练样本作为甲状腺结节分析训练样本集合,重复上述步骤多次,可以生成多个甲状腺结节分析训练样本集合。

作为本发明的一个优选实施例,在使用不同的参数值多次实验调整模型后发现,每次通过随机抽样抽取500个甲状腺结节分析训练样本生成一个甲状腺结节分析训练样本集合,重复上述步骤3次,生成3个甲状腺结节分析训练样本集合训练出来的甲状腺结节分析模型效果最佳。

步骤s203,根据所述第一甲状腺结节分析训练样本集合中的甲状腺结节分析训练样本训练生成第一甲状腺结节分析决策树。

在本发明实施例中,对于每一个甲状腺结节分析训练样本集合都可以确定一棵决策树。

在本发明实施例中,根据甲状腺结节分析训练样本集合确定甲状腺结节分析决策树的步骤流程图请参阅图4及其解释说明。

步骤s204,将多个甲状腺结节分析决策树组合生成基于随机森林算法的甲状腺结节分析模型。

在本发明实施例中,作为一种最简洁的模型,将所述多棵决策树直接组合即可生成基于随机森林算法的甲状腺结节分析模型,即当输入一组输出值时,对于每一棵决策树都有一个输出结果,将出现次数最多的输出结果作为最终输出结果即可。

本发明实施例提供了一种训练生成基于随机森林的甲状腺结节分析模型的方法流程图,通过采集样本数据,并生成多个甲状腺结节分析训练样本集合,对于每一个甲状腺结节分析训练样本集合都可以基于决策树算法确定唯一的决策树,将生成的多棵决策树组合即可生成基于随机森林算法的甲状腺结节分析模型。

图3为本发明另一种实施例提供的训练生成基于随机森林的甲状腺结节分析模型的方法的步骤流程图,详述如下。

在本发明实施例中,考虑到随机森林中各棵决策树的准确率不同,因此可以通过甲状腺结节分析测试样本分别计算各棵决策树的预测准确率,将准确率作为各棵决策树的权重,对于预测准确率较高的决策树,其权重较高,对于预测准确率较低的决策树,权重较低,优化后的训练方法训练得到的甲状腺结节分析模型输出的结果更加准确。

在本发明实施例中,与图2示出的一种训练生成基于随机森林的甲状腺结节分析模型的方法的步骤流程图的不同之处在于,在所述步骤s203根据所述第一甲状腺结节分析训练样本集合中的甲状腺结节分析训练样本训练生成第一甲状腺结节分析决策树后,还包括:

步骤s301,获取多个甲状腺结节分析测试样本以及与所述甲状腺结节分析测试样本对应的甲状腺结节恶性风险。

在本发明实施例中,请参阅前述步骤s201的解释说明,在采集的2064个病例样本中,其中将80%的样本用于训练模型,剩余20%的样本则用于此处的测试。

步骤s302,根据所述多个甲状腺结节分析测试样本以及对应的甲状腺结节恶性风险计算第一甲状腺结节分析决策树的准确率。

在本发明实施例中,将所述多个甲状腺结节分析测试样本输出到第一甲状腺结节分析决策树中可以获取与所述多个甲状腺结节分析测试样本对应的甲状腺结节响应风险,根据与所述多个甲状腺结节分析测试样本对应的响应风险以及实际获取的与所述多个甲状腺结节分析测试样本对应的甲状腺结节恶性风险进行对比即可获取准确率,即响应风险与实际情况相符,则表明所述甲状腺结节分析测试样本预测成功,若响应风险与实际情况不相符,则表明所述甲状腺结节分析测试样本预测失败,根据预测成功的甲状腺结节分析测试样本数量与预测失败的甲状腺结节分析测试样本数量即可计算准确率。

步骤s303,根据所述第一甲状腺结节分析决策树的准确率确定第一甲状腺结节分析决策树的权重。

在本发明实施例,对于准确率较高的甲状腺结节分析决策树,确定的权重相对较高,对于准确率较低的甲状腺结节分析决策树,确定的权重相对较低。

在本发明实施例中,确定的甲状腺结节分析决策树的权重与相应的甲状腺结节分析决策树配合生成甲状腺结节分析模型。

作为本发明的一个可行实施例,直接将第一甲状腺结节分析决策树的准确率作为第一甲状腺结节分析决策树的权重。

作为本发明的另一个可行实施例,根据第一甲状腺结节分析决策树与预设的不同阈值之间的关系,确定第一甲状腺结节分析决策树的权重,例如将准确率高于90%的甲状腺结节分析决策树的权重记为3。

所述步骤s204将多个甲状腺结节分析决策树组合生成甲状腺结节分析模型具体包括:

步骤s304,根据多个甲状腺结节分析决策树以及与所述甲状腺结节分析决策树相应的权重组合生成甲状腺结节分析模型。

在本发明实施例中,当输入一组输出值时,对于每一棵决策树都有一个输出结果,同时考虑每一棵决策树的权重,计算相应的输出结果的比例,将输出结果比例最高的确定为最终输出结果。

本发明实施例提供的另一种训练生成基于随机森林的甲状腺结节分析模型的方法的步骤流程图,利用测试样本对生成的每一棵决策树进行评估,计算决策树的准确率,并基于准确率确定所述决策书的权重,对于准确率较高的决策树,权重越大,进一步有效地提高了最终生成的基于随机森林的甲状腺结节分析模型的稳定性以及输出的准确率。

图4为本发明实施例提供的生成甲状腺结节分析决策树的步骤流程图,详述如下。

在本发明实施例中,提供了基于决策树算法生成甲状腺结节分析决策树的主要步骤流程图,具体请各步骤解释说明中所列出的实施例。

步骤s401,计算第一甲状腺结节分析训练样本集合中各甲状腺结节分析参数的经验熵。

在本发明实施例中,所述甲状腺结节分析决策树中包括多个特征节点,其中每一个特征节点都是选自前述中的甲状腺结节分析参数。

在本发明实施例中,考虑到不同甲状腺结节分析参数对甲状腺结节分析过程的“贡献”不同,即影响因素不同,在此处我们利用经验熵用于表示甲状腺结节分析参数对甲状腺结节分析过程的影响因子,经验熵越大,则影响越大,应当优先考虑选取。

在本发明实施例中,所述经验熵的计算公式如下:

其中,pi、xi、yi均可理解为概率,以15个样本d1~d15为例,输出结果包括两种m和n,其中9个输出为m,6个输出为n,则对于其中的一个特征参数a而言,假设特征参数a取值有三种,包括a1、a2以及a3,且在取值为a1的x1个样本的输出中,有m1个输出为m,n1个输出为n,取值为a2的x2个样本输出中,m2个输出为m,n2个输出为n,在取值为a3的x3个样本中,m3个输出为m,n3个输出为n。

则样本d的经验熵:

对于特征a而言,其相对于样本d的经验熵:

步骤s402,根据所述经验熵将选取多个甲状腺结节分析参数。

步骤s403,根据所述选取的多个甲状腺结节分析参数确定第一甲状腺结节分析决策树。

作为本发明的一种可行实施例,在选取第一个甲状腺结节分析参数后,根据所述甲状腺结节分析参数将所述第一甲状腺结节分析训练样本集合分割为多个甲状腺结节分析训练样本子集合,并对分割后的每一个甲状腺结节分析训练样本子集合计算剩余训练样本集合的经验熵,重复上述步骤,直至剩余甲状腺结节分析参数的经验熵小于预设的阈值。此时,将选取的甲状腺结节分析参数组合即可确定甲状腺结节分析决策树。

作为本发明的一种可行实施例,以x个样本,以及a,b,c,d,e五个特征参数为例,分别计算a,b,c,d,e的经验熵,其中假设b最大,则根据b将x样本划分为集合xb1以及xb2,并继续计算a,c,d,e四个特征参数在集合xb1以及xb2的经验熵,并根据选取的经验熵最大的特征参数继续对集合xb1以及xb2继续划分,直至对于某个集合中,剩余特征参数的经验熵均未超过预设的阈值时,则该集合划分完成,当所有集合划分完成时,此时即可确定相应的决策树。

图5为本发明实施例提供的一种训练生成基于神经网络算法的甲状腺结节分析模型的方法的步骤流程图,详述如下。

在本发明实施例中,与随机森林算法不同,神经网络算法是一种学习能力相对更加优秀的人工智能学习方法,通过神经网络算法训练生成的甲状腺结节分析模型的效果更加优异,但相应的训练的过程耗时更长。

步骤s501,获取多个甲状腺结节分析训练样本以及与所述甲状腺结节分析训练样本对应的甲状腺结节目标风险。

在本发明实施例中,所述获取的甲状腺结节分析训练样本与前述步骤s201相同。

步骤s502,基于神经网络模型建立含有可变参数的初始化甲状腺结节分析模型。

在本发明实施例中,所述甲状腺结节分析模型的公式如下:

r1=σ(t*w1+b1)

在本发明实施例中,所述t为多个甲状腺结节分析训练样本中各甲状腺结节分析参数构成的矩阵向量,w1为第一权重矩阵系数,b1为第一偏倚向量,其中w1与b1为可变参数

作为本发明的一个优选实施例,所述甲状腺结节分析模型包括多层,即将获取的r1作为下一层的t进行输入。

在本发明实施例中,所述σ表示sigmoid函数(s型生长曲线),具体函数表达式为:

步骤s503,根据所述第一甲状腺结节分析训练样本以及所述甲状腺结节分析模型确定与所述第一甲状腺结节分析训练样本对应的甲状腺结节响应风险。

在本发明实施例中,根据第一甲状腺结节分析训练样本中的各甲状腺结节分析参数生成相应的矩阵向量,并将所述矩阵向量作为t输入上述所示出的甲状腺结节分析模型中,可获取最终的输出矩阵向量r,所述r即为甲状腺结节响应风险矩阵向量,其中r中的每一个数值对应一个甲状腺结节分析训练样本的相应结果。

步骤s504,根据与所述第一甲状腺结节分析训练样本对应的甲状腺结节响应风险以及甲状腺结节目标风险确定第一损失值。

在本发明实施例中,假设与所述第一甲状腺结节分析训练样本对应的甲状腺结节目标风险的矩阵向量为r′,甲状腺结节响应风险的矩阵向量为r,其中r,r′矩阵向量中对应位置的数值分别为y和则第一损失值的计算公式:

步骤s505,判断多个甲状腺结节分析训练样本的损失值是否满足预设的条件。

在本发明实施例中,通过损失值即可以判断训练生成的甲状腺结节分析模型是否符合要求。

作为本发明的一个可行实施例,通过判断损失值与预设的阈值的大小关系,确定所述甲状腺结节分析模型是否符合要求,当损失值小于预设的阈值时,表明甲状腺结节分析模型已基本训练完成,当损失值大于预设的阈值时,表明甲状腺结节分析模型尚未训练完成。

步骤s506,基于反向传播算法调整所述甲状腺结节分析模型中的可变参数,并返回至所述步骤s503。

在本发明实施例中,当所述损失值不满足预设的条件时,表明所述甲状腺结节分析模型中并未完善,通过反向传播算法即可根据损失值调整甲状腺结节分析模型中的可变参数,包括权重矩阵系数与偏倚向量。

步骤s507,将当前甲状腺结节分析模型确定为所述基于神经网络算法训练生成的甲状腺结节分析模型。

在本发明实施例中,当所述损失值满足预设的条件时,表明此时甲状腺结节分析模型中已经完善,能够对输入值做出相应输出相应的结果。

本发明实施例提供的训练生成的基于神经网络算法的甲状腺结节分析模型,相比于图2示出的基于随机森林的甲状腺结节分析模型,可以有效提高甲状腺结节分析方法的准确率。

图6为本发明实施例提供的一种甲状腺结节分析装置的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。

在本发明实施例中,所述甲状腺结节分析装置包括甲状腺结节分析参数接收单元601以及甲状腺结节恶性风险输出单元602。

所述甲状腺结节分析参数接收单元601,用于接收用户输入的甲状腺结节分析参数。

在本发明实施例中,所述甲状腺结节分析参数包括用户基本信息以及甲状腺基本信息,所述用户基本信息包括用户性别以及年龄,所述甲状腺基本信息包括甲状腺回声、内部组成、纵横比、钙化、实时组织弹性呈像以及颈部淋巴结信息,结合下述图4的相关内容可知,上述所列出的甲状腺基本信息的经验熵相对较大。

作为本发明的一个优选实施例,为进一步提高甲状腺结节分析方法诊断甲状腺疾病的准确率,所述甲状腺基本信息还包括甲状腺结节大小、边界、形状、彩色多普勒血流信号、甲状腺包膜信息、声晕信息以及既往甲状腺疾病信息,结合下述图4的相关内容可知,上述所列出的甲状腺基本信息的经验熵相对较小。

所述甲状腺结节恶性风险输出单元602,用于根据所述甲状腺结节分析参数以及训练生成的甲状腺结节分析模型确定用户甲状腺结节恶性风险并输出。

在本发明实施例中,所述训练生成的甲状腺结节分析模型是基于随机森林算法或者基于神经网络算法训练生成。

在本发明实施例中,基于人工智能学习能够迅速对疾病进行精确的诊断。

在本发明实施例中,无论是基于随机森林算法还是基于神经网络算法训练生成甲状腺结节分析模型都需要采集大量的样本实验数据,样本实验数据越丰富,训练生成的甲状腺结节分析模型稳定性越强、准确率也越高。其中,本发明实施例提供的甲状腺结节分析模型中,训练生成甲状腺结节分析模型所使用的样本数据是通过采集的2064个来自暨南大学第一附属医院的甲状腺病例实验数据分析获取的。

在本发明实施例中,所述甲状腺结节分析方法对甲状腺疾病诊断的准确率接近90%。

本发明实施例提供的甲状腺结节分析装置,通过接收用户输入的甲状腺结节分析参数,所述甲状腺结节分析参数包括用户基本信息以及甲状腺基本信息,并根据接收的甲状腺结节分析参数以及训练生成的甲状腺结节分析模型直接确定用户甲状腺结节恶性风险并输出。本发明实施例提供的甲状腺结节分析方法,直接用户输入相应的信息即可直接输出诊断结果,诊断过程十分方便快捷,并且诊断过程中使用的甲状腺结节分析模型是基于随机森林算法或者基于神经网络算法训练生成,具有较高的稳定性,有效的保证了输出的甲状腺结节恶性风险的准确率。

图7为本发明另一种实施例提供的甲状腺结节分析装置的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。

在本发明实施例中,与图6示出的一种甲状腺结节分析装置的不同之处在于,所述甲状腺结节分析装置还包括随机森林算法训练单元701,用于训练生成基于随机森林算法的甲状腺结节分析模型,其中所述随机森林算法训练单元701包括训练样本获取模块701a、训练样本集合生成模块701b、甲状腺结节分析决策树生成模块701c以及甲状腺结节分析模型生成模块701d。

所述训练样本获取模块701a,用于获取多个甲状腺结节分析训练样本以及与所述甲状腺结节分析训练样本对应的甲状腺结节恶性风险。

在本发明实施例中,所述获取的多个甲状腺结节分析训练样本即为前述提到的通过采集的2064个来自暨南大学第一附属医院的甲状腺病例实验数据分析获取的,进一步的,一般抽取80%用作训练样本,剩余的20%用作测试样本,所述测试样本的用处具体请参阅图3示出的另一种训练生成基于随机森林的甲状腺结节分析模型的方法流程图及其解释说明。

在本发明实施例中,所述获取的甲状腺结节分析训练样本中包括了具体的甲状腺结节分析参数,进一步的,还获取了与每一个训练样本相应的甲状腺结节恶性风险。

所述训练样本集合生成模块701b,用于根据所述多个甲状腺结节分析训练样本并按照预设的规则生成多个甲状腺结节分析训练样本集合。

作为本发明的一个可行实施例,根据预设的随机抽样的规则抽取预设数量的甲状腺结节分析训练样本作为甲状腺结节分析训练样本集合,重复上述步骤多次,可以生成多个甲状腺结节分析训练样本集合。

作为本发明的一个优选实施例,在使用不同的参数值多次实验调整模型后发现,每次通过随机抽样抽取500个甲状腺结节分析训练样本生成一个甲状腺结节分析训练样本集合,重复上述步骤3次,生成3个甲状腺结节分析训练样本集合训练出来的甲状腺结节分析模型效果最佳。

所述甲状腺结节分析决策树生成模块701c,用于根据所述第一甲状腺结节分析训练样本集合中的甲状腺结节分析训练样本训练生成第一甲状腺结节分析决策树。

在本发明实施例中,对于每一个甲状腺结节分析训练样本集合都可以确定一棵决策树。

在本发明实施例中,根据甲状腺结节分析训练样本集合确定甲状腺结节分析决策树的步骤流程图请参阅图4及其解释说明。

所述甲状腺结节分析模型生成模块701d,将多个甲状腺结节分析决策树组合生成基于随机森林算法的甲状腺结节分析模型。

在本发明实施例中,作为一种最简洁的模型,将所述多棵决策树直接组合即可生成基于随机森林算法的甲状腺结节分析模型,即当输入一组输出值时,对于每一棵决策树都有一个输出结果,将出现次数最多的输出结果作为最终输出结果即可。

图8为本发明另一种实施例提供的随机森林算法训练单元的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。

在本发明实施例中,考虑到随机森林中各棵决策树的准确率不同,因此可以通过甲状腺结节分析测试样本分别计算各棵决策树的预测准确率,将准确率作为各棵决策树的权重,对于预测准确率较高的决策树,其权重较高,对于预测准确率较低的决策树,权重较低,优化后的随机森林算法训练单元训练得到的甲状腺结节分析模型输出的结果更加准确。

在本发明实施例中,与图7示出的随机森林算法训练单元的结构示意图的不同之处在于,还包括测试样本获取模块801、准确率确定模块802以及权重确定模块803,所述甲状腺结节分析模型生成模块701d具体为甲状腺结节分析模型生成模块804。

所述测试样本获取模块801,用于获取多个甲状腺结节分析测试样本以及与所述甲状腺结节分析测试样本对应的甲状腺结节恶性风险。

在本发明实施例中,请参阅前述步骤s201的解释说明,在采集的2064个病例样本中,其中将80%的样本用于训练模型,剩余20%的样本则用于此处的测试。

所述准确率确定模块802,用于根据所述多个甲状腺结节分析测试样本以及对应的甲状腺结节恶性风险计算第一甲状腺结节分析决策树的准确率。

在本发明实施例中,将所述多个甲状腺结节分析测试样本输出到第一甲状腺结节分析决策树中可以获取与所述多个甲状腺结节分析测试样本对应的甲状腺结节响应风险,根据与所述多个甲状腺结节分析测试样本对应的响应风险以及实际获取的与所述多个甲状腺结节分析测试样本对应的甲状腺结节恶性风险进行对比即可获取准确率,即响应风险与实际情况相符,则表明所述甲状腺结节分析测试样本预测成功,若响应风险与实际情况不相符,则表明所述甲状腺结节分析测试样本预测失败,根据预测成功的甲状腺结节分析测试样本数量与预测失败的甲状腺结节分析测试样本数量即可计算准确率。

所述权重确定模块803,用于根据所述第一甲状腺结节分析决策树的准确率确定第一甲状腺结节分析决策树的权重。

在本发明实施例,对于准确率较高的甲状腺结节分析决策树,确定的权重相对较高,对于准确率较低的甲状腺结节分析决策树,确定的权重相对较低。

在本发明实施例中,确定的甲状腺结节分析决策树的权重与相应的甲状腺结节分析决策树配合生成甲状腺结节分析模型。

作为本发明的一个可行实施例,直接将第一甲状腺结节分析决策树的准确率作为第一甲状腺结节分析决策树的权重。

作为本发明的另一个可行实施例,根据第一甲状腺结节分析决策树与预设的不同阈值之间的关系,确定第一甲状腺结节分析决策树的权重,例如将准确率高于90%的甲状腺结节分析决策树的权重记为3。

所述甲状腺结节分析模型生成模块804,用于根据多个甲状腺结节分析决策树以及与所述甲状腺结节分析决策树相应的权重组合生成甲状腺结节分析模型。

在本发明实施例中,当输入一组输出值时,对于每一棵决策树都有一个输出结果,同时考虑每一棵决策树的权重,计算相应的输出结果的比例,将输出结果比例最高的确定为最终输出结果。

本发明实施例提供的另一种随机森林算法训练单元的结构,通过利用测试样本对生成的每一棵决策树进行评估,计算决策树的准确率,并基于准确率确定所述决策书的权重,对于准确率较高的决策树,权重越大,进一步有效地提高了最终生成的基于随机森林的甲状腺结节分析模型的稳定性以及输出的准确率。

本发明实施例提供一种计算机设备,该计算机装置包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上图1至5中任一图示所示出的甲状腺结节分析方法的步骤。

示例性的,计算机程序可以被分割成一个或多个模块,一个或者多个模块被存储在存储器中,并由处理器执行,以完成本发明。一个或多个模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。例如,计算机程序可以被分割成上述各个方法实施例提供的甲状腺结节分析方法的步骤。

本领域技术人员可以理解,上述计算机装置的描述仅仅是示例,并不构成对计算机装置的限定,可以包括比上述描述更多或更少的部件,或者组合某些部件,或者不同的部件,例如可以包括输入输出设备、网络接入设备、总线等。

所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。

所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述计算机装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信号以及软件分发介质等。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1