基于联合学习框架的疾病预测模型建立方法和装置与流程

文档序号:24974993发布日期:2021-05-07 22:47阅读:104来源:国知局
基于联合学习框架的疾病预测模型建立方法和装置与流程

本发明属于人工智能技术领域,尤其涉及一种基于联合学习框架的疾病预测模型建立方法和装置。



背景技术:

人工智能医疗的发展越来越受到大家的重视,但是健康领域存在其特有的问题。考虑到健康数据的私密性和非联合性,在实际中,同一个患者其医疗数据存在于体检机构、专科医院、社区医院等不用得地方,每个医院侧重的检测的点也不同。因此,各个医院或其他医疗结构利用机器学习算法对自身拥有的患者数据进行训练,所得到的智能医疗模型的质量并不高,且往往训练的效率也不高。



技术实现要素:

有鉴于此,本发明实施例提供了一种基于联合学习框架的疾病预测模型建立方法和装置,以解决现有各个医院或医疗结构无法利用自身持有的数据来训练建立满足应用要求的目标模型的问题。

本发明的第一方面,提供了一种基于联合学习框架的疾病预测模型建立方法,其包括:确定拥有患者不同维度的健康特征数据的数据集合为联合学习参与方,对多个所述参与方建立联合学习架构;基于所述联合学习架构进行模型训练,所述模型训练包括利用自适应遗传算法确定所述模型的初始化权值和阈值的最优路径;根据所述模型训练的结果,建立用于疾病预测的目标模型。

在一些可选实施方案中,所述对多个所述参与方建立联合学习架构,包括:对多个所述参与方建立横向联合学习架构,其中,所述参与方的数据集合中相同健康数据特征的重叠程度满足预设值。

在一些可选实施方案中,所述基于所述联合学习架构进行模型训练包括:基于所述联合学习架构对极限学习机进行联合训练。

在一些可选实施方案中,所述基于所述联合学习架构进行模型训练,包括:所述参与方各自从所述联合学习架构的服务器下载最新的模型;每个所述参与方利用数据集合中患者不同维度的健康特征数据训练模型,并将训练后的模型参数加密上传给服务器,用于使所述服务器聚各参与方的模型参数更新模型;所述服务器返回更新后的模型给各所述参与方;所述参与方更新各自的模型。

在一些可选实施方案中,所述每个所述参与方利用数据集合中患者不同维度的健康特征数据训练模型,包括:随机初始化隐层神经元函数;计算求隐层节点的输出矩阵;计算隐层到输出层的输出权值;根据所述矩阵和权值,计算预测值和误差值。

在一些可选实施方案中,所述模型训练包括利用自适应遗传算法确定所述模型的初始化权值和阈值的最优路径,包括:所述对极限学习机进行联合训练包括:各参与方利用自适应遗传算法确定所述极限学习机的初始化权值和阈值的最优路径后,利用自身拥有的数据集合进行联合训练。

在一些可选实施方案中,所述各参与方利用自适应遗传算法确定所述极限学习机的初始化权值和阈值的最优路径后,利用自身拥有的数据集合进行联合训练,包括:生成初始核函数参数和惩罚因子等参数,并设置种群大小以及迭代次数,种群中每个个体均为参数编码形式,且随机生成个体的初始值;利用得到的参数赋值给极限学习机进行预测,根据预测结果计算各个染色体的适应度值;在获得个体适应度值之后,根据所获得的适应度值,计算种群个体的选择概率,并以个体选择概率选择个体;计算个体染色体交叉概率;计算个体染色体变异概率;判断是否达到终止条件,若小于最大迭代次数或误差没有达到某个阈值,则循环返回利用得到的参数赋值给极限学习机进行预测,根据预测结果计算各个染色体的适应度值,否则,利用数据集合对极限学习机预测模型进行训练。

本发明的第二方面,提供了一种基于联合学习框架的疾病预测模型建立装置,其包括:联合学习建立模块,用于确定拥有患者不同维度的健康特征数据的数据集合为联合学习参与方,对多个所述参与方建立联合学习架构;联合学习训练模块,用于基于所述联合学习架构进行模型训练,所述模型训练包括利用自适应遗传算法确定所述模型的初始化权值和阈值的最优路径;预测模型建立模块,用于根据所述模型训练的结果,建立用于疾病预测的目标模型。

本发明的第三方面,提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面中任一项方案所述方法的步骤。

本发明的第四方面,提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面中任一项方案所述方法的步骤。

本发明实施例与现有技术相比存在的有益效果是:本发明通过联合学习架构来联合更多的患者不同维度的健康特征数据,从而提高模型训练的样本数量;同时,还在模型训练过程中利用自适应遗传算法来优化模型的最优路径,使预测输出的输出值和期望值误差最小,从而避免模型训练陷入局部最优解的问题。最后训练得到的模型相比于单个机构利用自身数据训练的模型,在模型训练效率和模型质量上都有显著的提高。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1是本发明在实施例一提供的基于联合学习框架的疾病预测模型建立方法的流程图;

图2是本发明在实施例二中提供的基于联合学习框架的疾病预测模型建立装置的结构示意图;

图3是可以应用本发明基于联合学习框架的疾病预测模型建立方法和装置的终端设备。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

实施例一

见图1,为本发明在实施例一提供的基于联合学习框架的疾病预测模型建立方法的流程图,结合图1所示,该基于联合学习框架的疾病预测模型建立方法,包括如下步骤:

s01,确定拥有患者不同维度的健康特征数据的数据集合为联合学习参与方,对多个所述参与方建立联合学习架构;

s02,基于所述联合学习架构进行模型训练,所述模型训练包括利用自适应遗传算法确定所述模型的初始化权值和阈值的最优路径;

s03,根据所述模型训练的结果,建立用于疾病预测的目标模型。

上述方法本发明通过联合学习架构来联合更多的患者不同维度的健康特征数据,从而提高模型训练的样本数量;同时,还在模型训练过程中利用自适应遗传算法来优化模型的最优路径,使预测输出的输出值和期望值误差最小,从而避免模型训练陷入局部最优解的问题。最后训练得到的模型相比于单个机构利用自身数据训练的模型,在模型训练效率和模型质量上都有显著的提高。

步骤s01中,由于不同的医院或医疗机构,其拥有的患者不同维度的特征,在同一地区下,往往用户重叠度较高。因此,在一个示例中,步骤s01中对多个所述参与方建立联合学习架构,可以包括:对多个所述参与方建立横向联合学习架构,其中,所述参与方的数据集合中相同健康数据特征的重叠程度满足预设值。具体的,所述预设值包括不同参与方的患者不同维度的健康特征数据中用户的重叠数量。

步骤s02中,在联合学习架构下,利用患者不同维度的健康特征数据进行训练的模型,可以包括极限学习机等任一种机器学习模型。例如,在一个示例二中,所述基于所述联合学习架构进行模型训练,包括:基于所述联合学习架构对极限学习机进行联合训练。

进一步的,在一个示例三中,当采用极限学习机算法来进行训练时,步骤s02中所述模型训练包括利用自适应遗传算法确定所述模型的初始化权值和阈值的最优路径,则具体包括:所述对极限学习机进行联合训练包括:各参与方利用自适应遗传算法确定所述极限学习机的初始化权值和阈值的最优路径后,利用自身拥有的数据集合进行联合训练。

具体的,紧接上述例子来说,所述基于所述联合学习架构进行模型训练的具体过程包括步骤:

s201,所述参与方各自从所述联合学习架构的服务器下载最新的模型;

s202,每个所述参与方利用数据集合中患者不同维度的健康特征数据训练模型,并将训练后的模型参数加密上传给服务器,用于使所述服务器聚各参与方的模型参数更新模型;

s203,所述服务器返回更新后的模型给各所述参与方;

s204,所述参与方更新各自的模型。

其中,所述服务器是联合学习架构中的联合方,实际应用中,通过参与方与联合方迭代训练来得到想要的目标模型。即循环所述步骤s202-s204至模型满足收敛条件为止。

其中,步骤s202中,每个所述参与方利用数据集合中患者不同维度的健康特征数据训练模型,具体包括:各参与方在本地将患者不同维度的健康特征数据处理为样本数据,然后利用该样本数据对极限学习机进行训练,最后根据训练的结构得到目标模型。

示例性的,所述极限学习机进行训练的过程包括:随机初始化隐层神经元函数,即每个神经元的权值和阈值;计算求隐层节点的输出矩阵;计算隐层到输出层的输出权值;根据所述矩阵和权值,计算预测值和误差值。

再具体的,由于极限学习机在获取初始化权值和阈值时是随机的,不能保证网络输出结果和准确率,容易陷入局部最优解。紧接以上示例三来说,可以通过采用自适应遗传算法来找到最优路径。使预测输出的输出值和期望值误差最小。

示例性的,所述各参与方利用自适应遗传算法确定所述极限学习机的初始化权值和阈值的最优路径后,利用自身拥有的数据集合进行联合训练,可以具体包括步骤:

s301,生成初始核函数参数和惩罚因子等参数,并设置种群大小以及迭代次数,种群中每个个体均为参数编码形式,且随机生成个体的初始值;

s302,利用得到的参数赋值给极限学习机进行预测,根据预测结果计算各个染色体的适应度值;

s303,在获得个体适应度值之后,根据所获得的适应度值,计算种群个体的选择概率,并以个体选择概率选择个体;

s304,计算个体染色体交叉概率;

s305,计算个体染色体变异概率;

s306,判断是否达到终止条件,若小于最大迭代次数或误差没有达到某个阈值,则循环跳转至s302,否则,利用数据集合对极限学习机预测模型进行训练。

通过以上步骤s301-s306可以避免模型训练陷入局部最优解的问题。从而使训练得到的模型相比于单个机构利用自身数据训练的模型,在模型训练效率有显著的提高。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

实施例二

在同一发明构思下,见图2,为本发明在实施例二中提供的基于联合学习框架的疾病预测模型建立装置的结构示意图,如图2所示,该基于联合学习框架的疾病预测模型建立装置200包括:联合学习建立模块210,用于确定拥有患者不同维度的健康特征数据的数据集合为联合学习参与方,对多个所述参与方建立联合学习架构;联合学习训练模块220,用于基于所述联合学习架构进行模型训练,所述模型训练包括利用自适应遗传算法确定所述模型的初始化权值和阈值的最优路径;预测模型建立模块230,用于根据所述模型训练的结果,建立用于疾病预测的目标模型。

由于本实施例二与以上实施例一属于同一发明构思,二者具有相同的特定技术特征,因此关于基于联合学习框架的疾病预测模型建立装置的具体技术内容,可以参考以上实施例一,这里不再赘述。

实施例三

见图3,为可以应用本发明基于联合学习框架的疾病预测模型建立方法和装置的终端设备。

如图3所示,所述终端设备300包括:处理器301、存储器302以及存储在所述存储器302中并可在所述处理器301上运行的计算机程序303,例如用于实现疾病预测模型联合学习方法的程序。所述处理器301执行所述计算机程序303时实现上述各个疾病预测模型联合学习方法实施例中的步骤,例如图1所示的步骤s01至s02。或者,所述处理器301执行所述计算机程序303时实现上述各装置实施例中各模块/单元的功能,例如图2所示联合学习模块210和模型参数优化模型220的功能。

示例性的,所述计算机程序303可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器302中,并由所述处理器301执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序303在所述终端设备300中的执行过程。例如,所述计算机程序303可以被分割成联合学习建立模块210、联合学习训练模块220和预测模型建立模块230。

所述终端设备300可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器301、存储器302。本领域技术人员可以理解,图3仅仅是终端设备300的示例,并不构成对终端设备300的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器301可以是中央处理单元(centralprocessingunit,cpu),还可以是其它通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器302可以是所述终端设备300的内部存储单元,例如终端设备300的硬盘或内存。所述存储器302也可以是所述终端设备300的外部存储设备,例如所述终端设备300上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器302还可以既包括所述终端设备300的内部存储单元也包括外部存储设备。所述存储器302用于存储所述计算机程序以及所述终端设备所需的其它程序和数据。所述存储器302还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个疾病预测模型联合学习实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1