一种基于增量特征的训练方法和系统与流程

文档序号:31772954发布日期:2022-10-12 07:37阅读:320来源:国知局
一种基于增量特征的训练方法和系统与流程

1.本技术涉及辅助医疗技术领域,尤其涉及一种基于增量特征的训练方法和系统。


背景技术:

2.神经网络模型是以神经元的数学模型为基础来描述的。通常情况下,神经网络模型可以由网络拓扑和学习规则来表示,因其具有并行分布处理、高度鲁棒性和容错能力、分布存储及学习能力等特点得以广泛应用。通过训练样本对神经网络模型进行训练,神经网络模型经过深度学习后可以得到判断结果,深度学习通过学习样本的内在规律和表示层次,从而可以辅助医疗技术领域。
3.目前,机器学习以已得到广泛应用,如深度学习,尤其可以应用在医学影像诊断领域。例如,可以通过深度学习对眼底图像的病变进行识别。眼底图像识别方式可以通过眼底照相机获取眼底图像后,由眼科医生依靠肉眼观察来作出诊断,工作量太大,这种识别方式不利于大规模地推广。因此,可以通过神经网络模型对眼底图像进行识别与训练,辅助诊断,降低医生工作量。
4.但传统的机器学习是采用批量样本学习的方式,通过一次性输入批量样本获取训练结果。当有新增样本时,就必须对新增样本进行存储,并与之前的已有样本一起从头开始训练。当样本数量的规模不断扩大时,训练时间和训练样本的存储空间也会成增长,导致神经网络模型的学习速度远不及训练样本的更新速度,即,神经网络模型无法根据增量样本进行更新,这样会影响神经网络模型判断的准确性。


技术实现要素:

5.本技术提供一种基于增量特征的训练方法和系统,以解决目前神经网络模型无法根据增量样本进行更新导致神经网络模型判断的准确性低的问题。
6.第一方面,本技术提供一种基于增量特征的训练方法,包括:
7.获取神经网络模型和存量样本;所述存量样本为已有的样本
8.获取新增样本;
9.提取所述新增样本的特征,得到样本增量特征;
10.如果所述样本增量特征存在于所述存量样本中,根据所述样本增量特征训练所述神经网络模型;
11.如果所述样本增量特征不存在于所述存量样本中,基于所述样本增量特征生成类别增量模型。
12.进一步地,获取神经网络模型,包括:
13.获取存量样本;
14.提取所述存量样本的特征,得到存量特征;
15.训练所述存量特征,得到神经网络模型。
16.进一步地,所述的基于增量特征的训练方法,还包括:
17.将更新后的所述神经网络模型和所述类别增量模型组合,生成组合增量神经网络模型;
18.获取所述组合增量神经网络模型的训练结果;
19.获取诊断结果;
20.对比所述训练结果和所述诊断结果,生成纠错样本;
21.提取所述纠错样本的特征,得到纠错特征;
22.在所述纠错特征中增加特征权重;
23.基于增加特征权重后的所述纠错特征训练所述组合增量神经网络模型。
24.进一步地,所述的基于增量特征的训练方法,还包括:
25.将所述诊断结果输入到所述组合增量神经网络模型,以对所述组合增量神经网络模型进行训练;
26.根据训练的结果更新所述组合增量神经网络模型。
27.进一步地,所述的基于增量特征的训练方法,基于所述样本增量特征生成类别增量模型,包括:
28.收集所述样本增量特征;
29.训练所述样本增量特征和所述存量样本,得到类别增量模型。
30.进一步地,将更新后的所述神经网络模型和所述类别增量模型组合,生成组合增量神经网络模型,包括:
31.将更新后的所述神经网络模型和所述类别增量模型执行梯度相加,生成组合增量神经网络模型。
32.进一步地,提取所述新增样本的特征,包括:
33.读取所述新增样本;
34.检测所述新增样本中的特征标识;
35.根据所述特征标识提取所述新增样本的特征。
36.进一步地,所述样本包含特征标签,所述方法还包括:
37.根据所述特征标签识别典型样本;
38.将所述典型样本输入所述组合增量神经网络模型进行训练,生成典型训练结果。
39.进一步地,所述样本包括眼底图像,在所述组合增量神经网络模型中输入所述眼底图像,以得到眼底诊断。
40.第二方面,本技术提供一种基于增量的识别系统,包括:
41.模型获取模块:获取神经网络模型和存量样本;所述存量样本为已有的样本
42.样本获取模块:获取新增样本;
43.提取模块:提取所述新增样本的特征,得到样本增量特征;
44.模型更新模块:如果所述样本增量特征存在于所述存量样本中,根据所述样本增量特征训练所述神经网络模型;
45.模型生成模块:如果所述样本增量特征不存在于所述存量样本中,基于所述样本增量特征生成类别增量模型。
46.由以上技术方案可知,本技术提供一种基于增量特征的训练方法和系统,其中,方法包括:获取神经网络模型,提取新增样本的特征,得到样本增量特征;如果样本增量特征
在存量样本中,根据样本增量特征训练神经网络模型;如果样本增量特征不在存量样本中,基于样本增量特征生成类别增量模型;将更新后的神经网络模型和类别增量模型组合,生成组合增量神经网络模型;将训练样本输入组合增量神经网络模型,以对组合增量神经网络模型进行训练。通过模型训练结果与诊断结果对比,生成纠错样本,通过纠错样本和新增样本更新组合增量神经网络模型,解决了目前神经网络模型无法根据增量样本进行更新导致神经网络模型判断的准确性低的问题。
附图说明
47.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
48.图1为本技术实施例提供的基于增量特征的训练方法流程示意图;
49.图2为本技术实施例提供的神经网络模型更新流程图;
50.图3为本技术实施例提供的基于增量的训练系统结构图。
具体实施方式
51.为使本技术一些实施例的目的和实施方式更加清楚,下面将结合本技术示例性实施例中的附图,对本技术一些实施例示例性实施方式进行清楚、完整地描述,显然,描述的示例性实施例仅是本技术一部分实施例,而不是全部的实施例。
52.需要说明的是,本技术一些实施例中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图限定本技术一些实施例的实施方式。除非另有说明,这些术语应当按照其普通和通常的含义理解。
53.本技术一些实施例中说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”等是用于区别类似或同类的对象或实体,而不必然意味着限定特定的顺序或先后次序,除非另外注明。应该理解这样使用的用语在适当情况下可以互换。
54.术语“包括”和“具有”以及他们的任何变形,意图在于覆盖但不排他的包含,例如,包含了一系列组件的产品或设备不必限于清楚地列出的所有组件,而是可包括没有清楚地列出的或对于这些产品或设备固有的其它组件。
55.术语“模块”是指任何已知或后来开发的硬件、软件、固件、人工智能、模糊逻辑或硬件或/和软件代码的组合,能够执行与该元件相关的功能。
56.为了解决目前神经网络模型无法根据增量样本进行更新导致神经网络模型判断的准确性低的问题,本技术部分实施例提供一种基于增量特征的训练方法。图1为本技术实施例提供的基于增量特征的训练方法流程示意图,如图1所示,该方法包括:获取神经网络模型和存量样本;存量样本为已有的样本获取新增样本;提取新增样本的特征,得到样本增量特征;如果样本增量特征在存量样本中,根据样本增量特征训练神经网络模型;如果样本增量特征不在存量样本中,基于样本增量特征生成类别增量模型。为了便于对本技术的进一步理解,下面结合具体实施例对本技术进行详细说明。例如,神经网络模型可以应用在辅助医疗中,则可以以眼底图像作为样本,如新生儿眼底病变的识别、筛查、诊断等都属于眼
底图像。以下将以眼底图像作为样本为例进行说明,需要说明的是,本技术并不局限于辅助医疗领域的眼底图像,也可以为其他,本技术不作具体限定。
57.其中,存量样本为已有的样本。例如,可以为现有可用的眼底图像样本。通常情况下,会有很多眼底图像,现有的大量的眼底图像即为为存量样本。
58.在获取神经网络模型的步骤中,可以包括如下步骤,获取存量样本;提取存量样本的特征,得到存量特征;训练存量特征,得到神经网络模型。具体实施时,要先获取已有的眼底图像样本,之后对其进行特征提取,得到存量特征。例如,可以利用存量样本进行新生儿眼底图片特征提取,之后对存量特征进行训练,这样就得到了神经网络模型。
59.本技术实施例中的神经网络模型是最初部署的模型,随着样本的更新,模型会随之更新。在本技术实施例中,样本是所有类型的总称,例如,可以包括存量样本,也可以包括新增样本等。
60.在获取神经网络模型后,通过神经网络模型可以对样本进行识别。例如,当在神经网络模型中输入眼底图像时,神经网络模型可以识别出眼底相关信息如病变等。随着神经网络模型的使用,在实际使用场景中,会有新的即新增样本。可以获取新增样本,对新增样本的特征进行特征提取,得到样本增量特征。
61.在一些实施例中,提取新增样本的特征可以包括如下步骤:读取新增样本;
62.检测新增样本中的特征标识;根据特征标识提取新增样本的特征。其中,特征标识用于表征的属性,例如可以包括特点、所属类别等。仍以眼底图像为例,使用场景中会增加新的病例类别,当有新增样本时,可以通过读取新增样本获取到新增样本的类别和特征,从而能够获取到新增样本是哪种类型的。
63.获取到样本增量特征之后,可以根据新增样本的类别判断是否存在于已有的存量样本中。图2为本技术实施例提供的神经网络模型更新流程图,如图2所示,通过对存量样本提取特征和训练已得到神经网络模型,当有新增样本输入时,会进行如下判断,如果样本增量特征在存量样本中,根据样本增量特征训练神经网络模型,即直接通过新增样本这一增量去训练神经网络模型。如果样本增量特征不在存量样本中,则该新增样本可能为一个新的类别,在原有的存量样本中找不到该类别。此时,可以将新增样本定义类一个类别增量特征,即类别增量特征为新增的一个类别,可以基于样本增量特征即新的类别增量特征生成类别增量模型。
64.在一些实施例中,可以通过如下方式基于样本增量特征生成类别增量模型,包括:收集样本增量特征;训练样本增量特征和存量样本,得到类别增量模型。新增样本经过特征提取后得到样本增量特征,在本技术实施例中,可以不断的收集样本增量特征,同时,为了使类别增量模型训练的更准确,可以不断或定期的通过样本增量特征对类别增量模型训练,以使类别增量模型预测的结果更准确。
65.也就是说,在本技术实施例中,新增样本有两种类型,对于已存在于存量样本中的直接参与神经网络模型的更新,对于不存在于存量样本中的,可以直接生成一个新的类别增量模型。如果用新增的类别增量特征输入到神经网络模型中对模型直接训练,可能会破坏神经网络模型原有的结构,因此,本技术针对不存在于存量样本中的新增样本建立一个类别增量模型,以保护神经网络模型结构不被破坏,同时,将类别增量模型与申请网络模型组合,可以涵盖所有样本的类别。
66.在一些实施例中,样本包含特征标签。特征标签可以为特征比较明显的样本,例如,特征比较明显的眼底图像样本。可以根据特征标签识别典型样本,之后将典型样本输入到组合增量神经网络模型进行训练,生成典型训练结果。这样,针对比较明显的病变,可以快速的根据典型训练结果进行定位,提高效率的同时也使结果更具有针对性。
67.在对神经网络模型更新后,可以将更新后的神经网络模型和类别增量模型组合,生成组合增量神经网络模型。例如,可以将更新后的神经网络模型和类别增量模型执行梯度相加,以生成组合增量神经网络模型。生成组合增量神经网络模型后,可以将训练样本输入组合增量神经网络模型,以对组合增量神经网络模型进行训练。例如,可以将眼底图像输入到组合增量神经网络模型中,因为组合增量神经网络模型是由更新后的神经网络模型和类别增量模型组合而成的,这样,组合增量神经网络模型可以包括更多的内容,就可以得到更准确的眼底诊断。
68.为了提高组合增量神经网络模型训练的准确度,结合图1与图2,本技术还可以将模型训练结果与诊断结果进行对比,并通过对比结果再次训练模型。具体可以包括如下步骤:将更新后的神经网络模型和类别增量模型组合,生成组合增量神经网络模型;获取组合增量神经网络模型的训练结果;获取诊断结果;对比训练结果和诊断结果,生成纠错样本;提取纠错样本的特征,得到纠错特征;在纠错特征中增加特征权重;基于增加特征权重后的纠错特征训练组合增量神经网络模型。在实际场景中,在组合增量神经网络模型中输入训练样本之后,组合增量神经网络模型可以预测训练样本数据的训练结果,医疗系统中也会有诊断结果,在一些实施例中,为了避免模型训练的结果有误,可以对比训练结果和诊断结果,如果对样本的训练结果存在错误,会生成纠错样本。纠错样本中可以记载训练结果出现错误的。之后,提取纠错样本的特征,得到纠错特征。为了表征该特征在训练过程中存在错误,可以在在纠错特征中增加特征权重,以此为依据可以对错误的情况进行调整,尽量保证之后不会再错。同时,为了提高模型训练的准确度、消除错误因素,可以基于增加特征权重后的纠错特征训练组合增量神经网络模型。
69.可以理解的是,初次使用模型训练时使用的是神经网络模型,即通过神经网络模型训练样本得到训练结果,随着样本的更新,神经网络模型也会更新,当有新的类别增量特征时,还会生成类别增量模型。所以,为了提高模型训练的准确度,之后用于训练样本的模型可以选择组合增量神经网络模型。也就是说,本技术实施例中的神经网络模型、类别增量模型和组合增量神经网络模型是可以根据训练样本进行自动更新的,而且可以根据新增样本进行增量更新,在模型的使用过程中可以对模型不断更新、优化。
70.基于增加特征权重后的纠错特征训练组合增量神经网络模型后,为了使组合增量神经网络模型涵盖更多的内容以供后续训练,在一些实施例中,还可以将诊断结果输入到组合增量神经网络模型,例如,可以将对眼底的诊断结果和相关情况输入到模型中,以对组合增量神经网络模型进行训练;根据训练的结果更新组合增量神经网络模型。这样,就可以使组合增量神经网络模型在保留原有学习过的知识的情况下,从诊断结果中学习到新的知识,使组合增量神经网络模型得到优化,以提升模型训练的准确度,更好的辅助医疗诊断。
71.由以上内容可知,本技术提供了一种基于增量特征的训练方法,包括获取神经网络模型,提取新增样本的特征,得到样本增量特征;如果样本增量特征在存量样本中,根据样本增量特征训练神经网络模型;如果样本增量特征不在存量样本中,基于样本增量特征
生成类别增量模型;将更新后的神经网络模型和类别增量模型组合,生成组合增量神经网络模型;将训练样本输入组合增量神经网络模型,以对组合增量神经网络模型进行训练。通过模型训练结果与诊断结果对比,生成纠错样本,通过纠错样本和新增样本更新组合增量神经网络模型,解决了目前神经网络模型无法根据增量样本进行更新导致神经网络模型判断的准确性低的问题。
72.基于上述实施例,在本技术的另一些实施例中,还提供一种基于增量的识别系统。
73.图3为本技术实施例提供的基于增量的训练系统结构图,如图3所示,该系统包括:
74.模型获取模块:获取神经网络模型和存量样本;存量样本为已有的样本
75.样本获取模块:获取新增样本;
76.提取模块:提取新增样本的特征,得到样本增量特征;
77.模型更新模块:如果样本增量特征在存量样本中,根据样本增量特征训练神经网络模型;
78.模型生成模块:如果样本增量特征不在存量样本中,基于样本增量特征生成类别增量模型。
79.本技术一些实施例提供的实施例之间的相似部分相互参见即可,以上提供的具体实施方式只是本技术一些实施例总的构思下的几个示例,并不构成本技术保护范围的限定。对于本领域的技术人员而言,在不付出创造性劳动的前提下依据本技术方案所扩展出的任何其他实施方式都属于本技术的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1