本技术实施例涉及人工智能,尤其涉及一种图像检测模型训练方法、图像检测方法及装置。
背景技术:
1、目前,在医疗健康的许多领域,人工智能(artificial intelligence,ai)越来越多地被应用到病理图像诊断中,它通过自动化分析病理图像提供了一种准确、低成本和可扩展的解决方案。ai模型需要大量数据训练才能有优异的表现,特别是数据集更多样化时ai模型的鲁棒性更强。
2、一般的常规做法是收集多个中心(比如医学中心和医院等机构)的数据,根据收集的数据训练ai模型,但是存在数据安全与隐私方面以及数据传输的问题。联邦学习可在一定程度上解决数据安全与隐私以及数据传输的问题,联邦学习可将训练数据和用于训练模型的设备解耦,原始数据保存在客户端,通过客户端与中央服务器合作训练模型。
3、然而,不同客户端使用的训练数据之间存在相当大的异质性,异质性包括数据分布不一致、数据类别不均衡等,因为数据异质性会训练出相对个性化的模型,导致训练出的模型的鲁棒性和泛化能力较低,进而使得模型的检测准确率较低。
技术实现思路
1、本技术实施例提供一种图像检测模型训练方法、图像检测方法及装置,可以增强图像检测模型的泛化能力,提高图像检测模型的鲁棒性和检测准确率。
2、第一方面,本技术实施例提供一种图像检测模型训练方法,包括:
3、在任一次迭代训练过程中,根据服务器发送的全局图像检测模型的参数更新局部图像检测模型的参数;
4、针对训练样本集中的每一训练样本,以所述训练样本中的样本图像的图像特征为所述局部图像检测模型的输入,输出所述样本图像的预测分类标签,并得到所述局部图像检测模型的注意力分布,每一训练样本包括样本图像和所述样本图像的分类标签;
5、根据当前迭代训练过程中的所述样本图像的分类标签、所述样本图像的预测分类标签、所述局部图像检测模型的注意力分布和所述全局图像检测模型的注意力分布,对所述局部图像检测模型的参数进行调整,得到当前迭代训练过程的模型参数,所述全局图像检测模型的注意力分布根据所述全局图像检测模型的参数和所述训练样本集中每一样本图像的图像特征确定;
6、将所述当前迭代训练过程的模型参数发送至所述服务器,以使所述服务器根据接收到的多个客户端发送的所述模型参数更新所述全局图像检测模型的参数;
7、重复所述迭代训练过程,直至达到预设迭代终止条件,得到已训练的全局图像检测模型。
8、第二方面,本技术实施例提供一种图像检测模型训练方法,包括:
9、在任一次迭代训练过程中,获取n个客户端中每个客户端对应的全局图像检测模型的注意力分布,其中,一个客户端对应的所述全局图像检测模型的注意力分布根据所述全局图像检测模型的参数和所述一个客户端当前迭代训练过程使用的训练样本集中每一样本图像的图像特征确定,所述n为正整数;
10、向目标客户端发送所述目标客户端对应的全局图像检测模型的注意力分布,以使所述目标客户端根据当前迭代训练过程中的所述样本图像的分类标签和所述样本图像的预测分类标签,以及所述目标客户端的局部图像检测模型的注意力分布和所述目标客户端对应的全局图像检测模型的注意力分布,对所述目标客户端的局部图像检测模型的参数进行调整,得到当前迭代训练过程的模型参数,所述目标客户端为所述n个客户端中的任一客户端;
11、根据接收到的所述n个客户端发送的所述模型参数更新所述全局图像检测模型的参数,并将所述全局图像检测模型的参数分别发送至所述n个客户端;
12、重复所述迭代训练过程,直至达到迭代终止条件,得到已训练的全局图像检测模型。
13、第三方面,本技术实施例提供一种图像检测方法,包括:
14、获取目标病理图像;
15、将所述目标病理图像输入已训练的全局图像检测模型,输出所述目标病理图像的预测分类信息,所述全局图像检测模型根据第一方面或第二方面任一项所述的方法训练得到。
16、第四方面,本技术实施例提供一种图像检测模型训练装置,包括:
17、更新模块,用于在任一次迭代训练过程中,根据服务器发送的全局图像检测模型的参数更新局部图像检测模型的参数;
18、第一处理模块,用于针对训练样本集中的每一训练样本,以所述训练样本中的样本图像的图像特征为所述局部图像检测模型的输入,输出所述样本图像的预测分类标签,并得到所述局部图像检测模型的注意力分布,每一训练样本包括样本图像和所述样本图像的分类标签;
19、调整模块,用于根据当前迭代训练过程中的所述样本图像的分类标签、所述样本图像的预测分类标签、所述局部图像检测模型的注意力分布和所述全局图像检测模型的注意力分布,对所述局部图像检测模型的参数进行调整,得到当前迭代训练过程的模型参数,所述全局图像检测模型的注意力分布根据所述全局图像检测模型的参数和所述训练样本集中每一样本图像的图像特征确定;
20、发送模块,用于将所述当前迭代训练过程的模型参数发送至所述服务器,以使所述服务器根据接收到的多个客户端发送的所述模型参数更新所述全局图像检测模型的参数;
21、第二处理模块,用于重复所述迭代训练过程,直至达到预设迭代终止条件,得到已训练的全局图像检测模型。
22、第五方面,本技术实施例提供一种图像检测模型训练装置,包括:
23、获取模块,用于在任一次迭代训练过程中,获取n个客户端中每个客户端对应的全局图像检测模型的注意力分布,其中,一个客户端对应的所述全局图像检测模型的注意力分布根据所述全局图像检测模型的参数和所述一个客户端当前迭代训练过程使用的训练样本集中每一样本图像的图像特征确定,所述n为正整数;
24、发送模块,用于向目标客户端发送所述目标客户端对应的全局图像检测模型的注意力分布,以使所述目标客户端根据当前迭代训练过程中的所述样本图像的分类标签和所述样本图像的预测分类标签,以及所述目标客户端的局部图像检测模型的注意力分布和所述目标客户端对应的全局图像检测模型的注意力分布,对所述目标客户端的局部图像检测模型的参数进行调整,得到当前迭代训练过程的模型参数,所述目标客户端为所述n个客户端中的任一客户端;
25、更新模块,用于根据接收到的所述n个客户端发送的所述模型参数更新所述全局图像检测模型的参数,
26、发送模块,用于将所述全局图像检测模型的参数分别发送至所述n个客户端;
27、处理模块,用于重复所述迭代训练过程,直至达到预设迭代终止条件,得到已训练的全局图像检测模型。
28、第六方面,本技术实施例提供一种图像检测装置,包括:
29、获取模块,用于获取目标病理图像;
30、处理模块,用于将所述目标病理图像输入已训练的全局图像检测模型,输出所述目标病理图像的预测分类信息,所述全局图像检测模型根据第一方面或第二方面所述的方法训练得到。
31、第七方面,本技术实施例提供一种图像检测设备,包括:处理器和存储器,该存储器用于存储计算机程序,该处理器用于调用并运行该存储器中存储的计算机程序,以执行第一方面或第二方面或第三方面的方法。
32、第八方面,本技术实施例提供一种计算机可读存储介质,包括指令,当其在计算机程序上运行时,使得所述计算机执行如第一方面或第二方面或第三方面的方法。
33、第九方面,本技术实施例提供一种包含指令的计算机程序产品,当所述指令在计算机上运行时,使得所述计算机执行如第一方面或第二方面或第三方面的方法。
34、综上,在本技术实施例中,通过客户端先根据服务器发送的全局图像检测模型的参数更新局部图像检测模型的参数,根据更新后的局部图像检测模型的参数和训练样本集进行训练,以训练样本中的样本图像的图像特征为局部图像检测模型的输入,输出样本图像的预测分类标签,并得到局部图像检测模型的注意力分布,接着根据当前迭代训练过程中的样本图像的分类标签、样本图像的预测分类标签、局部图像检测模型的注意力分布和全局图像检测模型的注意力分布,对局部图像检测模型的参数进行调整,得到当前迭代训练过程的模型参数,然后将当前迭代训练过程的模型参数发送至服务器,服务器根据接收到的多个客户端发送的模型参数更新全局图像检测模型的参数,重复迭代训练过程,直至达到预设迭代终止条件,得到已训练的全局图像检测模型。在客户端侧调整局部图像检测模型的参数时,不仅根据样本图像的分类标签和样本图像的预测分类标签进行调整,还根据局部图像检测模型的注意力分布和全局图像检测模型的注意力分布进行调整,可使用客户端侧局部图像检测模型的注意力分布和服务器侧的全局图像检测模型的注意力分布之间的对比,来增大客户端的局部图像检测模型学习到的注意力与服务器端全局图像检测模型学习到的注意力之间的一致性,从而增强训练出的图像检测模型的泛化能力,提高图像检测模型的鲁棒性和检测准确率。