本公开涉及人工智能,具体而言,涉及一种模型训练方法、感染人数预测方法、计算机可读存储介质以及电子设备。
背景技术:
1、当某一地区发生传染病时,准确地预测传染病的感染人数对于控制传染病具有重要意义。比如通过预测感染人数,便于提前做好疾病预防和医疗救助措施,从而减缓或阻止疾病的传播。
2、需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
1、本公开提供一种模型训练方法、感染人数预测方法、计算机可读存储介质以及电子设备,进而至少在一定程度上克服由于感染人数预测模型的预测性能较差而导致感染人数预测的准确性较低的问题。
2、根据本公开的第一方面,提供一种模型训练方法,包括:
3、获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;
4、根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;
5、利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。
6、在本公开的一种示例性实施例中,获取目标传染病的第一特征数据之前,所述方法还包括:
7、获取所述目标传染病的原始特征数据,所述原始特征数据包括所述目标传染病的多个影响因素和所述感染人数;
8、基于所述多个影响因素和所述感染人数通过启发式搜索方式确定所述多个影响因素集合。
9、在本公开的一种示例性实施例中,所述多个影响因素集合至少包括第一影响因素集合和第二影响因素集合;
10、所述基于所述多个影响因素和所述感染人数通过启发式搜索方式确定所述多个影响因素集合,包括:
11、构造第一空集和第二空集;
12、轮询各所述影响因素,计算各所述影响因素、所述感染人数、所述第一空集和所述第二空集之间的关联性;
13、确定所述关联性满足预设关联条件的目标影响因素,并根据所述目标影响因素更新所述第一空集和所述第二空集,得到所述第一影响因素集合和所述第二影响因素集合。
14、在本公开的一种示例性实施例中,所述根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型,包括:
15、根据各所述影响因素集合和所述感染人数之间的对应关系得到各所述影响因素集合对应的标注数据和非标注数据;
16、根据各所述影响因素集合对应的所述标注数据确定所述标注数据服从的第一高斯分布;
17、根据各所述影响因素集合对应的所述非标注数据确定所述非标注数据服从的第二高斯分布;
18、对所述第一高斯分布和所述第二高斯分布进行联合分布计算,得到各所述感染人数预测模型。
19、在本公开的一种示例性实施例中,所述根据各所述影响因素集合对应的所述标注数据确定所述标注数据服从的第一高斯分布,包括:
20、向量化所述标注数据中的各所述影响因素,得到多个影响因素向量;
21、利用预设的网络模型对任意两个所述影响因素向量进行计算,得到所述标注数据对应的协方差矩阵;
22、根据预设的均值向量和所述协方差矩阵确定所述第一高斯分布。
23、在本公开的一种示例性实施例中,所述利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型,包括:
24、根据所述多个影响因素集合和所述感染人数之间的对应关系得到所述多个影响因素集合对应的标注数据和非标注数据;
25、获取所述标注数据对应的感染人数分布和所述非标注数据对应的方差;
26、根据所述感染人数分布和所述方差构建目标函数;
27、基于所述目标函数,利用梯度下降算法对各所述感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,得到所述非标注数据上方差最小的各所述感染人数预测模型。
28、在本公开的一种示例性实施例中,得到非标注数据上方差最小的各所述感染人数预测模型之后,所述方法还包括:
29、将所述非标注数据输入各所述感染人数预测模型中,得到多个预测值集合;
30、利用各所述预测值集合中出现概率大于预设概率阈值的所述预测值更新各所述感染人数预测模型的训练数据集;
31、利用更新后的所述训练数据集对各所述感染人数预测模型的模型参数进行迭代更新,当满足预设的迭代终止条件时,完成对各所述感染人数预测模型的训练。
32、根据本公开的第二方面,提供一种感染人数预测方法,包括:
33、获取目标传染病的第二特征数据,所述第二特征数据包括目标时间段内所述目标传染病的多个影响因素集合;
34、将所述多个影响因素集合输入训练好的多个感染人数预测模型中,根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数。
35、在本公开的一种示例性实施例中,所述将所述多个影响因素集合输入训练好的多个感染人数预测模型中,根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数,包括:
36、将所述多个影响因素集合输入训练好的各所述感染人数预测模型中,得到所述多个影响因素集合对应的感染人数分布的多个均值参数;
37、对各所述均值参数进行加权求和得到所述目标时间段内的感染人数。
38、在本公开的一种示例性实施例中,确定所述目标时间段内的感染人数之后,所述方法还包括:
39、将所述目标时间段内的感染人数的预测结果输出至终端设备。
40、根据本公开的第三方面,提供一种模型训练装置,包括:
41、数据获取模块,用于获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;
42、模型构建模块,用于根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;
43、模型训练模块,用于利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。
44、根据本公开的第四方面,提供一种感染人数预测装置,包括:
45、数据获取模块,用于获取目标传染病的第二特征数据,所述第二特征数据包括目标时间段内所述目标传染病的多个影响因素集合;
46、人数预测模块,用于将所述多个影响因素集合输入训练好的多个感染人数预测模型中,根据各所述感染人数预测模型的输出结果确定所述目标时间段内的感染人数。
47、根据本公开的第五方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理单元执行时实现上述任意一项所述的方法。
48、根据本公开的第六方面,提供一种电子设备,包括:处理单元;显示单元;以及存储单元,用于存储所述处理单元的可执行指令;其中,所述处理单元配置为经由执行所述可执行指令来执行上述任意一项所述的方法;所述显示单元用于显示执行上述任意一项所述的方法后生成的密文。
49、本公开示例性实施例可以具有以下部分或全部有益效果:
50、在本公开示例实施方式所提供的模型训练方法中,通过获取目标传染病的第一特征数据,所述第一特征数据包括所述目标传染病的多个影响因素集合和感染人数;根据各所述影响因素集合和所述感染人数构建与各所述影响因素集合对应的感染人数预测模型;利用所述多个影响因素集合和所述感染人数对各所述感染人数预测模型进行训练,得到非标注数据上方差最小的各所述感染人数预测模型。本公开通过未标注数据来训练和选择方差最小的感染人数预测模型,可以减少训练模型所需标注数据量,提高模型的泛化能力,从而提高模型的预测性能。进一步的,使用训练好的各个感染人数预测模型预测传染病的感染人数时,可以提升感染人数预测的准确性。
51、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。