本技术涉及人工智能技术,尤其涉及一种基于人工智能的传染病趋势预测方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术:
1、人工智能(ai,artificial intelligence)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。
2、传染病趋势预测是人工智能领域的重要应用之一,能够预测现实生活中的传染病趋势(例如流感样病例百分比、流感样病例数量),从而基于传染病趋势对未来传染病的暴发进行预警等应用。
3、相关技术中缺乏传染病趋势预测的有效方案,主要依赖于传染病的历史病例数对未来传染病的暴发进行预警。但是,这种方案过于依赖传染病的历史病例数,导致预测出的传染病趋势不准确。
技术实现思路
1、本技术实施例提供一种基于人工智能的传染病趋势预测方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够自动并准确地预测传染病趋势。
2、本技术实施例的技术方案是这样实现的:
3、本技术实施例提供一种基于人工智能的传染病趋势预测方法,包括:
4、获取预测时期的环境特征,并获取所述预测时期针对传染病的搜索数据,其中,所述搜索数据包括针对所述传染病进行搜索的关键词;
5、基于所述搜索数据进行特征提取处理,得到所述预测时期针对所述传染病的搜索特征;
6、对所述预测时期的环境特征以及所述搜索特征进行多源融合处理,得到针对所述传染病的多源融合特征;
7、对针对所述传染病的多源融合特征进行趋势预测处理,得到所述预测时期的传染病趋势。
8、本技术实施例提供一种基于人工智能的传染病趋势预测装置,包括:
9、获取模块,用于获取预测时期的环境特征,并获取所述预测时期针对传染病的搜索数据,其中,所述搜索数据包括针对所述传染病进行搜索的关键词;
10、特征提取模块,用于基于所述搜索数据进行特征提取处理,得到所述预测时期针对所述传染病的搜索特征;
11、融合模块,用于对所述预测时期的环境特征以及所述搜索特征进行多源融合处理,得到针对所述传染病的多源融合特征;
12、预测模块,用于对针对所述传染病的多源融合特征进行趋势预测处理,得到所述预测时期的传染病趋势。
13、上述技术方案中,所述特征提取模块还用于确定所述预测时期针对所述传染病的关键词词库;
14、将所述关键词词库中的关键词与所述搜索数据中的关键词进行匹配处理,得到所述预测时期的搜索关键词;
15、基于所述搜索数据对所述搜索关键词进行统计处理,得到所述搜索关键词的搜索指标;
16、对所述搜索关键词进行特征转换处理,得到所述搜索关键词的语义特征;
17、将所述搜索关键词的语义特征以及所述搜索关键词的搜索指标的集合作为所述预测时期针对所述传染病的搜索特征。
18、上述技术方案中,所述特征提取模块还用于确定所述预测时期的多个候选关键词分别与所述传染病的目标词之间的第一相关性;
19、基于所述第一相关性对所述多个候选关键词进行筛选处理,得到用于更新词库的关键词;
20、基于所述用于更新词库的关键词更新病毒特征词库,得到更新后的病毒特征词库;
21、确定所述更新后的病毒特征词库中的关键词与所述传染病的目标词之间的第二相关性;
22、基于所述第二相关性对所述更新后的病毒特征词库中的关键词进行筛选处理,得到多个目标关键词;
23、基于所述多个目标关键词,构建所述预测时期针对所述传染病的关键词词库。
24、上述技术方案中,所述构建所述预测时期针对所述传染病的关键词词库之前,所述装置还包括:
25、更新模块,用于获取预测时期样本的预测传染病趋势以及预测时期样本的传染病趋势标注;
26、当所述预测传染病趋势与所述传染病趋势标注之间的差异大于差异阈值时,确定将执行构建所述预测时期针对所述传染病的关键词词库的操作。
27、上述技术方案中,所述特征提取模块还用于对所述搜索关键词进行向量映射处理,得到所述搜索关键词的嵌入特征;
28、对所述搜索关键词的嵌入特征进行语义转换处理,得到所述搜索关键词的语义特征。
29、上述技术方案中,所述语义转换是通过全连接神经网络实现的,所述全连接神经网络包括多个级联的全连接层;
30、所述特征提取模块还用于通过所述多个级联的全连接层中的第一个全连接层,对所述搜索关键词的嵌入特征进行语义映射处理;
31、将所述第一个全连接层的映射结果输出到后续级联的全连接层,通过所述后续级联的全连接层继续进行语义映射处理和映射结果输出,直至输出到最后一个全连接层;
32、将所述最后一个全连接层输出的映射结果作为所述搜索关键词的语义特征。
33、上述技术方案中,所述对所述预测时期的环境特征以及所述搜索特征进行多源融合处理之前,所述融合模块还用于对所述预测时期的环境特征进行标准化处理,得到标准后的环境特征;
34、对所述搜索特征中的搜索指数进行标准化处理,得到标准后的搜索特征;
35、对所述标准后的环境特征以及所述标准后的搜索特征进行多源融合处理,得到针对所述传染病的多源融合特征。
36、上述技术方案中,所述融合模块还用于对所述预测时期的环境特征以及所述搜索特征进行拼接处理,得到针对所述传染病的多源融合特征;或者,
37、对所述预测时期的环境特征以及所述搜索特征进行加权求和处理,得到针对所述传染病的多源融合特征;
38、其中,所述环境特征包括以下至少之一:气象特征、空气特征。
39、上述技术方案中,所述预测模块还用于基于多个预测模型对针对所述传染病的多源融合特征进行趋势预测处理,得到每个所述预测模型对应的传染病趋势;
40、基于每个所述预测模型的权重,对每个所述预测模型对应的传染病趋势进行融合处理,得到所述预测时期的传染病趋势。
41、上述技术方案中,所述预测模块还用于对于所述多个预测模型中的任一第j个预测模型,执行以下处理:
42、通过所述第j个预测模型对预测时期样本的多源融合特征进行趋势预测处理,得到所述第j个预测模型对应的预测传染病趋势;
43、基于所述预测时期样本的传染病趋势标注、以及所述第j个预测模型对应的预测传染病趋势,确定所述第j个预测模型的影响系数;
44、基于所述第j个预测模型的影响系数以及所述多个预测模型的影响系数,确定所述第j个预测模型的权重;
45、其中,0<j≤n,n表示所述预测模型的总数量,且j、n为自然数。
46、上述技术方案中,所述预测模块还用于将所述预测时期样本的传染病趋势标注、与所述第j个预测模型对应的预测传染病趋势的第一方差;
47、对所述第一方差进行归一化处理,得到所述第j个预测模型的影响系数;
48、确定常数与所述第j个预测模型的影响系数的第二方差;
49、基于所述多个预测模型的影响系数对所述第二方差进行归一化处理,得到所述第j个预测模型的权重。
50、上述技术方案中,所述传染病趋势预测方法是通过神经网络模型实现的,所述装置还包括:
51、训练模块,用于通过初始化的所述神经网络模型执行以下处理:
52、基于预测时期样本内针对传染病的搜索数据样本以及所述预测时期的环境特征进行传染病趋势预测处理,得到所述预测时期样本的预测传染病趋势;
53、基于所述预测时期样本的预测传染病趋势以及所述预测时期样本的传染病趋势标注,构建所述神经网络模型的损失函数;
54、基于所述损失函数更新所述神经网络模型的参数,将所述神经网络模型的更新的参数作为训练后的所述神经网络模型的参数。
55、本技术实施例提供一种用于传染病趋势预测的电子设备,所述电子设备包括:
56、存储器,用于存储可执行指令;
57、处理器,用于执行所述存储器中存储的可执行指令时,实现本技术实施例提供的基于人工智能的传染病趋势预测方法。
58、本技术实施例提供一种计算机可读存储介质,存储有可执行指令,用于引起处理器执行时,实现本技术实施例提供的基于人工智能的传染病趋势预测方法。
59、本技术实施例提供一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现本技术实施例提供的基于人工智能的传染病趋势预测方法。
60、本技术实施例具有以下有益效果:
61、通过结合预测时期的环境特征以及预测时期针对传染病的搜索数据进行传染病趋势预测,以充分利用传染病的多源数据,实现准确地传染病趋势预测,对于防控工作具有重要参考价值;通过预测时期的多源数据,预测预测时期的传染病趋势,相对于依赖于传染病的历史病例数进行预测的方案,提高传染病趋势预测的实时性。