本发明涉及一种多病原体阳性率分析方法及装置,属于数据处理领域。
背景技术:
1、tngs(超多重pcr扩增与高通量测序两种技术的结合即为tngs)技术能够对待测样本中几十至上百种已知病原微生物及其毒力和/或耐药基因进行检测,实验室为了增加检测效率使用tngs技术对样本进行多病原体感染检测,如检测样本中呼吸道和上呼吸道多种病原体感染。
2、实验室在进行多病原体检测时,为追踪实验室检测结果的稳定性,需要对相同样本类型的同一种病原体的阳性率进行追踪,因此,需要定期对样本检测数据进行多病原体阳性率分析。
3、但是,现有的多病原体阳性率分析方法,需要对样本检测数据中的每种样本类型进行多病原体阳性率分析,由于样本检测数据中样本类型繁杂,导致多病原体阳性率分析的效率较低。
技术实现思路
1、本发明提供一种多病原体阳性率分析方法、装置、电子设备及存储介质,其主要目的在于提高了多病原体阳性率分析的效率。
2、为实现上述目的,本发明提供的一种多病原体阳性率分析方法,包括:
3、获取预设数据源中每个样本检测数据的检测时间;
4、基于当前时间及预设评估周期构建评估时间区间,并将包含在所述评估时间区间内的检测时间确定为目标检测时间;
5、筛选所述预设数据源中所述目标检测时间所属的样本检测数据,得到初始样本检测数据集;
6、基于预设的归一化样本类型集对所述初始样本检测数据集中的初始样本检测数据进行样本类型归一化,得到目标样本检测数据集;
7、利用所述归一化样本类型集,对所述目标样本检测数据集的目标样本检测数据,进行病原体检测结果筛选计算,得到所述归一化样本类型集中每种归一化样本类型的阴性样本数量;
8、获取至少一种待分析病原体,基于所述待分析病原体及所述归一化样本类型,对所述目标样本检测数据进行病原体匹配,得到所述归一化样本类型对应的每种待分析病原体的阳性样本数量;
9、基于所述归一化样本类型的阴性样本数量及所述归一化样本类型对应的每种待分析病原体的阳性样本数量,进行病原体阳性率分析,得到所述归一化样本类型对应的每种待分析病原体的阳性率。
10、可选地,所述基于预设的归一化样本类型集对所述初始样本检测数据集中的初始样本检测数据进行样本类型归一化,得到目标样本检测数据集,包括:
11、将所述初始样本检测数据中的样本类型与所述归一化样本类型集中的归一化样本类型进行类型归一化匹配,以得到所述样本类型匹配的归一化样本类型;
12、将所述初始样本检测数据中的样本类型替换为该样本类型匹配的归一化样本类型,得到目标样本检测数据;
13、汇总所有所述目标检测数据,得到目标样本检测数据集。
14、可选地,所述将所述初始样本检测数据中的样本类型与所述归一化样本类型集中的归一化样本类型进行类型归一化匹配,以得到所述样本类型匹配的归一化样本类型,包括:
15、计算所述初始样本检测数据中的样本类型与所述归一化样本类型集中每种归一化样本类型的关联度,得到每种所述归一化样本类型的类型关联度;
16、基于所述类型关联度对所述归一化样本类型进行筛选,得到目标归一化样本类型;
17、将所述目标归一化样本类型确定为与所述样本类型匹配的归一化样本类型。
18、可选地,所述计算所述初始样本检测数据中的样本类型与所述归一化样本类型集中每种归一化样本类型的关联度,得到每种所述归一化样本类型的类型关联度,包括:
19、将所述初始样本检测数据中的样本类型转换为向量,得到样本类型向量;
20、将所述归一化样本类型转换为向量,得到所述归一化样本类型的归一化样本类型向量;
21、计算所述样本类型向量与所述归一化样本类型的归一化样本类型向量的向量相关度,得到所述归一化样本类型的类型相关度。
22、可选地,所述将所述初始样本检测数据中的样本类型转换为向量,得到样本类型向量,包括:
23、对所述样本类型进行分词,得到所述样本类型对应的所有类型分词词语;
24、将所述类型分词词语转换为向量,得到分词词语向量;
25、基于预设的注意力机制网络计算每个所述分词词语向量的向量权重;
26、利用所述向量权重对所述分词词语向量进行加权计算,得到所述样本类型向量。
27、可选地,所述基于预设的注意力机制网络计算每个所述分词词语向量的向量权重,包括:
28、
29、其中,q为所述注意力机制网络的查询向量,n为所述分词词语向量总数量,j为分词词语向量的序号,为序号为j的分词词语向量的转置,αj为序号为j的分词词语向量的向量权重。
30、可选地,所述计算所述样本类型向量与所述归一化样本类型的归一化样本类型向量的向量相关度,得到所述归一化样本类型的类型相关度,包括:
31、
32、其中,m为所述样本类型向量x及所述归一化样本类型的归一化样本类型向量y的向量维度,i为所述归一化样本类型的归一化样本类型向量及所述样本类型向量中元素的序号,xi为所述样本类型向量中序号为i的元素,yi为所述样本类型向量中序号为i的元素,为所述样本类型向量x中所有元素的平均值,为所述归一化样本类型的归一化样本类型向量y中所有元素的平均值,z为所述样本类型向量x及所述归一化样本类型的归一化样本类型向量y的向量相关度,即所述归一化样本类型的类型相关度。
33、可选地,所述将所述初始样本检测数据中的样本类型与所述归一化样本类型集中的归一化样本类型进行类型归一化匹配,以得到所述样本类型匹配的归一化样本类型,包括:
34、获取所述归一化样本类型对应的样本类型信息;
35、若所述归一化样本类型对应的样本类型信息为空,则将该归一化样本类型确定为分配样本类型;
36、若所述归一化样本类型对应的样本类型信息不为空,则将该归一化样本类型确定为匹配样本类型;
37、基于所述样本类型信息,判断是否存在与所述初始样本检测数据中的样本类型匹配的匹配样本类型;
38、当存在与所述初始样本检测数据中的样本类型匹配的匹配样本类型,将与所述初始样本检测数据中的样本类型匹配的匹配样本类型,确定为所述样本类型匹配的归一化样本类型;
39、当不存在与所述初始样本检测数据中的样本类型匹配的匹配样本类型,将所述分配样本类型,确定为与所述初始样本检测数据中的样本类型匹配的归一化样本类型。
40、可选地,所述利用所述归一化样本类型集,对所述目标样本检测数据集的目标样本检测数据,进行病原体检测结果筛选计算,得到所述归一化样本类型集中每种归一化样本类型的阴性样本数量,包括:
41、当所述目标样本检测数据中包含的病原体检测结果为空,则所述目标样本检测数据为阴性检测数据;
42、计算样本类型为所述归一化样本类型的阴性检测数据的数量,得到该归一化样本类型的阴性样本数量。
43、为了解决上述问题,本发明还提供一种多病原体阳性率分析装置,所述装置包括:
44、数据筛选模块,用于获取预设数据源中每个样本检测数据的检测时间;基于当前时间及预设评估周期构建评估时间区间,并将包含在所述评估时间区间内的检测时间确定为目标检测时间;筛选所述预设数据源中所述目标检测时间所属的样本检测数据,得到初始样本检测数据集;
45、样本类型归一化模块,用于基于预设的归一化样本类型集对所述初始样本检测数据集中的初始样本检测数据进行样本类型归一化,得到目标样本检测数据集;
46、阳性率分析计算模块,用于利用所述归一化样本类型集,对所述目标样本检测数据集的目标样本检测数据,进行病原体检测结果筛选计算,得到所述归一化样本类型集中每种归一化样本类型的阴性样本数量;获取至少一种待分析病原体,基于所述待分析病原体及所述归一化样本类型,对所述目标样本检测数据进行病原体匹配,得到所述归一化样本类型对应的每种待分析病原体的阳性样本数量;基于所述归一化样本类型的阴性样本数量及所述归一化样本类型对应的每种待分析病原体的阳性样本数量,进行病原体阳性率分析,得到所述归一化样本类型对应的每种待分析病原体的阳性率。
47、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
48、至少一种处理器;以及,
49、与所述至少一个处理器通信连接的存储器;其中,
50、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现上述所述的多病原体阳性率分析方法。
51、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的多病原体阳性率分析方法。
52、相比于背景技术所述问题,本发明实施例首先基于预设的评估周期进行样本检测数据筛选,得到初始样本检测数据集;基于预设的归一化样本类型集对所述初始样本检测数据集中的初始样本检测数据进行样本类型归一化,得到目标样本检测数据集;利用所述归一化样本类型集,对所述目标样本检测数据集的目标样本检测数据,进行病原体检测结果筛选计算,得到所述归一化样本类型集中每种归一化样本类型的阴性样本数量;获取至少一种待分析病原体,基于所述待分析病原体及所述归一化样本类型,对所述目标样本检测数据进行病原体匹配,得到所述归一化样本类型对应的每种待分析病原体的阳性样本数量;基于所述归一化样本类型的阴性样本数量及所述归一化样本类型对应的每种待分析病原体的阳性样本数量,进行病原体阳性率分析,得到所述归一化样本类型对应的每种待分析病原体的阳性率。本发明实施例通过对初始样本检测数据样本类型归一化,降低了检测数据中样本类型的数量,进而降低了需要进行阳性率计算的样本类型的数量,从而提高了多病原体阳性率分析的效率。因此本发明提出的多病原体阳性率分析方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高了多病原体阳性率分析的效率。