一种未知传染病的监测方法、装置、存储介质及电子设备与流程

文档序号:30754236发布日期:2022-07-13 10:06阅读:105来源:国知局
一种未知传染病的监测方法、装置、存储介质及电子设备与流程

1.本发明涉及数据处理的技术领域,尤其涉及一种未知传染病的监测方法、装置、存储介质及电子设备。


背景技术:

2.目前传染病继续成为全球发病死亡主要原因之一,影响公众健康生命、社会经济发展甚至国家安全。传染病早期探测的重点是及时、敏感地发现传染病暴发流行异常信息,并进行现场调查和核实,也是有效监测、预警关键时期。有效监测、预警系统能够全面准确地认识特定传染病暴发流行可能发生的事实条件、驱动因素和传播链,并提出科学有效预防控制策略措施。
3.对于已知传染病的监测预警一直是公卫研究的热点,分析与监测方法也较多,但是对于未知传染病的研究较少。首先,未知传染病的出现具有不确定性,何时何地发生,何种传染病,我们都难以预测。许多新发传染病起病急,会突然在某个区域出现大量的病例,早期发现及诊断较为困难,人群普遍缺乏免疫力,也缺乏特异性防治手段,因而在疾病流行早期传播快,病死率高,因此对于未知传染病的监测与预防非常重要。
4.当前未知传染病的监测,主要是以医生诊断为依据,由于监测方法以人的主观判断为主,导致该方法存在很大的滞后性和不确定性。


技术实现要素:

5.本发明提供一种传染病的监测方法、装置、存储介质及电子设备,以至少解决现有技术中存在的以上技术问题。
6.本发明一方面提供一种未知传染病的监测方法,该方法包括:
7.采用滑动窗口方式采集未知疾病类型用户的病历数据,每条所述病历数据包括用户信息以及多个疾病特征数据;
8.对所述未知疾病类型用户的病历数据进行聚类,得到多个簇,每个簇中包括多个未知疾病类型用户的用户信息和多个疾病特征数据;
9.根据所述多个簇中每一簇的疾病特征数据和用户信息确定候选簇,判断所述候选簇中的未知疾病类型用户在时空上是否存在联系,若是,则确定候选簇中包含的所有疾病特征数据为未知传染病对应的目标监测特征。
10.在一可实施方式中,每个所述滑动窗口的长度相同,相邻的两个滑动窗口的长度有预定时长的重叠,所述预定时长小于所述滑动窗口的长度。
11.在一可实施方式中,所述采用滑动窗口方式采集未知疾病类型用户的病历数据,包括:
12.采用滑动窗口方式采集多个用户的病历数据;
13.过滤已知疾病类型用户的病历数据后,得到未知疾病类型用户的病历数据。
14.在一可实施方式中,所述根据未知疾病类型用户的病历数据进行聚类,得到多个
簇,包括:
15.根据未知疾病类型用户的病历数据构建用户信息和多个疾病特征数据之间的关联关系;
16.根据所述用户信息和疾病特征数据之间的关联关系确定用户之间的相似度,得到用户的相似度矩阵;
17.根据所述用户信息和疾病特征数据之间的关联关系确定疾病特征之间的相似度,得到疾病特征的相似度矩阵;
18.根据所述用户的相似度矩阵和所述疾病特征的相似度矩阵进行聚类,得到多个簇。
19.在一可实施方式中,所述根据所述多个簇中每一簇的疾病特征数据和用户信息确定候选簇,包括:
20.确定用户数量少且疾病特征数据聚集的簇为候选簇。
21.在一可实施方式中,所述根据所述用户信息和多个疾病特征数据之间的关联关系确定用户之间的相似度,包括:
22.确定两个用户对应的疾病特征数据的交集所包含的疾病特征的数量;
23.确定两个用户对应的疾病特征数据的并集所包含的疾病特征的数量;
24.根据所述交集所包含的疾病特征数据的数量和所述并集所包含的疾病特征数据的数量确定用户之间的相似度。
25.在一可实施方式中,所述根据所述用户信息和多个疾病特征之间的关联关系确定疾病特征之间的相似度,包括:
26.确定两个疾病特征数据对应的用户的交集所包含的用户的数量;
27.确定两个疾病特征数据对应的用户的并集所包含的用户的数量;
28.根据所述交集所包含的用户的数量和所述并集所包含的用户的数量确定疾病特征之间的相似度。
29.在一可实施方式中,所述判断所述候选簇中的未知疾病类型用户在时空上是否存在联系,包括:
30.若所述候选簇中的未知疾病类型用户在预设时间与预设空间范围有交集,则确定所述候选簇中的未知疾病类型用户在时空上存在联系。
31.本发明另一方面提供一种未知传染病的监测装置,该装置包括:
32.采集模块,用于采用滑动窗口方式采集未知疾病类型用户的病历数据,每条所述病历数据包括用户信息以及多个疾病特征数据;
33.聚类模块,用于对所述未知疾病类型用户的病历数据进行聚类,得到多个簇,每个簇中包括多个未知疾病类型用户的用户信息和多个疾病特征数据;
34.确定模块,用于根据所述多个簇中每一簇的疾病特征数据和用户信息确定候选簇,判断所述候选簇中的未知疾病类型用户在时空上是否存在联系,若是,则确定所述候选簇中包含的所有疾病特征数据为未知传染病对应的目标监测特征。
35.本发明再一方面提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行本发明所述的监测方法。
36.本发明还一方面提供一种电子设备,包括:
37.处理器;
38.用于存储所述处理器可执行指令的存储器;
39.所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现本发明所述的监测方法。
40.在本发明的上述方案中,本发明通过滑动窗口的方式采集未知疾病类型用户的病历数据,能够避免相似度较高的两个未知疾病类型用户的病历数据在采样时被漏掉,可以提高病历数据采集的准确性;进一步通过对未知疾病类型用户的病历数据进行聚类,得到多个簇,每个簇中包括多个未知疾病类型用户的用户信息和多个疾病特征数据,在用户信息和疾病特征数据两个维度上同时进行聚类操作,最终得到用户信息和疾病特征数据最优的聚类结果;再根据所述多个簇中每一簇的疾病特征数据和用户信息确定候选簇,若候选簇中的未知疾病类型用户在时空上存在联系,则确定候选簇中包含的所有疾病特征为未知传染病对应的目标监测特征。通过确定目标监测特征,能够有效监测未知传染病,降低未知传染病大范围传播的可能性。
附图说明
41.图1示出了本发明实施例提供的一种未知传染病的监测方法的流程示意图;
42.图2示出本发明实施例用户信息和疾病特征之间的关系示意图;
43.图3示出了本发明实施例提供的一种未知传染病的监测装置的结构示意图。
具体实施方式
44.为使本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
45.如图1所示为本发明实施例提供的一种未知传染病的监测方法的流程示意图,该方法包括:
46.步骤s101、采用滑动窗口方式采集未知疾病类型用户的病历数据,每条所述病历数据包括用户信息以及多个疾病特征数据;
47.滑动窗口对应一个时长,例如设置时长长度为7天,每个滑动窗口的时长均相同,相邻的两个滑动窗口的长度有一定时长的重叠,重叠的时长长度小于滑动窗口的时长长度。例如重叠的时长长度为6天,采集起点为2021年10月1日00:00,则第一个滑动窗口为2021年10月1日00:00至2021年10月7日23:59,第二个滑动窗口为2021年10月2日00:00至2021年10月8日23:59,以此类推。通过采用滑动窗口的方式采集未知疾病类型用户的病历数据,能够避免相似度较高的两个未知疾病类型用户的病历数据在采样时被漏掉,可以提高病历数据采集的准确性。因为相邻的滑动窗口有一定时长的重叠,如果相邻的窗口之间没有重叠,假设第一个窗口为2021年10月1日00:00至2021年10月7日23:59分,第二个窗口为2021年10月8日00:00至2021年10月14日23:59分,若用户1在2021年10月7日23:59:59到医院的呼吸科就诊,用户1对应有疾病特征1,疾病特征2,疾病特征3;用户2在2021年10月8日00:00:01到医院呼吸科就诊,用户2也对应有疾病特征1,疾病特征2,疾病特征3,由于用
户1和用户2具有相同的疾病特征,用户1和用户2之间应具有较高的相似度,但是若窗口没有重叠,则在第二次窗口采集时,用户1的病历数据未采集到,用户1和用户2之间的相似度关系被漏掉。因此通过滑动窗口的方式采集病历数据,数据采集的准确率更高。
48.未知疾病类型用户的病历数据可以从医院获取,例如采集医院的呼吸科、发热门诊、急诊、肠道科室、皮肤科等传染病高发的就诊科室的病历数据。每个滑动窗口采集的未知疾病类型用户的病历数据包括一条或多条,每条病历数据包括用户信息以及多个疾病特征数据。其中用户信息为表征用户身份唯一性的信息,例如通过用户id表征用户身份,用户id为用户就诊卡号或者用户身份证号等,本发明对此不做限制。
49.疾病特征数据为与未知疾病相关的特征对应的数据,例如疾病特征包括用户的主诉症状、检验结果、检查结论、治疗后的疗效、用户基础数据等。其中主诉症状包括有无发热、有无咳嗽、有无腹泻、有无食欲不振等症状,根据病例里是否存在这些结论,人工编码或者机器识别确定疾病特征对应的数据,假设用户1存在发热,则用户1对应的发热的数据为1,用户1不存在腹泻,则用户1对应的腹泻的数据为0。检验结果即检验项所对应的检验结果,例如血液检测对应的白细胞计数、红细胞计数、中性粒细胞计数等,若白细胞计数的数值不在正常白细胞计数范围内,则该用户对应的白细胞计数的数据为1,若白细胞计数的数值在正常白细胞计数范围内,则该用户对应的白细胞计数的数据为0。检查结论即医生根据检验项目得到的结论,例如做ct检查时,会有医生的结论文本,数据处理上会整理出结论文本中特定的字段,如结节、斑点、阴影等,若某用户存在结节、斑点、阴影,则该用户对应的ct检查的数据为1,反之为0。治疗后的疗效包括痊愈和未痊愈,未痊愈对应的数据为1,痊愈对应的数据为0。用户的基础数据包括体重、心率、血压等常规数据,例如某用户的体重超重或超轻,则体重对应的数据为1,体重正常,则体重对应的数据为0。
50.由于本发明通过滑动窗口的方式采集未知疾病类型用户的病历数据,相邻的滑动窗口采集的用户信息存在重复,或者一个用户在一个月内多次到访医院,也会产生用户信息重复。例如第一个滑动窗口采集了用户1的病历数据,第二个滑动窗口或其它滑动窗口也采集了用户1的病历数据,若用户1的病历数据被采集了多条,且多条病历数据相同,即用户1对应的疾病特征的值未发生改变,则保留用户1的其中一条病历数据即可;若用户1的多条病历数据不同,则保留日期最近的一条病历数据,例如用户1在2021年10月1日不发热,则发热对应的值为0,用户1在2021年10月5日发热,则发热对应的值为1,由于用户1的病历数据发生了改变,则保留用户1在2021年10月5日的病历数据。
51.通过上述示例,也能够进一步提高数据采集的准确性。因为对于同一用户来说,可能会多次到访医院,每次到访医院产生的病历数据有可能相同,也有可能不同,若是相同的病历数据,则保留其中一条即可;若是不同的病历数据,则保留最近的一次病历数据。假设用户1的第一条病历数据对应的疾病特征是特征1,用户1的第二条病历数据对应的疾病特征是特征1,特征2,特征3;用户3对应的疾病特征也是特征1,特征2,特征3,则用户1和用户3之间具有较高的相似度。假设以用户1的第一条病历数据为准,则用户1和用户3之间的相似度低,以用户1的第二条病历数据为准,用户1和用户3之间具有较高的相似度。因此,当同一用户的多条病历数据不同时,保留该用户最近一次的病历数据。
52.采集的病历数据通过表格记录,每行表示一个用户的多个疾病特征,每列表示一个疾病特征对应的多个用户。假设第一个滑动窗口采集的病历数据包括n个用户,依次编号
为用户1,用户2,...,用户n,采集的所有病历数据中记录了m个疾病特征,依次编号为特征1,特征2,...,特征m,则采集的病历数据的示例可如表1所示:
53.表1
[0054][0055]
其中,表1中的“...”表示省略。
[0056]
步骤s102、对所述未知疾病类型用户的病历数据进行聚类,得到多个簇,每个簇中包括多个未知疾病类型用户的用户信息和多个疾病特征数据。
[0057]
采用协同聚类算法对未知疾病类型用户的病历数据同时进行用户信息和疾病特征数据两个维度的聚类,得到多个簇,每个簇中包括多个未知疾病类型的用户信息和多个疾病特征数据,协同聚类算法可以采用co-clustering算法,例如将表1中病历数据作为co-clustering算法的输入,可以在两个维度上同时进行聚类操作,最终达到在行和列上最优的聚类结果。
[0058]
步骤s103、根据所述多个簇中每一簇的疾病特征数据和用户信息确定候选簇,判断所述候选簇中的未知疾病类型用户在时空上是否存在联系,若是,则确定所述候选簇中包含的所有疾病特征为未知传染病对应的目标监测特征。
[0059]
通过采用协同聚类算法对未知疾病类型用户的病历数据进行聚类,可以得到多个簇,确定用户数量少且疾病特征聚集的簇为候选簇,因为初发的未知传染病不会有大量的用户,且传染病往往具有多个疾病特征,因此从多个簇中选择用户数量少且疾病特征聚集的簇为候选簇;例如设置候选簇中用户数量的阈值为10,疾病特征的阈值为3,从多个簇中确定用户数量不超过10且疾病特征不少于3个的簇为候选簇。若候选簇中的未知疾病类型用户在时空上存在联系,则未知传染病用户所属簇中包含的所有疾病特征确定为未知传染病对应的目标监测特征。监测过程若发现某用户具有目标监测特征,则将该用户作为是有可能感染该未知传染病的用户,需要对其进行隔离,阻断传播链,缩小传染病的传染范围。
[0060]
在本发明的上述方案中,本发明通过滑动窗口的方式采集未知疾病类型用户的病历数据,能够避免相似度较高的两个未知疾病类型用户的病历数据在采样时被漏掉,可以提高病历数据采集的准确性;进一步通过对未知疾病类型用户的病历数据进行聚类,得到多个簇,每个簇中包括多个未知疾病类型用户和多个疾病特征,在用户和疾病特征两个维度上同时进行聚类操作,最终得到用户和疾病特征最优的聚类结果;再从聚类得到的多个
簇中选择候选簇,若候选簇中的未知疾病类型用户在时空上存在联系,则确定候选簇中包含的所有疾病特征确定为未知传染病对应的目标监测特征。通过确定目标监测特征,能够有效监测未知传染病,降低未知传染病大范围传播的可能性。
[0061]
在一个示例中,步骤s101中,所述采用滑动窗口方式采集未知疾病类型用户的病历数据,包括:
[0062]
采用滑动窗口方式采集多个用户的病历数据;
[0063]
过滤已知疾病类型用户的病历数据后,得到未知疾病类型用户的病历数据。
[0064]
例如,采用滑动窗口的方式采集医院的呼吸科、发热门诊、急诊、肠道科室、皮肤科等传染病高发的就诊科室的在一个滑动窗口内的所有病历数据,过滤具有明确已知疾病类型用户对应的病历数据,已知疾病类型中包括已知传染病和已知其它疾病,已知疾病类型用户包括治疗康复和未康复的用户,已知疾病类型可通过病历数据中的病原检测结果判断,例如用户2的病原检测结果为克雷伯杆菌肺炎,不管用户2是否康复,均删除用户2的病历数据。通过过滤已知疾病类型用户的病历数据,可以避免已知疾病类型用户的病历数据对未知传染病检测的干扰。
[0065]
在一个示例中,步骤s102中,对所述未知疾病类型用户的病历数据进行聚类,得到多个簇,包括:
[0066]
根据未知疾病类型用户的病历数据构建用户信息和疾病特征数据之间的关联关系;
[0067]
根据所述用户信息和疾病特征数据之间的关联关系确定用户之间的相似度,得到用户的相似度矩阵;
[0068]
根据所述用户信息和疾病特征数据之间的关联关系确定疾病特征之间的相似度,得到疾病特征的相似度矩阵;
[0069]
根据所述用户的相似度矩阵和所述疾病特征的相似度矩阵进行聚类,得到多个簇。
[0070]
根据每个滑动窗口采集的未知疾病类型用户的病历数据构建用户信息和疾病特征之间的关联关系,若病历数据中记录的该用户的某个疾病特征的值为1,则在该用户和该疾病特征之间连线形成用户和疾病特征的关联关系,如图2所示为用户和疾病特征之间的关系示意图。
[0071]
在一个示例中,所述用户和疾病特征之间的关联关系为二部图,所述二部图的边表征所述用户存在所述疾病特征,二部图为无权二部图。预设时间段内,根据所有未知疾病类型用户的病历数据构建用户和疾病特征之间的二部图。假设用户1存在发热,则用户1和疾病特征“发热”之间连线,用户1不存在饮食不振,则用户1和疾病特征“饮食不振”之间不连线。
[0072]
在一个示例中,所述根据所述用户信息和疾病特征数据之间的关联关系确定用户之间的相似度,包括:
[0073]
确定两个用户对应的疾病特征数据的交集所包含的疾病特征的数量;
[0074]
确定两个用户对应的疾病特征数据的并集所包含的疾病特征的数量;
[0075]
根据所述交集所包含的疾病特征数据的数量和所述并集所包含的疾病特征数据的数量确定用户之间的相似度。
[0076]
假设用户1对应8个疾病特征,用户3对应10个疾病特征,用户1和用户3对应的疾病特征的交集有6个,用户1和用户3对应的疾病特征的并集有12个,则用户1和用户3之间的相似度为6/12=0.5。假设用户数量是n个,则用户的相似度矩阵为n行
×
n列的形式表示。
[0077]
例如用户的相似度矩阵为下表2所示:
[0078] 用户1用户2用户3用户4...用户n用户100.250.50...0.8用户20.2500.250.6...0.5用户30.50.2500.25...0.25用户400.60.250...0.33.....................用户n0.80.50.250.33...0
[0079]
其中表2中的“...”表示省略。
[0080]
在一个示例中,所述根据所述用户信息和疾病特征数据之间的关联关系确定疾病特征数据之间的相似度,包括:
[0081]
确定两个疾病特征数据对应的用户的交集所包含的用户的数量;
[0082]
确定两个疾病特征数据对应的用户的并集所包含的用户的数量;
[0083]
根据所述交集所包含的用户的数量和所述并集所包含的用户的数量确定疾病特征数据之间的相似度。
[0084]
假设存在特征1的用户有20个,存在特征2的用户有30个,特征1和特征2对应的用户的交集有18个,即说明这18个用户同时具备特征1和特征2,特征1和特征2对应的用户的并集有32个,则特征1和特征2之间的相似度为18/32=9/16。假设疾病特征的数量是m个,则疾病特征的相似度矩阵为m行
×
m列的形式表示。
[0085]
将过滤后的病历数据作为协同聚类(co-clustering)算法的输入,得到用户的相似度矩阵和疾病特征的相似度矩阵后,再根据用户的相似度矩阵和疾病特征的相似度矩阵进行聚类,得到聚类结果。根据目标损失函数选择最优的聚类结果,目标损失函数如下所示:
[0086][0087]
其中,a为原始特征矩阵,a’为聚类后,每个聚类簇求平均后的特征矩阵。i和j为矩阵的行、列下标。
[0088]
聚类结果中包括多个簇,同一簇内的用户之间具有较高的相似度,同一簇内的疾病特征之间也具有较高的相似度,且处于同一簇内的用户和疾病特征之间具有对应关系。例如用户1、用户3、用户10、用户15、用户18、用户21、用户25、用户33和特征2、特征10、特征15、特征20处于同一簇内,则说明用户1、用户3、用户10、用户15、用户18、用户21、用户25、用户33均存在特征2、特征10、特征15、特征20。
[0089]
在一个示例中,步骤s103中,从聚类得到的多个簇中选择候选簇,根据聚类结果,可以得到多个簇,确定用户数量少且疾病特征聚集的簇为候选簇,因为初发的未知传染病不会有大量的用户,因此候选簇中的用户数量少;未知传染病在初期被发现时,也是由于多
个用户存在相同的多个疾病特征,且基于经验判断传染病往往具有多个疾病特征,因此候选簇中的疾病特征聚集。若候候选簇中的未知疾病类型用户在时空上存在联系,则确定候选簇中的未知疾病类型用户为该未知传染病用户。
[0090]
在一个示例中,所述判断所述候选簇中的未知疾病类型用户在时空上是否存在联系,包括:
[0091]
若所述候选簇中的未知疾病类型用户在预设时间与预设空间范围有交集,则确定所述候选簇中的未知疾病类型用户在时空上存在联系。
[0092]
判断用户在预设时间与预设空间范围有交集,可以根据预设条件进行判断,预设条件设置有多个,若所述候选簇中的未知疾病类型用户满足至少一个预设条件,则确定所述候选簇中的未知疾病类型用户为所述未知传染病用户。例如预设条件可包括:
[0093]
条件1、候选簇中的未知疾病类型用户属于同一家庭;
[0094]
条件2、候选簇中的未知疾病类型用户之间是同事;
[0095]
条件3、候选簇中的未知疾病类型用户之间住在同一小区;
[0096]
条件4、候选簇中的未知疾病类型用户在特定时间段出入过相同的场所,例如在某一天均在某餐厅就餐;
[0097]
预设条件不仅包括以上四种,条件1至条件4均为示例性条件。若候选簇中的未知疾病类型用户之间满足上述任意一种或多种预设条件,则确定候选簇中的未知疾病类型用户为未知传染病对应的用户,即上述示例中的用户1、用户3、用户10、用户15、用户18、用户21、用户25、用户33感染某种未知传染病。
[0098]
若候选簇中的未知疾病类型用户不满足上述预设条件,即候选簇中的未知疾病类型用户在时空上不存在联系,则候选簇中的未知疾病类型用户未感染未知传染病。
[0099]
在一个示例中,若所述候选簇中的未知疾病类型用户为所述未知传染病用户,则确定未知传染病用户所属簇中包含的所有疾病特征确定为未知传染病对应的目标监测特征。假设用户1、用户3、用户10、用户15、用户18、用户21、用户25、用户33感染某种未知传染病,则确定与用户1、用户3、用户10、用户15、用户18、用户21、用户25、用户33聚类在同一簇内的特征2、特征10、特征15、特征20为目标监测特征,通过确定目标监测特征,有利于减小未知传染病的传播范围。在对未知传染病的监测过程中,若医生发现某用户存在目标监测特征中的一种或多种,则认为该用户可能感染该未知传染病,需要对其采用隔离等措施,通过进一步观察、检测,避免未知传染病大范围传播。
[0100]
如图3所示为本发明实施例提供的一种未知传染病的监测装置,该装置包括:
[0101]
采集模块201,用于采用滑动窗口方式采集未知疾病类型用户的病历数据,每条所述病历数据包括用户信息以及多个疾病特征数据;
[0102]
聚类模块202,用于对所述未知疾病类型用户的病历数据进行聚类,得到多个簇,每个簇中包括多个未知疾病类型用户和多个疾病特征;
[0103]
确定模块203,用于根据所述多个簇中每一簇的疾病特征数据和用户信息确定候选簇,判断所述候选簇中的未知疾病类型用户在时空上是否存在联系,若是,则确定所述候选簇中包含的所有疾病特征确定为未知传染病对应的目标监测特征。
[0104]
在一个示例中,每个所述滑动窗口的长度相同,相邻的两个滑动窗口的长度有预定时长的重叠,所述预定时长小于所述滑动窗口的长度。
[0105]
在一个示例中,所述采集模块201,具体用于:
[0106]
采用滑动窗口方式采集多个用户的病历数据;
[0107]
过滤已知疾病类型用户的病历数据后,得到未知疾病类型用户的病历数据。
[0108]
在一个示例中,所述聚类模块202,具体用于:
[0109]
根据未知疾病类型用户的病历数据构建用户信息和疾病特征数据之间的关联关系;
[0110]
根据所述用户信息和疾病特征数据之间的关联关系确定用户之间的相似度,得到用户的相似度矩阵;
[0111]
根据所述用户信息和疾病特征数据之间的关联关系确定疾病特征之间的相似度,得到疾病特征的相似度矩阵;
[0112]
根据所述用户的相似度矩阵和所述疾病特征的相似度矩阵进行聚类,得到多个簇。
[0113]
在一个示例中,所述根据所述多个簇中每一簇的疾病特征数据和用户信息确定候选簇,包括:
[0114]
确定用户数量少且疾病特征数据聚集的簇为候选簇。
[0115]
在一个示例中,所述用户信息和疾病特征数据之间的关联关系为二部图,所述二部图的边表征所述用户存在所述疾病特征。
[0116]
在一个示例中,所述根据所述用户信息和疾病特征数据之间的关联关系确定用户之间的相似度,包括:
[0117]
确定两个用户对应的疾病特征数据的交集所包含的疾病特征的数量;
[0118]
确定两个用户对应的疾病特征数据的并集所包含的疾病特征的数量;
[0119]
根据所述交集所包含的疾病特征数据的数量和所述并集所包含的疾病特征数据的数量确定用户之间的相似度。
[0120]
在一个示例中,所述根据所述用户信息和疾病特征之间的关联关系确定疾病特征数据之间的相似度,包括:
[0121]
确定两个疾病特征数据对应的用户的交集所包含的用户的数量;
[0122]
确定两个疾病特征数据对应的用户的并集所包含的用户的数量;
[0123]
根据所述交集所包含的用户的数量和所述并集所包含的用户的数量确定疾病特征数据之间的相似度。
[0124]
在一个示例中,判断所述候选簇中的未知疾病类型用户在时空上是否存在联系,包括:
[0125]
若所述候选簇中的未知疾病类型用户在预设时间与预设空间范围有交集,则确定所述候选簇中的未知疾病类型用户在时空上存在联系。
[0126]
本发明再一方面提供一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行本发明所述的监测方法。
[0127]
本发明还一方面提供一种电子设备,包括:
[0128]
处理器;
[0129]
用于存储所述处理器可执行指令的存储器;
[0130]
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现
本发明所述的监测方法。
[0131]
除了上述方法和设备以外,本技术的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本技术各种实施例的方法中的步骤。
[0132]
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本技术实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如java、c++等,还包括常规的过程式程序设计语言,诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
[0133]
此外,本技术的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本技术各种实施例的方法中的步骤。
[0134]
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0135]
以上结合具体实施例描述了本技术的基本原理,但是,需要指出的是,在本技术中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本技术的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本技术为必须采用上述具体的细节来实现。
[0136]
本技术中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“如但不限于”,且可与其互换使用。
[0137]
还需要指出的是,在本技术的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本技术的等效方案。
[0138]
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本技术。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本技术的范围。因此,本技术不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
[0139]
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本技术的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1