传染病的传染概率计算方法及装置、存储介质、电子设备与流程

文档序号:27766268发布日期:2021-12-04 01:03阅读:391来源:国知局
传染病的传染概率计算方法及装置、存储介质、电子设备与流程

1.本发明实施例涉及大数据处理技术领域,具体而言,涉及一种传染 病的传染概率计算方法、传染病的传染概率计算装置、计算机可读存储介 质以及电子设备。


背景技术:

2.在流行病传播研究中,分析人与人之间的时空联系是一种十分重要 的分析方法。因此,早发现病毒携带者并及时将其隔离,就能阻止他传 播给其他人,进而有效地防止疫情大规模传播。
3.易感人群挖掘是指与病毒携带者有过疑似长时间密切接触的人群。 例如,可以给定患者移动轨迹,疑似人群挖掘通过时空查询找出与这条轨 迹有过密切接触的人群。目前易感人群挖掘方案主要如下方式进行:一 种是,通过患者的出行记录,如火车票、飞机票等,找到与患者同乘的 人;另一种是,通过轨迹相似算法找到具有相似时空行为的轨迹,然后基 于该轨迹找到被疑似传染的对象。
4.但是,上述方案存在如下缺陷:一方面,在对轨迹采样的过程中,如 果轨迹时空跨度太大,轨迹相似算法的计算效率以及计算准确率会降低, 且会增加系统的计算负担,进而使得被疑似传染的对象的挖掘效率较低; 另一方面,对于一些没有出行记录的公共场合来说,不能准确的查找到疑 似被传染的对象,同时也无法对疑似被传染对象的被传染概率进行计算。
5.因此,需要提供一种新的传染病的传染概率计算方法及装置。
6.需要说明的是,在上述背景技术部分发明的信息仅用于加强对本发明 的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技 术的信息。


技术实现要素:

7.本发明的目的在于提供一种传染病的传染概率计算方法、传染病的传 染概率计算装置、计算机可读存储介质以及电子设备,进而至少在一定程 度上克服由于相关技术的限制和缺陷而导致的无法对疑似被传染对象的 被传染概率进行计算的问题。
8.根据本公开的一个方面,提供一种传染病的传染概率计算方法,包括:
9.获取传染病患者在预设时间段内的移动轨迹,并根据预设分割规则对 所述移动轨迹进行分割得到多个轨迹段;
10.确定各所述轨迹段的传染时空范围,并从预设的时空数据中获取各所 述传染时空范围内的待预测对象;
11.根据各所述待预测对象与所述传染病患者在各所述传染时空范围内 的第一距离,计算各所述待预测对象的局部传染概率;
12.根据各所述待预测对象在各所述传染时空范围内的局部传染概率,计 算各所述待预测对象在所述移动轨迹上的目标传染概率。
13.在本公开的一种示例性实施例中,所述预设分割规则包括预设时间间 隔以及预
设空间间隔;
14.一个所述轨迹段由其包括的多个轨迹点以及到达该轨迹段的起始时 间点与离开该轨迹段的终止时间点之间的时间差表示,每一个所述轨迹点 由其所对应的经纬度坐标和到达该轨迹点的时间点表示;
15.其中,根据预设分割规则对所述移动轨迹进行分割得到多个轨迹段包 括:
16.在确定所述移动轨迹上任意两个轨迹点的所述经纬度坐标之间的空 间距离大于等于所述预设空间间隔时;或者
17.在确定所述移动轨迹上任意两个轨迹点的所述时间点之间的时间间 隔大于等于所述预设时间间隔时;
18.对所述移动轨迹上由该两个轨迹点组成的部分进行分割,得到一个所 述轨迹段;其中,每一个轨迹点只能对应一个轨迹段。
19.在本公开的一种示例性实施例中,确定各所述轨迹段的传染时空范围 包括:
20.根据所述传染病的传播半径以及所述传染病在空气中的存活时间,确 定各所述轨迹段的传染时空范围。
21.在本公开的一种示例性实施例中,从预设的时空数据中获取各所述传 染时空范围内的待预测对象包括:
22.根据各所述传染时空范围内包括的轨迹点的经纬度坐标以及到达该 轨迹点的起始时间点与离开该轨迹点的终止时间点生成检索条件;
23.从所述预设的时空数据中确定与所述检索条件对应的时空区间,并根 据所述时空区间构建与所述检索条件对应的目标索引树;
24.对所述目标索引树进行逐层查找,以从所述目标索引树的叶子节点获 取满足所述检索条件的索引,以及与所述索引关联的轨迹信息;
25.根据所述轨迹信息的标识,确定各所述传染时空范围内的待预测对 象。
26.在本公开的一种示例性实施例中,根据各所述传染时空范围内包括的 轨迹点的经纬度坐标以及到达该轨迹点的起始时间点与离开该轨迹点的 终止时间点生成检索条件包括:
27.计算各所述传染时空范围之间的第二距离,并在确定任意两个所述传 染时空范围之间的第二距离小于预设距离时,对该两个传染时空范围内的 轨迹段进行聚合,生成新的传染时空范围;
28.根据所述新的传染时空范围内包括的轨迹点的经纬度坐标以及到达 该轨迹点的起始时间点与离开该轨迹点的终止时间点生成检索条件。
29.在本公开的一种示例性实施例中,根据各所述待预测对象与所述传染 病患者在各所述传染时空范围内的第一距离,计算各所述待预测对象的局 部传染概率包括:
30.根据各所述待预测对象在所述传染时空范围内所处的轨迹点,以及所 述传染病患者在各所述传染时空范围内所处的轨迹点,计算各所述待预测 对象与所述传染病患者在各所述传染时空范围内的第一距离;其中,所述 第一距离包括第一时间距离以及第一空间距离;
31.根据所述第一时间距离以及所述第一空间距离,以及所述传染时空范 围内所包括的轨迹点的个数,计算各所述待预测对象的局部传染概率。
32.在本公开的一种示例性实施例中,根据各所述待预测对象在各所述传 染时空范围内的局部传染概率,计算各所述待预测对象在所述移动轨迹上 的目标传染概率包括:
33.根据各所述待预测对象在各所述传染时空范围内出现的时长,计算各 所述传染时空范围在所述移动轨迹上所占的权重;
34.根据各所述待预测对象在各所述传染时空范围内的局部传染概率以 及各所述传染时空范围在所述移动轨迹上所占的权重,计算各所述待预测 对象在所述移动轨迹上的目标传染概率。
35.根据本公开的一个方面,提供一种传染病的传染概率计算装置,包括:
36.轨迹分割模块,用于获取传染病患者在预设时间段内的移动轨迹,并 根据预设分割规则对所述移动轨迹进行分割得到多个轨迹段;
37.待预测对象获取模块,用于确定各所述轨迹段的传染时空范围,并从 预设的时空数据中获取各所述传染时空范围内的待预测对象;
38.第一计算模块,用于根据各所述待预测对象与所述传染病患者在各所 述传染时空范围内的第一距离,计算各所述待预测对象的局部传染概率;
39.第二计算模块,用于根据各所述待预测对象在各所述传染时空范围内 的局部传染概率,计算各所述待预测对象在所述移动轨迹上的目标传染概 率。
40.根据本公开的一个方面,提供一种计算机可读存储介质,其上存储有 计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的传 染病的传染概率计算方法。
41.根据本公开的一个方面,提供一种电子设备,包括:
42.处理器;以及
43.存储器,用于存储所述处理器的可执行指令;
44.其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一 项所述的传染病的传染概率计算方法。
45.本发明实施例提供的一种传染病的传染概率计算方法,一方面,通过 获取传染病患者在预设时间段内的移动轨迹,并根据预设分割规则对移动 轨迹进行分割得到多个轨迹段;然后确定各轨迹段的传染时空范围,并从 预设的时空数据中获取各传染时空范围内的待预测对象;再根据各待预测 对象与传染病患者在各传染时空范围内的第一距离,计算各待预测对象的 局部传染概率;最后根据各待预测对象在各传染时空范围内的局部传染概 率,计算各待预测对象在移动轨迹上的目标传染概率,解决了现有技术中 由于在对轨迹采样的过程中,如果轨迹时空跨度太大,轨迹相似算法的计 算效率以及计算准确率会降低,且会增加系统的计算负担,进而使得被疑 似传染的对象的挖掘效率较低的问题;另一方面,解决了现有技术中对于 一些没有出行记录公共场合来说,不能准确的查找到疑似被传染的对象, 同时也无法对疑似被传染对象的被传染概率进行计算的问题,可以根据传 染病患者的移动轨迹对出现在该移动轨迹上的疑似被传染对象的被传染 概率进行计算;进一步的,通过根据各待预测对象在各传染时空范围内的 局部传染概率,计算各待预测对象在移动轨迹上的目标传染概率,进而使 得相关人员可以根据给待预测对象的目标传染概率的大小,采取相应的措 施,例如,对传染概率较大的待预测对象,可以采用医学隔离;对于传染 概率较小的待预测对象,可以采用普通隔离,由此可以避免被过多传染以 及浪
费医学资源的问题。
46.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释 性的,并不能限制本发明。
附图说明
47.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合 本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见 地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技 术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得 其他的附图。
48.图1示意性示出根据本发明示例实施例的一种传染病的传染概率计算 方法的流程图。
49.图2示意性示出根据本发明示例实施例的一种传染病患者的移动轨迹 的示例图。
50.图3示意性示出根据本发明示例实施例的一种传染时空范围的示例 图。
51.图4示意性示出根据本发明示例实施例的一种轨迹段的示例图。
52.图5示意性示出根据本发明示例实施例的一种从预设的时空数据中获 取各所述传染时空范围内的待预测对象的方法流程图。
53.图6示意性示出根据本发明示例实施例的一种预设的时空数据的存储 结构示例图。
54.图7示意性示出根据本发明示例实施例的一种从预设的时空数据中获 取各所述传染时空范围内的待预测对象的获取场景图。
55.图8示意性示出根据本发明示例实施例的一种根据各所述待预测对象 与所述传染病患者在各所述传染时空范围内的第一距离,计算各所述待 预测对象的局部传染概率的方法流程图。
56.图9示意性示出根据本发明示例实施例的一种传染病的传染概率计算 装置的框图。
57.图10示意性示出根据本发明示例实施例的一种用于实现上述传染病 的传染概率计算方法的电子设备。
具体实施方式
58.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式 能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提 供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构 思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以 任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供 许多具体细节从而给出对本发明的实施方式的充分理解。然而,本领域 技术人员将意识到,可以实践本发明的技术方案而省略所述特定细节中 的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其 它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本发 明的各方面变得模糊。
59.此外,附图仅为本发明的示意性图解,并非一定是按比例绘制。图 中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描 述。附图中所示的一些方框图是
功能实体,不一定必须与物理或逻辑上 独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个 或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处 理器装置和/或微控制器装置中实现这些功能实体。
60.在流行病传播研究中,分析人与人之间的时空联系是一种十分重要 的分析方法。通过观察时空关系,我们可以精准的找到病毒携带者密切 接触过的人群或者物品。从19世纪前半叶开始,由霍乱狐菌引发的霍乱 夺取了无数人的生命,仅仅印度,在霍乱爆发之后的100年间的死亡人数 高达3800万人。在欧洲,霍乱也危害了无法估量的人,仅在1831年间欧 洲死亡人数高达90万人。当时全球大部分国家都处在霍乱带来的巨大恐 惧中,因为人们当时并不清楚它的传染源,进而不能进行最有效的阻止 其再次爆发。因此,约翰.斯诺开始了霍乱溯源研究。他从收集到的霍乱 病人发病地点、常去地方和周围poi(point of information,信息点)等数 据中挖掘出了它们之间的时空关系,最终他发现在很多病人经常待的地 方附近都有一个水泵,然后他进一步通过实地调查确定了一台被污水污 染的水泵造成了霍乱的传播,由此也证实了水源是霍乱传播途径之一。 之后在他的呼吁下,当地政府及时关闭并处理了相关污水源,最终这项 操作使得英国疫情得以控制。约翰.斯诺的工作是经典的通过时空分析找 到关联关系的案列。
61.sars-cov-2具有极高的传染性,它可以通过唾液等传播,并且几乎 人人易感。因此,早发现病毒携带者并及时将其隔离,就能阻止他传播 给其他人,进而有效地防止疫情大规模传播。
62.易感人群挖掘是指与病毒携带者有过疑似长时间密切接触的人群。 具体的,可以给定患者移动轨迹,疑似人群挖掘通过时空查询找出与这条 移动轨迹有过密切接触的人群。目前易感人群挖掘方案主要如下:
63.一种是,人工询问患者曾经去过的地方和接触的人群,然后让相关社 区工作人员去核实和隔离密切接触者;另一种是,通过患者的出行记录, 如火车票、飞机票等,找到与患者同乘的人;再一种是,通过轨迹相似技 术找到具有相似时空行为的轨迹;还有一种是,通过轨迹挖掘旅行同伴。
64.但是,上述方法存在如下缺陷:一方面,上述方案十分依赖于患者的 记忆,并且很难找全与患者有过一段近距离共处的陌生人。
65.另一方面,对于人工询问方案来说,首先,全凭用户记忆,会遗漏很 多有用信息;其次,需要协调多方资源,工作量巨大。
66.再一方面,对于出行记录方案来说,首先,不能覆盖未全实名认证的 出行方式,如地铁、公交;其次,不能找到患者在步行中密切接触的人群; 并且,还不能找到与患者在广场等聚集区域有过密切接触人群。
67.进一步的,对于基于轨迹相似的方案来说,首先,对轨迹采样率要求 高,如需要轨迹长度一致或者前后两个轨迹点时间间隔大致相同;其次, 如果轨迹时空跨度太大,轨迹相似算法的效率会受到巨大影响,导致效率 低下。
68.最后,对于基于旅行同伴挖掘的方案来说,虽然能找到与患者最密切 接触的人群,但很难找到与患者在某个局部区域有过密切的人群。但是, 需要将有过密切接触的人群都挖掘出来,才能避免扩大传染的风险,因此 该方案并不合适。
69.基于上述问题,本示例实施方式中首先提供了一种传染病的传染概率 计算方法,
该方法可以运行于服务器、服务器集群或云服务器等;当然, 本领域技术人员也可以根据需求在其他平台运行本发明的方法,本示例性 实施例中对此不做特殊限定。参考图1所示,该传染病的传染概率计算方 法可以包括以下步骤:
70.步骤s110.获取传染病患者在预设时间段内的移动轨迹,并根据预设 分割规则对所述移动轨迹进行分割得到多个轨迹段;
71.步骤s120.确定各所述轨迹段的传染时空范围,并从预设的时空数据 中获取各所述传染时空范围内的待预测对象;
72.步骤s130.根据各所述待预测对象与所述传染病患者在各所述传染 时空范围内的第一距离,计算各所述待预测对象的局部传染概率;
73.步骤s140.根据各所述待预测对象在各所述传染时空范围内的局部 传染概率,计算各所述待预测对象在所述移动轨迹上的目标传染概率。
74.上述传染病的传染概率计算方法中,一方面,通过获取传染病患者在 预设时间段内的移动轨迹,并根据预设分割规则对移动轨迹进行分割得到 多个轨迹段;然后确定各轨迹段的传染时空范围,并从预设的时空数据中 获取各传染时空范围内的待预测对象;再根据各待预测对象与传染病患者 在各传染时空范围内的第一距离,计算各待预测对象的局部传染概率;最 后根据各待预测对象在各传染时空范围内的局部传染概率,计算各待预测 对象在移动轨迹上的目标传染概率,解决了现有技术中由于在对轨迹采样 的过程中,如果轨迹时空跨度太大,轨迹相似算法的计算效率以及计算准 确率会降低,且会增加系统的计算负担,进而使得被疑似传染的对象的挖 掘效率较低的问题,可以根据传染病患者的移动轨迹对出现在该移动轨迹 上的疑似被传染对象的被传染概率进行计算;另一方面,解决了现有技术 中对于一些没有出行记录公共场合来说,不能准确的查找到疑似被传染的 对象,同时也无法对疑似被传染对象的传染概率进行计算的问题;进一步 的,通过根据各待预测对象在各传染时空范围内的局部传染概率,计算各 待预测对象在移动轨迹上的目标传染概率,进而使得相关人员可以根据给 待预测对象的目标传染概率的大小,采取相应的措施,例如,对传染概率 较大的待预测对象,可以采用医学隔离;对于传染概率较小的待预测对象, 可以采用普通隔离,由此可以避免被过多传染以及浪费医学资源的问题。
75.以下,结合附图对本发明示例实施例传染病的传染概率计算方法中涉 及的各步骤进行详细的解释以及说明。
76.首先,对本发明示例实施例的应用场景进行说明。随着移动互联网的 高速发展,大量的时空数据每时每刻都会产生。这些时空数据可以记录着 人的出行轨迹,而一旦掌握了covid-19患者在被隔离前的移动轨迹,那 么就可以很清楚的知道他在什么地方有过驻留,并且通过时空范围查询可 以挖掘出跟患者有过近距离接触的人群。轨迹是典型的时空数据。通过调 查病人的运动轨迹,可以挖掘出病人疑似接触人群。参考图2所示,给定 患者201移动轨迹202,疑似人群203挖掘通过时空查询找出与这条轨迹 有过密切接触的人群。具体方法可以如下所示:
77.首先,将患者的轨迹分成若干个片段,这些片段可以准确的表示患者 曾经在那些地方活动过。其次,通过查询每个轨迹片段可能传染的时空范 围,找到疑似人群,再根据患者在每一个时空点与疑似人群的空间和时间 距离确定疑似人群传染概率,并且,离患者空间越近且出现时间也越接近 的人群传染概率越高。然后,采用加权求和的方式把患者各个
轨迹片段所 影响到的人群汇总,得出全局最可能被传染的人群,这样还能找到那些虽 然在各个轨迹片段被传染概率低,但是与患者有多个共处轨迹片段的人 群。
78.进一步的,考虑到传染病具有潜伏期,患者在被传染初期并不会有明 显症状,但在潜伏期的患者仍然具有传染性。因此,可以将患者轨迹(参 考图3中的线条301)分成两条局部段s1、s2,然后根据每条轨迹段活动 的空间和时间范围确定出其影响时空范围302,其中影响空间范围和时间 范围分布需要扩张。最后,从数据库中提取出所有出现在患者影响时空范 围内的人群,并根据用户id聚合属于同一人的轨迹,进而得到疑似人群。
79.此处还需要补充说明的是,q
i.p
是传染病患者所经过的轨迹点,t
ij
.p是 与该传染病患者处于同一个影响时空范围的疑似人群所经过的轨迹点
80.其次,结合上述具体应用场景以及图2、图3对步骤s110-步骤s140 进行解释以及说明。
81.在步骤s110中,获取传染病患者在预设时间段内的移动轨迹,并根 据预设分割规则对所述移动轨迹进行分割得到多个轨迹段。
82.在本示例实施李中,首先,需要强调的是,随着gps系统的逐渐完 善以及智能设备的普及,除了婴幼儿以外,大部分的人群会在出行的时候, 佩戴可以随时定位的智能设备,譬如,智能手机、智能手环或者智能手表 等等,因此,当某一个传染病患者确诊以后,可以从gps系统中获取其 在疑似被传染到确诊这一预设时间段内的移动轨迹。
83.其次,当获取到传染病患者在上述预设时间段内的移动轨迹后,为了 更精准的描述传染病患者的传播路径,需要将传染病患者从潜伏期开始到 被隔离期间的所有轨迹集中起来。但,由于gps终端有些信号不稳定或 者用户关闭了终端等原因,造成了患者在这段时间的轨迹并不一定是一直 连续的。并且,患者所有时空点组成的一条轨迹具有较大的时空范围,这 样会在时空查询时产生大量的冗余数据。因此,可以将移动轨迹分段,将 长轨迹分割成较为合适的轨迹局部段。
84.具体的,可以基于预设分割规则对该移动轨迹进行分割。其中,所述 预设分割规则包括预设时间间隔以及预设空间间隔;并且,一个所述轨迹 段由其包括的多个轨迹点以及到达该轨迹段的起始时间点与离开该轨迹 段的终止时间点之间的时间差表示,每一个所述轨迹点由其所对应的经纬 度坐标和到达该轨迹点的时间点表示;进一步的,根据预设分割规则对所 述移动轨迹进行分割得到多个轨迹段可以包括:在确定所述移动轨迹上任 意两个轨迹点的所述经纬度坐标之间的空间距离大于等于所述预设空间 间隔时;或者在确定所述移动轨迹上任意两个轨迹点的所述时间点之间的 时间间隔大于等于所述预设时间间隔时;对所述移动轨迹上由该两个轨迹 点组成的部分进行分割,得到一个所述轨迹段;其中,每一个轨迹点只能 对应一个轨迹段。
85.譬如,参考图3所示,轨迹段例如可以s1、s2所示,轨迹点例如可以 如q
i.p
(i=1,2,3,

,6)所示。具体的,上预设时间间隔例如可以是30minutes, 空间间隔例如可以是150m。例如,如图4中所示,比如,某两个轨迹点 之间的距离为d1=200m,则将该两个轨迹点分别划分到不同的轨迹段里 面;又比如,某两个轨迹点之间的距离为d2=210m,则将该两个轨迹点分 别划分到不同的轨迹段里面;再比如,从上一个轨迹点离开的时间与到达 下一个轨迹点的时间间隔为35minutes,则将该两个轨迹点分别划分到不 同的轨迹段里面。通过设置该预设分割规则,充分的考虑到了传染病病毒 的实际情况,使得得到轨迹段可以较为
准确的对具体的传染情况进行表 述,提高了轨迹段划分的准确率,进而可以提高计算得到的传染概率的准 确率。
86.在步骤s120中,确定各所述轨迹段的传染时空范围,并从预设的时 空数据中获取各所述传染时空范围内的待预测对象。
87.在本示例实施例中,首先,对传染时空范围进行定义。具体的,给定 一个轨迹点位置l、一个空间影响范围(传染病毒的传染半径)θ
d
以及时 间影响范围(传染病毒在空气中的存留时间)θ
t
,然后采用str (spatio-temporal range)来表示时空影响范围。具体可以如下所示:
[0088][0089]
其中,str(l,θ
d

t
)表示时空影响范围,r(range)表示范围的大小,r.t 表示在该时空影响范围内可以扩展的最大时间限制,l.t表示传染病患者离 开该时空影响范围的终止时间;r.p表示在该时空影响范围内可以扩展的 最大距离限制,l.p表示传染病患者在该时空影响范围中的轨迹点的位置。
[0090]
其次,可以根据所述传染病的传播半径以及所述传染病在空气中的存 活时间,确定各所述轨迹段的传染时空范围;譬如,继续参考图3所示, 假设传播半径为θ
d
,在空气中的存活时间为θ
t
,则最终得到传染时空范围 可以参考图3中的虚线框所示。
[0091]
其次,当得到各轨迹段的传染时空范围以后,可以从预设的时空数据 中获取各传染时空范围内的待预测对象。具体的,参考图5所示,从预设 的时空数据中获取各所述传染时空范围内的待预测对象可以包括步骤 s510-步骤s540。其中:
[0092]
在步骤s510中,根据各所述传染时空范围内包括的轨迹点的经纬度 坐标以及到达该轨迹点的起始时间点生成检索条件。
[0093]
在本示例实施例中,首先,计算各所述传染时空范围之间的第二距离, 并在确定任意两个所述传染时空范围之间的第二距离小于预设距离时,对 该两个传染时空范围内的轨迹段进行聚合,生成新的传染时空范围;其次, 根据所述新的传染时空范围内包括的轨迹点的经纬度坐标以及到达该轨 迹点的起始时间点与离开该轨迹点的终止时间点生成检索条件。
[0094]
在步骤s520中,从所述预设的时空数据中确定与所述检索条件对应 的时空区间,并根据所述时空区间构建与所述检索条件对应的目标索引 树。
[0095]
在步骤s530中,对所述目标索引树进行逐层查找,以从所述目标索 引树的叶子节点获取满足所述检索条件的索引,以及与所述索引关联的轨 迹信息。
[0096]
在步骤s540中,根据所述轨迹信息的标识,确定各所述传染时空范 围内的待预测对象。
[0097]
以下,将对步骤s510-步骤s540及其中涉及到的步骤进行解释以及说 明。
[0098]
首先,对上述预设的时空数据进行解释以及说明。具体的,由于用户 轨迹数量巨大,造成传统数据库难以实现快速查询。因此,可以通过分布 式数据库(如hbase),将海量轨迹数据用key-value的形式存储在具有多 备份且安全的分布式集群上,得到上述预设的时空数据。然而,传统分布 式并不直接支持轨迹数据,为此需要为轨迹数据设计特殊的行键结构,才 能取得更佳查询效率。因此,可以采用xz2t索引,实现高效的管理类似 轨迹这
种多维时空数据。其中,xz2t索引按照固定时间跨度(如,年, 月,日)将时间划分为若干不相交的时空区间,并通过xz2索引将二维 空间范围映射到一维整数域中,然后再组合时间分区号和空间编码值为存 储键,再将其键和数据存储在分布式数据库中以备易感人群挖掘查询离线 使用。譬如,可以将所得到的不相交的时空区间例如可以包括0-3四个区 间,然后每个时空区间又可以被分为四个子区间,譬如,00-03等等,当 创建行键时,行键中可以包括时空区间的子区间(shard)序号(例如,00-03) +该分片所对应的轨迹段以及时间段+产生该数据的用户标识,与其对应的 值可以是各轨迹段中所包括的轨迹点以及时间点,然后将其映射到一维整 数域中。
[0099]
其次,在实际的应用场景中,患者的数据会批量增加,如果采用循环 查询将花费大量的时间。为此,可以基于sft(spatial first tree,空间优 化索引)算法,将相近传染时空范围内的轨迹段聚集在一起,然后一通查 询疑似人群。具体的,可以先计算各所述传染时空范围之间的第二距离, 并在确定任意两个所述传染时空范围之间的第二距离小于预设距离时,对 该两个传染时空范围内的轨迹段进行聚合,生成新的传染时空范围;具体 的,可以参考图6所示,譬如,某两个传染时空范围的距离很小(可以忽 略不计)或者存在重叠区域时,可以将其进行聚集,形成一个新的传染时 空范围;其次,根据所述新的传染时空范围内包括的轨迹点的经纬度坐标 以及到达该轨迹点的起始时间点与离开该轨迹点的终止时间点生成检索 条件。其中,该检索条件中可以包括传染时空范围的起始经纬度坐标、终 止经纬度坐标、起始时间点以及终止时间点;然后,从上述预设的时空数 据中确定与所述检索条件对应的时空区间,并根据所述时空区间构建与所 述检索条件对应的目标索引树;其中,参考图7所示,时空区间例如可以 是3,目标索引树例如可以是n30等等。进一步的,对目标索引树进行逐 层查找,以从所述目标索引树的叶子节点获取满足所述检索条件的索引, 以及与所述索引关联的轨迹信息,其中,满足检索条件的索引例如可以包 括tr7、tr8以及tr3,然后在获取其对应的轨迹信息,其中,该轨迹信 息中可以包括:具体的轨迹点,各轨迹点形成的轨迹段以及在各轨迹点上 的起始时间以及终止时间等等。最后,根据轨迹信息的标识,确定各传染 时空范围内的待预测对象。具体的,由于每一条轨迹的产生都有其对应的 标识(id),该id可以是用户的注册标识、用户所使用的智能设备的序列 号、用户的电话号码等等,本示例对此不做特殊限制。
[0100]
在步骤s130中,根据各所述待预测对象与所述传染病患者在各所述 传染时空范围内的第一距离,计算各所述待预测对象的局部传染概率。
[0101]
在本示例实施例中,参考图8所示,根据各所述待预测对象与所述传 染病患者在各所述传染时空范围内的第一距离,计算各所述待预测对象的 局部传染概率,可以包括步骤s810以及步骤s820。其中:
[0102]
在步骤s810中,根据各所述待预测对象在所述传染时空范围内所处 的轨迹点,以及所述传染病患者在各所述传染时空范围内所处的轨迹点, 计算各所述待预测对象与所述传染病患者在各所述传染时空范围内的第 一距离;其中,所述第一距离包括第一时间距离以及第一空间距离;
[0103]
在步骤s820中,根据所述第一时间距离以及所述第一空间距离,以 及所述传染时空范围内所包括的轨迹点的个数,计算各所述待预测对象的 局部传染概率。
[0104]
以下,将对步骤s810以及步骤s820进行解释以及说明。首先,通过 如下公式(2)计
算传染时空范围内的待预测对象与传染病患者的密切接 触程度:
[0105][0106]
其中,st_cor(l,t)表示密切接触程度,t表示移动轨迹,v表示待预测 对象的时空位置,st_dist(l,v)表示待预测对象与传染病患者在各传染时空 范围内的第一距离;其中:
[0107][0108]
其中,dist(l.p,v.p)表示传染病患者与待预测对象之间的距离,即第一 空间距离,|l.t-v.t|表示传染病患者与待预测对象在传染时空范围内共同时 长,即第一时间距离;λ属于[0,1]区间,可以用于控制空间和时间的偏好, 以及将空间距离以及时间距离归一化在同一个范围内,进 而可以提高所得到的的距离的准确率,进而提高传染概率的准确率。。
[0109]
其次,根据如下公式(4)计算待预测对象的初始传染概率:
[0110][0111]
其中,s表示移动轨迹上的一个轨迹段,ir(s,t)表示该轨迹段上的待 预测对象被传染的概率,l表示该轨迹段上的轨迹点,st_cor(l,t)表示待预 测对象在该轨迹段上的轨迹点l上被传染的概率,∑
l∈s
st_cor(l,t)表示在轨 迹段内所有的轨迹点上被传染的概率的和,|s|表示该轨迹段上所有的轨迹 点的和。
[0112]
在步骤s140中,根据各所述待预测对象在各所述传染时空范围内的 局部传染概率,计算各所述待预测对象在所述移动轨迹上的目标传染概 率。
[0113]
在本示例实施例中,首先,根据各所述待预测对象在各所述传染时空 范围内出现的时长,计算各所述传染时空范围在所述移动轨迹上所占的权 重;其次,根据各所述待预测对象在各所述传染时空范围内的局部传染概 率以及各所述传染时空范围在所述移动轨迹上所占的权重,计算各所述待 预测对象在所述移动轨迹上的目标传染概率。
[0114]
具体的,首先,按照如下公式(5)计算各传染时空范围(轨迹段) 在移动轨迹上所占的权重:
[0115][0116]
其中,p(s
i
)为第i个轨迹段的权重,s
i
为第i个轨迹段,s
i
.et为离开该 轨迹段的时间点(由离开该轨迹段的最后一个轨迹点的时间点确定),s
i
.st 为到达该轨迹段的时间点(由到达该轨迹段的第一个轨迹段的时间点确 定),m表示所述移动轨迹上的轨迹段的个数,表示完成 该移动轨迹所花费的总的时间。
[0117]
其次,按照如下公式(6)计算各待预测对象的目标传染概率:
[0118]
[0119]
其中,ir(q,t)表示目标传染概率。
[0120]
进一步的,当得到目标传染概率以后,相关人员可以根据给待预测对 象的目标传染概率的大小,采取相应的措施,例如,对传染概率较大的待 预测对象,可以采用医学隔离;对于传染概率较小的待预测对象,可以采 用普通隔离,由此可以避免被过多传染以及浪费医学资源的问题。
[0121]
本发明示例实施例还提供了一种传染病的传染概率计算装置。参考图 9所示,该传染病的传染概率计算装置可以包括轨迹分割模块910、待预 测对象获取模块920、第一计算模块930以及第二计算模块940。其中:
[0122]
轨迹分割模块910可以用于获取传染病患者在预设时间段内的移动轨 迹,并根据预设分割规则对所述移动轨迹进行分割得到多个轨迹段;
[0123]
待预测对象获取模块920可以用于确定各所述轨迹段的传染时空范 围,并从预设的时空数据中获取各所述传染时空范围内的待预测对象;
[0124]
第一计算模块930可以用于根据各所述待预测对象与所述传染病患者 在各所述传染时空范围内的第一距离,计算各所述待预测对象的局部传染 概率;
[0125]
第二计算模块940可以用于根据各所述待预测对象在各所述传染时空 范围内的局部传染概率,计算各所述待预测对象在所述移动轨迹上的目标 传染概率。
[0126]
在本公开的一种示例性实施例中,所述预设分割规则包括预设时间间 隔以及预设空间间隔;
[0127]
一个所述轨迹段由其包括的多个轨迹点以及到达该轨迹段的起始时 间点与离开该轨迹段的终止时间点之间的时间差表示,每一个所述轨迹点 由其所对应的经纬度坐标和到达该轨迹点的时间点表示;
[0128]
其中,根据预设分割规则对所述移动轨迹进行分割得到多个轨迹段包 括:
[0129]
在确定所述移动轨迹上任意两个轨迹点的所述经纬度坐标之间的空 间距离大于等于所述预设空间间隔时;或者
[0130]
在确定所述移动轨迹上任意两个轨迹点的所述时间点之间的时间间 隔大于等于所述预设时间间隔时;
[0131]
对所述移动轨迹上由该两个轨迹点组成的部分进行分割,得到一个所 述轨迹段;其中,每一个轨迹点只能对应一个轨迹段。
[0132]
在本公开的一种示例性实施例中,确定各所述轨迹段的传染时空范围 包括:
[0133]
根据所述传染病的传播半径以及所述传染病在空气中的存活时间,确 定各所述轨迹段的传染时空范围。
[0134]
在本公开的一种示例性实施例中,从预设的时空数据中获取各所述传 染时空范围内的待预测对象包括:
[0135]
根据各所述传染时空范围内包括的轨迹点的经纬度坐标以及到达该 轨迹点的起始时间点生成检索条件;
[0136]
从所述预设的时空数据中确定与所述检索条件对应的时空区间,并根 据所述时空区间构建与所述检索条件对应的目标索引树;
[0137]
对所述目标索引树进行逐层查找,以从所述目标索引树的叶子节点获 取满足所述检索条件的索引,以及与所述索引关联的轨迹信息;
[0138]
根据所述轨迹信息的标识,确定各所述传染时空范围内的待预测对 象。
[0139]
在本公开的一种示例性实施例中,根据各所述传染时空范围内包括的 轨迹点的经纬度坐标以及到达该轨迹点的起始时间点与离开该轨迹点的 终止时间点生成检索条件包括:
[0140]
计算各所述传染时空范围之间的第二距离,并在确定任意两个所述传 染时空范围之间的第二距离小于预设距离时,对该两个传染时空范围内的 轨迹段进行聚合,生成新的传染时空范围;
[0141]
根据所述新的传染时空范围内包括的轨迹点的经纬度坐标以及到达 该轨迹点的起始时间点与离开该轨迹点的终止时间点生成检索条件。
[0142]
在本公开的一种示例性实施例中,根据各所述待预测对象与所述传染 病患者在各所述传染时空范围内的第一距离,计算各所述待预测对象的局 部传染概率包括:
[0143]
根据各所述待预测对象在所述传染时空范围内所处的轨迹点,以及所 述传染病患者在各所述传染时空范围内所处的轨迹点,计算各所述待预测 对象与所述传染病患者在各所述传染时空范围内的第一距离;其中,所述 第一距离包括第一时间距离以及第一空间距离;
[0144]
根据所述第一时间距离以及所述第一空间距离,以及所述传染时空范 围内所包括的轨迹点的个数,计算各所述待预测对象的局部传染概率。
[0145]
在本公开的一种示例性实施例中,根据各所述待预测对象在各所述传 染时空范围内的局部传染概率,计算各所述待预测对象在所述移动轨迹上 的目标传染概率包括:
[0146]
根据各所述待预测对象在各所述传染时空范围内出现的时长,计算各 所述传染时空范围在所述移动轨迹上所占的权重;
[0147]
根据各所述待预测对象在各所述传染时空范围内的局部传染概率以 及各所述传染时空范围在所述移动轨迹上所占的权重,计算各所述待预测 对象在所述移动轨迹上的目标传染概率。
[0148]
上述传染病的传染概率计算装置中各模块的具体细节已经在对应的 传染病的传染概率方法中进行了详细的描述,因此此处不再赘述。
[0149]
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若 干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的 实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一 个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征 和功能可以进一步划分为由多个模块或者单元来具体化。
[0150]
此外,尽管在附图中以特定顺序描述了本发明中方法的各个步骤, 但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是 必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以 省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤 分解为多个步骤执行等。
[0151]
在本发明的示例性实施例中,还提供了一种能够实现上述方法的电子 设备。
[0152]
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系 统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式, 即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等), 或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块
”ꢀ
或“系统”。
[0153]
下面参照图10来描述根据本发明的这种实施方式的电子设备1000。 图10显示的电子设备1000仅仅是一个示例,不应对本发明实施例的功能 和使用范围带来任何限制。
[0154]
如图10所示,电子设备1000以通用计算设备的形式表现。电子设备 1000的组件可以包括但不限于:上述至少一个处理单元1010、上述至少 一个存储单元1020、连接不同系统组件(包括存储单元1020和处理单元 1010)的总线1030以及显示单元1040。
[0155]
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理 单元1010执行,使得所述处理单元1010执行本说明书上述“示例性方法
”ꢀ
部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单 元1010可以执行如图1中所示的步骤s110:获取传染病患者在预设时间 段内的移动轨迹,并根据预设分割规则对所述移动轨迹进行分割得到多个 轨迹段;步骤s120:确定各所述轨迹段的传染时空范围,并从预设的时 空数据中获取各所述传染时空范围内的待预测对象;步骤s130:根据各 所述待预测对象与所述传染病患者在各所述传染时空范围内的第一距离, 计算各所述待预测对象的局部传染概率;步骤s140:根据各所述待预测 对象在各所述传染时空范围内的局部传染概率,计算各所述待预测对象在 所述移动轨迹上的目标传染概率。
[0156]
存储单元1020可以包括易失性存储单元形式的可读介质,例如随机 存取存储单元(ram)10201和/或高速缓存存储单元10202,还可以进一 步包括只读存储单元(rom)10203。
[0157]
存储单元1020还可以包括具有一组(至少一个)程序模块10205的 程序/实用工具10204,这样的程序模块10205包括但不限于:操作系统、 一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一 个或某种组合中可能包括网络环境的实现。
[0158]
总线1030可以为表示几类总线结构中的一种或多种,包括存储单元 总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用 多种总线结构中的任意总线结构的局域总线。
[0159]
电子设备1000也可以与一个或多个外部设备1100(例如键盘、指向 设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备1000交互的设备通信,和/或与使得该电子设备1000能与一个或多个其它 计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这 种通信可以通过输入/输出(i/o)接口1050进行。并且,电子设备1000 还可以通过网络适配器1060与一个或者多个网络(例如局域网(lan), 广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适 配器1060通过总线1030与电子设备1000的其它模块通信。应当明白, 尽管图中未示出,可以结合电子设备1000使用其它硬件和/或软件模块, 包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、 raid系统、磁带驱动器以及数据备份存储系统等。
[0160]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述 的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方 式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式 体现出来,该软件产品可以存储在一个非易失性存储介质(可以是 cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计 算设备(可以是个人计算机、服务器、终端装置、或者网络设备等)执行 根据本发明实施方式的方法。
[0161]
在本发明的示例性实施例中,还提供了一种计算机可读存储介质,其 上存储有能
够实现本说明书上述方法的程序产品。在一些可能的实施方式 中,本发明的各个方面还可以实现为一种程序产品的形式,其包括程序代 码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端 设备执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例 性实施方式的步骤。
[0162]
描述了根据本发明的实施方式的用于实现上述方法的程序产品,其可 以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终 端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本 文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可 以被指令执行系统、装置或者器件使用或者与其结合使用。
[0163]
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质 可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不 限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者 任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括: 具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器 (ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或 闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存 储器件、或者上述的任意合适的组合。
[0164]
计算机可读信号介质可以包括在基带中或者作为载波一部分传播的 数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多 种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可 读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可 以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与 其结合使用的程序。
[0165]
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不 限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0166]
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明 操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸 如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类 似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分 地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设 备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上 执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类 的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备, 或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特 网连接)。
[0167]
此外,上述附图仅是根据本发明示例性实施例的方法所包括的处理的 示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明 或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在 多个模块中同步或异步执行的。
[0168]
本领域技术人员在考虑说明书及实践这里发明的发明后,将容易想 到本发明的其他实施例。本技术旨在涵盖本发明的任何变型、用途或者 适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理 并包括本发明未发明的本技术领域中的公知常识或惯用技术手段。说明 书和实施例仅被视为示例性的,本发明的真正范围和精神由权利要求指 出。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1