基于地铁空间的传染病扩散分析方法及系统与流程

文档序号:18475389发布日期:2019-08-20 20:58阅读:365来源:国知局
基于地铁空间的传染病扩散分析方法及系统与流程

本发明涉及一种基于地铁空间的传染病扩散分析方法及系统。



背景技术:

现在有关个体交互的传染病扩散研究一是基于建筑物等固定活动场所,比如家、工作地等,二是基于公共交通系统等移动性场所。在同一时间处于同一空间的个体对之间通常被认为发生了物理接触。当个体之间发生物理接触时,传染病通常通过空气传播(包括微粒、带菌飞沫和尘埃)和蚊子媒介传播。提取大规模个体间的物理接触关系,度量个体间的物理接触强度是研究呼吸道疾病、流感和登革热等传染病传播规律和现象并设计精准防控策略的关键基础。

目前,已有针对公交车的研究,尚未有面向地铁系统的研究。而地铁具有人流量大、密闭性高、覆盖范围广等特点,在其中极易发生个体间物理接触,这在一定程度上加速了传染病的扩散,因此,研究其内部的传染病扩散规律、制定精准防控措施是十分必要的。

由自动收费系统收集的地铁刷卡数据为调查大规模个体的物理接触提供了机会。由于地铁系统比公交系统更为庞大和复杂,提取地铁系统中的人-人物理接触存在诸多挑战(例如,换乘、上/下列车均无记录,难以判断个体在地铁系统中的具体乘车行为),导致提取人-人物理接触存在较大难度。

现有的传染病扩散分析技术的缺点如下:

第一,目前有关个体交互的传染病扩散研究一是基于建筑物等固定活动场所,比如家、工作地等,二是基于公共交通系统等移动性场所,已有针对公交车的研究,尚未有面向地铁系统的研究;

第二,由于地铁系统内部结构的庞大和复杂,研究其中的个体物理接触需要考虑多种情况,提取人-人物理接触存在较大难度。



技术实现要素:

有鉴于此,有必要提供一种基于地铁空间的传染病扩散分析方法及系统。

本发明提供一种基于地铁空间的传染病扩散分析方法,该方法包括如下步骤:a.根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻;b.根据地铁线路图和地铁刷卡数据推断个体乘客的出行路径;c.根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间;d.根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施。

其中,所述的步骤a具体包括:

获取地铁站乘客及地铁运行的源数据。其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表;

根据获取的地铁站乘客及地铁运行的源数据,推断列车到达和离开每个站点的时刻,并对每辆列车进行编号。

所述的步骤b具体包括:

根据上述处理后的地铁刷卡数据,得到od记录数据,对得到的od记录数据进行异常数据清洗;

结合地铁线路图,使用dijkstra算法搜索时间最短路径来确定个体乘客的出行路径。

所述的步骤c具体包括如下步骤:

c1,根据地铁刷卡数据,计算个体乘客在每个站点的进出站步行时间;

c2,根据出站刷卡时间戳计算下车时间戳,将非换乘个体乘客匹配到特定列车;

c3,根据进站刷卡时间戳计算换乘前的上车时间戳,将单次换乘个体乘客匹配到特定列车;

c4,根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;

c5,用步骤c3推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车。

所述分析地铁空间内的传染病扩散情况是指,通过分析传染源个体及与其在同一地铁空间共现的个体频繁经过的站点、乘坐的列车模拟传染病的扩散情况;所述制定防控措施是指在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。

本发明提供一种基于地铁空间的传染病扩散分析系统,该系统包括该系统包括计算模块、推断模块、匹配模块、分析模块,其中:所述计算模块用于根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻;所述推断模块用于根据地铁线路图和地铁刷卡数据推断个体乘客的出行路径;所述匹配模块用于根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间;所述分析模块用于根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施。

其中,所述的计算模块具体用于:

获取地铁站乘客及地铁运行的源数据。其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表;

根据获取的地铁站乘客及地铁运行的源数据,推断列车到达和离开每个站点的时刻,并对每辆列车进行编号。

所述的推断模块具体用于:

根据上述处理后的地铁刷卡数据,得到od记录数据,对得到的od记录数据进行异常数据清洗;

结合地铁线路图,使用dijkstra算法搜索时间最短路径来确定个体乘客的出行路径。

所述的匹配模块具体用于:

根据地铁刷卡数据,计算个体乘客在每个站点的进出站步行时间;

根据出站刷卡时间戳计算下车时间戳,将非换乘个体乘客匹配到特定列车;

根据进站刷卡时间戳计算换乘前的上车时间戳,将单次换乘个体乘客匹配到特定列车;

根据换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值,计算换乘站点的换乘时间;

推断出乘客乘坐的第一列和最后一列列车,并考虑换乘站的换乘时间,将多次换乘乘客匹配到特定列车。

所述分析地铁空间内的传染病扩散情况是指,通过分析传染源个体及与其在同一地铁空间共现的个体频繁经过的站点、乘坐的列车模拟传染病的扩散情况;所述制定防控措施是指在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。

本申请对地铁系统中发生的物理接触进行研究,针对地铁系统内部结构复杂、个体在系统内的出行行为难以识别的特点,提出了一种将个体与特定列车匹配的方法对个体出行进行划分,从而有助于更加准确地提取和度量个体之间的物理接触,通过与传染源个体发生物理接触的个体在地铁系统内的传播路径,分析地铁空间中的传染病扩散情况,提供了一种基于个体物理接触的传染病分析方法和系统。

附图说明

图1为本发明基于地铁空间的传染病扩散分析方法的流程图;

图2是乘客刷卡出站事件示意图;

图3是乘客匹配到特定列车示意图;

图4是传染病传播扩散示意图;

图5为本发明基于地铁空间的传染病扩散分析系统的硬件架构图。

具体实施方式

下面结合附图及具体实施例对本发明作进一步详细的说明。

参阅图1所示,是本发明基于地铁空间的传染病扩散分析方法较佳实施例的作业流程图。

步骤s1,根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻。在本实施例中,从地铁集团公司公布的第一班和最后一班列车的时刻表以及每条地铁线路的列车发车间隔计算得到列车到达和离开每个站点的时刻。具体而言:

首先,获取地铁站乘客及地铁运行的源数据。其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表。

在本实施例中,所述源数据包括深圳市2012年9月20个工作日的地铁刷卡数据、深圳市2012年9月地铁线路图、深圳市2012年9月地铁列车运营时刻表。所述地铁刷卡数据包括:卡片id、日期、时间戳、站点名称和类型;其中,所述类型包括:刷卡进站或刷卡出站。

然后,根据获取的地铁站乘客及地铁运行的源数据,推断详细的列车运行时刻表。根据从地铁集团公司公布的第一班和最后一班列车的时刻表以及每条地铁线路的列车发车间隔,推断列车到达和离开每个站点的时刻,对每辆列车进行编号。

步骤s2,根据上述地铁线路图和地铁刷卡数据推断个体乘客的出行路径。具体而言:

首先,对上述获取的源数据进行数据预处理。采用地铁刷卡数据,将连续两次进出站记录作为一次出行进行od匹配,得到od记录数据;对得到的od记录数据进行数据清洗:删除od记录数据中进出站相同的记录。

然后,给定一对od记录数据,结合地铁线路图,使用dijkstra(迪杰斯特拉)算法搜索时间最短路径来确定个体的出行路径(即经过的站点序列),并据此将个体出行分为:非换乘出行、单次换乘出行和多次换乘出行三类。

步骤s3,根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间。具体而言:

步骤s301:计算个体乘客在每个站点的进出站步行时间,所述进出站步行时间即为从刷卡闸机到站台的步行时间和从站台到刷卡闸机的步行时间,两个步行时间相同。

在本实施例中,如图2(1)所示,当列车m到达时,个体乘客从列车下车,从站台步行到刷卡闸机,使时间线中的刷卡出站事件相对频繁(如图2(2)所示)。在这一群个体乘客中,第一个刷卡出站的个体乘客没有在刷卡闸机前等待或者在站点内逗留,因此所述个体乘客从站台到刷卡闸机的步行时间可以代表站点的进出站步行时间。

采用dbscan聚类算法对个体乘客出站刷卡时间戳进行聚类。每个聚类簇对应于一列特定列车的到达,一个站点的进出站步行时间为聚类簇中最早的出站刷卡时间戳与在此之前最近的列车的到达时间戳的差值。由于每趟列车均可计算得到一个进出站步行时间,而一天内存在多趟列车,每个站点可得到多个进出站步行时间。采用箱线图法(异常值被定义为小于ql-1.5iqr或大于qu+1.5iqr的值。ql称为下四分位数,表示全部观察值中有四分之一的数据取值比它小;qu称为上四分位数,表示全部观察值中有四分之一的数据取值比它大;iqr称为四分位数间距,是上四分位数qu与下四分位数ql之差)剔除所得数据中的异常值,将其中的最小值作为该站点的进出站步行时间。

步骤s302:将非换乘个体乘客匹配到特定列车。根据出站刷卡时间戳减去出站站点的进出站步行时间计算下车时间戳,将此前最近到达该站点的列车作为其匹配列车。

在本实施例中,根据出站刷卡时间戳减去出站站点的进出站步行时间(即td-δsd)计算下车时间戳,将此前最近到达该站点的列车作为其匹配列车(如图3(1)所示)。通过这种方式,所有的非换乘个体乘客都可以匹配到特定的列车上。

步骤s303:将单次换乘个体乘客匹配到特定列车。以步骤s302的方法匹配换乘后的列车;根据进站刷卡时间戳加上进站站点的进出站步行时间计算换乘前的上车时间戳,将此后最近到达的列车作为其换乘前的列车。

在本实施例中,以步骤s302的方法匹配换乘后的列车(即列车m2);根据进站刷卡时间戳加上进站站点的进出站步行时间(即to+δso)计算换乘前的上车时间戳,将此后最近到达的列车(即列车m1)作为其换乘前的列车(如图3(2)所示)。通过这种方式,所有的单次换乘个体乘客都可以匹配到特定的列车上。

步骤s304:计算换乘站点的换乘时间。该站点从一条线路站台到另一条线路站台的换乘时间可以推断为换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值。同样,可以得到换乘时间的多个值,用箱线图法剔除异常值后,将数据中的最小值作为该换乘站从一条线到另一条线的换乘时间。

步骤s305:将多次换乘个体乘客匹配到特定列车。

以二次换乘为例,用步骤s303中的方法推断出个体乘客乘坐的第一列和最后一列列车(即m1和m3);考虑到换乘站1、2(即δf1和δf2)的换乘时间,认为在换乘站1换乘后发车、在换乘站2换乘前到达的列车是个体乘坐的中间列车(即m2)(如图3(3)所示)。通过这种方式,所有的多次换乘个体都可以匹配到特定的列车。

步骤s4,根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施。具体而言:

所述分析地铁空间内的传染病扩散情况是指,通过分析传染源个体及与其在同一地铁空间共现的个体频繁经过的站点、乘坐的列车模拟传染病的扩散情况;所述制定防控措施是指在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。

为了直观地展示传染病的传播过程,从地铁刷卡数据中选取两名具有代表性的个体,认为他们是传染病的携带者,可以感染附近的人群,即传染源个体。其中一位个体非常活跃,在地铁系统20天中遇到的其他个体数最多;另一位则非常不活跃,在同样时间里遇到的其他个体数最少。

计算得到由两名传染源个体引起的疾病传播情况,如图4所示,浅灰色点的大小代表两位个体在地铁站的出现频率,而深灰色点则代表在地铁系统中遇到两位传染源个体的其他个体的目的地站,即由传染源个体所带来的传染病的传播扩散情况。可以看到活跃个体(如图4(1)所示)带来了比非活跃个体(如图4(2)所示)更大空间范围和更高频次的传播。

结果直观显示了个体引起的传染病传播扩散的影响,有助于在适当的时候对目标地点、列车甚至个人采取有效的干预行动,如在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。

参阅图2所示,是本发明基于地铁空间的传染病扩散分析系统10的硬件架构图。该系统包括:计算模块101、推断模块102、匹配模块103、分析模块104。

所述计算模块101用于根据列车运行时刻表对每辆列车进行编号,计算得到所述列车到达和离开每个站点的时刻。在本实施例中,从地铁集团公司公布的第一班和最后一班列车的时刻表以及每条地铁线路的列车发车间隔计算得到列车到达和离开每个站点的时刻。具体而言:

首先,所述计算模块101获取地铁站乘客及地铁运行的源数据。其中,所述源数据包括:地铁刷卡数据、地铁线路图和地铁列车运营时刻表。

在本实施例中,所述源数据包括深圳市2012年9月20个工作日的地铁刷卡数据、深圳市2012年9月地铁线路图、深圳市2012年9月地铁列车运营时刻表。所述地铁刷卡数据包括:卡片id、日期、时间戳、站点名称和类型;其中,所述类型包括:刷卡进站或刷卡出站。

然后,所述计算模块101根据获取的地铁站乘客及地铁运行的源数据,推断详细的列车运行时刻表。根据从地铁集团公司公布的第一班和最后一班列车的时刻表以及每条地铁线路的列车发车间隔,推断列车到达和离开每个站点的时刻,对每辆列车进行编号。

所述推断模块102用于根据上述地铁线路图和地铁刷卡数据推断个体乘客的出行路径。具体而言:

首先,所述推断模块102对上述获取的源数据进行数据预处理。采用地铁刷卡数据,将连续两次进出站记录作为一次出行进行od匹配,得到od记录数据;对得到的od记录数据进行数据清洗:删除od记录数据中进出站相同的记录。

然后,给定一对od记录数据,所述推断模块102结合地铁线路图,使用dijkstra(迪杰斯特拉)算法搜索时间最短路径来确定个体的出行路径(即经过的站点序列),并据此将个体出行分为:非换乘出行、单次换乘出行和多次换乘出行三类。

所述匹配模块103用于根据推断出的个体乘客出行路径,将个体乘客匹配到细分的地铁空间。具体而言:

所述匹配模块103计算个体乘客在每个站点的进出站步行时间,所述进出站步行时间即为从刷卡闸机到站台的步行时间和从站台到刷卡闸机的步行时间,两个步行时间相同。

在本实施例中,如图2(1)所示,当列车m到达时,个体乘客从列车下车,从站台步行到刷卡闸机,使时间线中的刷卡出站事件相对频繁(如图2(2)所示)。在这一群个体乘客中,第一个刷卡出站的个体乘客没有在刷卡闸机前等待或者在站点内逗留,因此所述个体乘客从站台到刷卡闸机的步行时间可以代表站点的进出站步行时间。

采用dbscan聚类算法对个体乘客出站刷卡时间戳进行聚类。每个聚类簇对应于一列特定列车的到达,一个站点的进出站步行时间为聚类簇中最早的出站刷卡时间戳与在此之前最近的列车的到达时间戳的差值。由于每趟列车均可计算得到一个进出站步行时间,而一天内存在多趟列车,每个站点可得到多个进出站步行时间。采用箱线图法(异常值被定义为小于ql-1.5iqr或大于qu+1.5iqr的值。ql称为下四分位数,表示全部观察值中有四分之一的数据取值比它小;qu称为上四分位数,表示全部观察值中有四分之一的数据取值比它大;iqr称为四分位数间距,是上四分位数qu与下四分位数ql之差)剔除所得数据中的异常值,将其中的最小值作为该站点的进出站步行时间。

所述匹配模块103将非换乘个体乘客匹配到特定列车。根据出站刷卡时间戳减去出站站点的进出站步行时间计算下车时间戳,将此前最近到达该站点的列车作为其匹配列车。

在本实施例中,根据出站刷卡时间戳减去出站站点的进出站步行时间(即td-δsd)计算下车时间戳,将此前最近到达该站点的列车作为其匹配列车(如图3(1)所示)。通过这种方式,所有的非换乘个体乘客都可以匹配到特定的列车上。

所述匹配模块103将单次换乘个体乘客匹配到特定列车。匹配换乘后的列车后,根据进站刷卡时间戳加上进站站点的进出站步行时间计算换乘前的上车时间戳,将此后最近到达的列车作为其换乘前的列车。

在本实施例中,匹配换乘后的列车(即列车m2)后,根据进站刷卡时间戳加上进站站点的进出站步行时间(即to+δso)计算换乘前的上车时间戳,将此后最近到达的列车(即列车m1)作为其换乘前的列车(如图3(2)所示)。通过这种方式,所有的单次换乘个体乘客都可以匹配到特定的列车上。

所述匹配模块103计算换乘站点的换乘时间。该站点从一条线路站台到另一条线路站台的换乘时间可以推断为换乘后列车的发车时间戳和换乘前列车的到达时间戳的差值。同样,可以得到换乘时间的多个值,用箱线图法剔除异常值后,将数据中的最小值作为该换乘站从一条线到另一条线的换乘时间。

所述匹配模块103将多次换乘个体乘客匹配到特定列车。

以二次换乘为例,推断出个体乘客乘坐的第一列和最后一列列车(即m1和m3);考虑到换乘站1、2(即δf1和δf2)的换乘时间,认为在换乘站1换乘后发车、在换乘站2换乘前到达的列车是个体乘坐的中间列车(即m2)(如图3(3)所示)。通过这种方式,所有的多次换乘个体都可以匹配到特定的列车。

所述分析模块104用于根据个体匹配后的细分地铁空间,分析地铁空间内的传染病扩散情况,制定防控措施。具体而言:

所述分析地铁空间内的传染病扩散情况是指,通过分析传染源个体及与其在同一地铁空间共现的个体频繁经过的站点、乘坐的列车模拟传染病的扩散情况;所述制定防控措施是指在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。

为了直观地展示传染病的传播过程,从地铁刷卡数据中选取两名具有代表性的个体,认为他们是传染病的携带者,可以感染附近的人群,即传染源个体。其中一位个体非常活跃,在地铁系统20天中遇到的其他个体数最多;另一位则非常不活跃,在同样时间里遇到的其他个体数最少。

计算得到由两名传染源个体引起的疾病传播情况,如图4所示,浅灰色点的大小代表两位个体在地铁站的出现频率,而深灰色点则代表在地铁系统中遇到两位传染源个体的其他个体的目的地站,即由传染源个体所带来的传染病的传播扩散情况。可以看到活跃个体(如图4(1)所示)带来了比非活跃个体(如图4(2)所示)更大空间范围和更高频次的传播。

结果直观显示了个体引起的传染病传播扩散的影响,有助于在适当的时候对目标地点、列车甚至个人采取有效的干预行动,如在传染源个体活跃度高的列车及站点加强消毒措施,减少病毒通过传染源个体接触的表面二次传播的可能性。

虽然本发明参照当前的较佳实施方式进行了描述,但本领域的技术人员应能理解,上述较佳实施方式仅用来说明本发明,并非用来限定本发明的保护范围,任何在本发明的精神和原则范围之内,所做的任何修饰、等效替换、改进等,均应包含在本发明的权利保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1