一种拟真人群轨迹数据的生成方法

文档序号:35860328发布日期:2023-10-26 12:08阅读:27来源:国知局
一种拟真人群轨迹数据的生成方法

本发明属于计算机,具体涉及一种拟真人群轨迹数据的生成方法。


背景技术:

1、目前用于gps模拟数据生成的方法,往往需要事先获得大量本地的路网信息、公交车路线信息等,这需要额外的信息收集工作。cn110555256a发明专利申请公开了一种gps路线模拟数据生成方法及装置。该方法通过第三方地图软件得到预设起点至预设终点的导航路线;利用api接口获取已有gps点的坐标数据;根据预设车速、gps点的坐标数据的预设传输频率以及相邻两个已有gps点的坐标数据,生成导航路线中相邻两个已有gps点之间的附加gps点的坐标数据;由已有gps点的坐标数据和附加gps点的坐标数据组成预设起点至预设终点的gps路线模拟数据。该方法使用第三方地图软件获得相关信息的方法,避免了这种前述的困境。然而这种方法仅能生成单段的gps模拟数据,并不能模拟个体在一段时间内的所有移动行为(长达几天至几个月的时间范围)。此外,这些方法并不适用于传染病的研究。因为这些生成方法并不会生成模拟数据所代表个体的人口特征。而人口特征诸如年龄、性别等对于传染病的模拟、预测和分析的相关研究来说至关重要。


技术实现思路

1、本发明的目的就是提供一种拟真人群轨迹数据的生成方法,该方法除了能够生成符合真实路网的gps移动数据,还能生成与之对应的个体特征数据,提高模拟生成的可用性。

2、本发明方法具体是:

3、步骤(1)设定人群的基本属性和人群的移动模式;

4、所述的人群的基本属性,构成要素包括人群年龄值、性别分布值、针对特定传染病的疫苗接种比例、需要生成的个体数量值,每个构成要素均以数字形式进行设定;

5、所述的人群的移动模式,按照工作日或非工作日,将每一天分割为多个时间段,每个时间段大于等于1小时,时间分辨率为一小时;按照人群的基本属性,对每个时间段设定在人群在该时间段的所在场所类型、交通方式偏好值、出行距离;其中:

6、所在场所类型直接采用第三方地图软件所提供的场所分类数据;

7、交通方式偏好值pv为0~10的整数;

8、出行距离包括近距离、中距离、远距离三个等级。

9、步骤(2)生成所属人群的个体的基本属性,每个个体的基本属性包括个体年龄、个体性别、个体针对特定传染病是否接种疫苗。

10、步骤(3)根据设定的人群的移动模式获取地点信息:对于属于人群的每个个体,根据设定的所在场所类型、出行距离,利用第三方地图软件的api接口,获得符合条件的地点信息列表;从列表中随机选择一个场所,作为该个体在某个时间段内应该前往的场所地点;重复操作,为每个个体生成每个时间段的应该前往的场所地点。

11、步骤(4)将当前时间段的场所地点作为起始点,下一时间段的场所地点作为目的点,以个体为单位依次获得对应的导航路线坐标数据。

12、步骤(5)用到达时间信息更新当前时间,重复步骤(4),按照时间顺序依次进行判断,直至当前时间与设定的模拟结束时间相等;当一个个体的数据获取结束后,将当前时间重新设置为初始时间,并开始创建下一个体的路线坐标数据,直至所有个体的数据均已获得为止。

13、步骤(6)对路线坐标数据进行插值。

14、步骤(7)数据的整合与保存;以个体为单位,按时间顺序,遍历所有插值后的gps数据点,附加个体的基本属性,保存为excel文件,即生成整个人群的gps模拟数据集;每条gps模拟数据集记录包括每个时间点的位置信息,由此拟合成轨迹数据。

15、进一步,步骤(1)中所述的交通方式偏好值pv用于计算交通采用非步行交通方式的概率p(d)=f(pv),pv值等于10的时候,p(d)≈1,pv值等于0的时候,p(d)=0;p(d)=0表示必定采用步行交通方式,p(d)=1表示必定采用非步行交通方式,f(·)表示计算函数。

16、再进一步,步骤(2)具体是:

17、根据设定的人群年龄值的最大值和最小值,在此范围内取随机数,获得的随机数即为该个体年龄;

18、根据设定的性别分布值0~10,对每个个体在0~10内取均匀的随机值,随机值大于设定的性别分布值时,个体被设定为女性,否则为男性;

19、根据设定的针对特定传染病的疫苗接种比例0~10,对每个个体在0~10内取均匀的随机值,随机值大于设定的针对特定传染病的疫苗接种比例时,个体被设定为接种了针对特定传染病的疫苗,否则为未接种;

20、根据设定的需要生成的个体数量值,对每个需要生成的个体均执行以上操作,生成所属人群的个体的基本属性。

21、更进一步,步骤(4)具体是:

22、首先将当前时间设定为模拟起始时间,将当前时间所在的时间段的场所地点设置为设定的移动模式的第一个地点;

23、然后,将当前时间移动到下一个时间段,判断上当前时间所在的时间段的场所地点与上一个时间段的场所地点是否相同,如果相同,意味着当前时间并不需要移动,只需要更新当前时间至下一时间段,并再次重复前述操作;

24、如果场所地点不同,则说明此时个体需要进行移动,计算本次移动交通采用非步行交通方式的概率d为两个时间段的场所地点之间的距离,d为设定的阈值,α为比例系数;

25、对每次移动在设定的p(d)=0~1内取均匀的第一次随机值,如果第一次随机值大于p(d)′则认为该次移动采用第一种交通方式;如果第一次随机值小于等于p(d)′,则再次在设定的p(d)=0~1内取均匀的第二次随机值,如果第二次随机值大于p(d)′,则认为该次移动采用第二种交通方式;如果第二次随机值小于等于p(d)′,则在设定的p(d)=0~1内取均匀的第三次随机值,如果第三次随机值大于p(d)′,则认为该次移动采用第三种交通方式,如果小于等于p(d)′,则认为该次移动采用第四种交通方式;第一、二、三、四种交通方式为不同的交通方式,分别为自驾车、公共交通工具、骑行和步行中的一种;

26、根据交通方式,向第三方地图软件的api发送导航请求,获得路线坐标数据以及路程长度、到达时间信息。

27、又进一步,步骤(6)具体是:

28、根据步骤(4)获得的路线坐标数据以及路程长度、到达时间信息,得到个体在本次移动的平均速度v;设定gps模拟数据的采样时间间隔为t=3~5s,计算插值点数量n,插值点间距n=1,2,…,n-1;

29、在第三方地图软件生成的路线坐标数据中的相邻两个坐标点之间按照间距d(n)插入新的坐标点(x1,y1)和(x2,y2)为第三方地图软件生成的路线坐标数据中的相邻两个坐标点的坐标;对在第三方地图软件生成的路线坐标数据中的每个相邻两个坐标点均执行上述操作,即可完成插值操作。

30、本发明方法通过设定时间段的形式定义人群的移动模式,人群的移动模式包括工作日和非工作日中,各个时间段内的所在场所类型、交通方式偏好值、出行距离。并通过第三方地图软件提供的api,根据设定的人群的移动模式,发送对应的请求以获得地点信息以及路线坐标数据,并按照gps数据格式对路线坐标数据进行插值操作并保存数据集。本发明提出的生成方法可以方便地生成具有不同移动模式的人群移动数据集,灵活性高,并且不会造成隐私泄露问题,同时成本也相当低廉,有助于研究者的使用。本发明方法可以方便地生成人群移动数据,除了人群移动数据本身外,生成的模拟数据还包括移动数据所代表个体的人口特征,这往往是相关研究所需要的。本发明方法能够让使用者方便地以时间段的形式设定人群的移动模式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1