通过电信网络的聚合数据后验估计一个或多个人群中的人数的方法和系统与流程

文档序号:13543869阅读:255来源:国知局

本发明涉及人群计数,即,涉及用于计数或估计人群中的人数的技术。在本说明书中,为了本发明的目的,“人群”是指聚集在一定(certain)地点的一定数量的人的聚集,例如为了参加具有最不同性质的公共事件或集会(happenings)(例如(并非穷举)直播电视节目、艺术/娱乐表演、文化展览、戏剧演出、体育比赛、音乐会、电影、示威)和/或为了参观特定感兴趣的地方(诸如博物馆、纪念碑、建筑等)。

特别地,本发明涉及利用由无线或移动电信网络提供的信息的人群计数技术。



背景技术:

在城市规划、活动管理(例如,运输系统管理和紧急情况管理)以及旅游和本地营销的任务中,了解以下的人的数量是有用的:这些人在一定地点或感兴趣区域(简称aoi,例如,建筑物,诸如例如体育场或剧院或电影院、其周围环境、城市或城镇或乡村的广场或(一条或多条)街道、街区等)处聚集,例如,因为他们参加了在感兴趣区域内发生的比如节目的公开集会(例如,与文化、娱乐、政治或体育有关)和/或为了参观感兴趣区域内的感兴趣的地方(也称为兴趣点)。

在与公开集会相关的人的一个或多个聚集的情况下(虽然以下考虑也适用于与兴趣点相关的人的聚集),这种了解允许例如更有效地规划后续的相同类型的公开集会。特别地,这种了解允许更有效地规划和管理与将来可能发生的类似公开集会(诸如,例如,在体育场定期发生的体育比赛)直接或间接相关的资源和活动(诸如基础设施、运输系统和安全)。此外,从商业角度来看,这种了解允许更好地管理旨在促进将来可能发生的类似事件的营销活动。

如今,移动通信设备(以下称为移动电话或ue,包括蜂窝电话、智能电话、平板电脑等)已经在许多国家的人口中得到彻底的扩散,并且移动电话所有者几乎始终携带他们的移动电话与他们在一起。由于移动电话与移动电话网络的多个基站通信,并且每个基站覆盖(即,服务)移动通信服务提供商(例如移动电话网络所有者或虚拟移动电话服务提供商)已知的一个或多个预定服务区域或小区,因此移动电话结果被证明是作为跟踪设备的最佳候选者,该跟踪设备用于收集对识别参加一个或多个公开集会的人数有用的数据。

在本领域中,已经提出了许多系统和方法以便收集关于个人的用户装备(ue,例如,移动电话、智能电话、平板电脑等)连接到移动电话网络(例如,用于执行语音呼叫或发送文本消息)的时间和地点的信息,并且使用这种收集到的信息来得出与某些公开集会具有多少参加者有关的信息。

例如,f.calabrese,f.c.pereira,g.dilorenzo,l.liu,c.ratti,“thegeographyoftaste:analyzingcell-phonemobilityinsocialevents”,pervasivecomputing,lncs6030,springer,2010,第22-37页公开了特殊事件期间人群移动性的分析。近100万部手机踪迹已经被分析,并与它们的社交事件的目的地相关联。已经观察到,参加事件的人的来源与事件的类型密切相关,并且对城市管理具有影响,因为对添加的(additive)流动的了解可以是关于事件管理和拥塞减轻做出决定的关键信息。

traag,v.a.;browet,a.;calabrese,f.;morlot,f.,“socialeventdetectioninmassivemobilephonedatausingprobabilisticlocationinference”,2011ieeethirdinternationalconferenceonprivacy,security,riskandtrust(passat)和2011ieeethirdinternationalconferenceonsocialcomputing(socialcom),2011年10月9日至11日,第625、628页专注于不寻常的大规模的人的聚集(即,不寻常的社交事件)。基于贝叶斯地点推理框架,介绍了在大规模移动电话数据中检测这类社交事件的方法。更具体而言,还开发了决定谁正在参加事件的框架。对于几个示例演示了该方法。最后,讨论了用于事件检测的一些可能的未来方法,以及对检测到的社会事件的一些可能的分析。

2006年francescocalabrese,carloratti,“realtimerome”,networksandcommunicationsstudies20(3-4),第247-258页公开了在意大利威尼斯第十届国际建筑展览会(internationalarchitectureexhibition)上呈现的实时罗马(realtimerome)项目。实时罗马项目是收集和处理由电信网络和运输系统提供的数据以便理解罗马日常生活模式的城市范围实时监视系统的第一示例。观察城镇中的实时日常生活成为理解现在和预测未来城市环境的手段。

可从http://mox.polimi.it获得的f.manfredini,p.pucci,p.secchi,p.tagliolato,s.vantini,v.vitelli,“treeletdecompositionofmobilephonedataforderivingcityusageandmobilitypatterninthemilanurbanregion”,mox-reportno.25/2012,mox,departmentofmathematics“f.brioschi”,plitecnicodimilano公开了旨在识别关于移动电话使用的隐藏模式的有用信息的地理统计学无监督学习技术。这些隐藏的模式涉及与个人移动性有关的、城市在时间和空间上不同使用,概述了该技术用于城市规划社区的潜力。该方法允许获得报告一些活动对所记录的厄兰(erlang)数据的特定影响的参考基础、以及显示每个活动对本地erlang信号的贡献的一组映射。已经选择了对于解释特定移动性和城市使用模式(通勤、夜间活动、住宅分布、非系统移动性)有重要意义的结果,并且已在米兰城市地区规模从城市分析和规划视角对它们的重要性及其解释进行了测试。

2012年6月的第二届普及城市应用研讨会(workshoponpervasiveurbanapplications,purba),ramoncaceres,jamesrowland,christophersmall和simonurbanek,“exploringtheuseofurbangreenspacethroughcellularnetworkactivity”公开了使用蜂窝网络活动的匿名记录来研究城市地区中的人口密度的时空模式。该文章呈现了这一努力的愿景和一些早期的成果。首先,描述了纽约大都市区域的六个月的活动的数据集。其次,呈现了用于估计网络覆盖区域的技术。第三,描述了分析在那些区域内的活动量改变所用的方法。最后,呈现了关于中央公园周围人口密度改变的初步结果。



技术实现要素:

申请人已经观察到,一般而言,本领域已知的方法和系统提供了不令人满意的结果,因为它们不能确定(或者具有有限的能力确定)ue所有者处于已经举行一个或多个公开集会的感兴趣区域(aoi)中是出于参加该集会的原因还是出于其它原因(例如,由于ue所有者居住在该感兴趣区域附近或该感兴趣区域内或者ue所有者在该感兴趣区域附近或该感兴趣区域内有业务)。此外,由已知解决方案提供的结果受到被选择用于分析在一个或多个公开集会处的参与者数量的感兴趣区域的尺寸的强烈影响。换句话说,如果感兴趣区域具有大的尺寸,那么实际上不是人群的一部分的、一定数量的ue所有者将被考虑在人群中的人数的评估中。相反,如果感兴趣区域具有小的尺寸,那么实际上是人群的一部分的、一定数量的ue所有者将被排除在对人群中的人数的评估之外。

因此,基于由本领域已知方法和系统获得的结果对资源和活动(以上提到的类型)进行随后的规划和管理将由于其有限的精确度而实现有限的效率。

而且,基于使用关于每个ue在连接到移动电话网络时所占据的位置的信息(由服务于该ue的移动电话网络收集的信息)的已知方法和系统可能侵犯ue的所有者的隐私。

事实上,这样的信息允许知道ue的所有者的习惯、惯例(routines)和日常经常出入的地方(例如,家和工作地)。

因而,为了保护ue的所有者的隐私,这种信息的使用因此通常受到许多国家当局颁布的法律的高度限制(到被禁止的程度)。

在这方面,为了规避隐私问题的、本领域中已知并用于匿名化关于ue的所有者的信息的“匿名化”技术不能对其隐私进行令人满意的保护。

一般而言,匿名化技术包括利用加密标识符遮蔽与ue和/或ue的所有者相关联的任何标识符(诸如像国际移动装备身份–imei,国际移动订户身份–imsi,或移动订户isdn号码)。

不过,对于经多天收集的信息的分析可能侵犯ue所有者,因为它无论如何都允许通过分析如此获得的关于ue的所有者的习惯、家和工作地以及可能ue所有者自己的敏感信息来识别这种敏感信息。

因此,本申请人已经处理了设计适于克服影响现有技术解决方案的问题的系统和方法的问题。

本申请人已经发现,可以基于在一个或多个公开集会的过程期间和在一个或多个公开集会之前的一定天数的与ue相关的数据来确定最佳感兴趣区域的尺寸。

而且,申请人已经发现,可以通过利用关于至少一个移动电话网络的使用的聚合数据来保护ue的所有者的隐私。

例如,本发明可利用的聚合数据包括在一个或多个时间间隔内由移动电话网络服务的ue的数量(即,不提供可能侵害ue的所有者隐私的关于单个ue的信息)。

优选地,通过使用关于移动电话网络的分开的一个或多个服务区域的聚合数据,可以以高精度确定最佳感兴趣区域的尺寸,然后确定聚集在该最佳感兴趣区域中的人数。

应当注意的是,在最佳区域中在一个或多个时间间隔内由移动电话网络服务的ue的数量的了解一般不与人群中的人数对应。实际上,在最佳区域中在一个或多个时间间隔内由移动电话网络服务的ue的数量包括由出于除在人群中聚集之外的原因(例如,工作,人们仅仅是穿过最佳区域)而在最佳区域中的人所拥有的ue。

申请人还发现,可以基于对聚集期间和人聚集发生当天之前数天期间涉及(referedto)移动电话网络使用的聚合数据的分析来区分在最佳区域内人群中的人数与在最佳区域内但不在人群中的人数。

特别地,本发明的一方面提出了估计在一天gn的观察时间间隔[tsn,ten]期间在感兴趣区域聚集的人数an的方法,其中所述感兴趣区域由感兴趣区域中心c和感兴趣区域半径ra限定,并且由具有多个通信站的移动电信网络覆盖,通信站中的每个适于管理移动电信网络在其上提供服务的被覆盖的地理地区中一个或多个被服务区域中的用户装备的通信,该方法包括步骤:a)限定感兴趣区域半径的多个计算出的半径值rk,并且对于每个计算出的半径值:b)基于关于移动通信网络的使用的聚合数据uq,t计算在感兴趣区域内在该天gn的观察时间间隔[tsn,ten]期间已经由移动通信网络服务的用户装备的第一数量unk;c)基于关于移动通信网络的使用的聚合数据uq,t计算在感兴趣区域内在该天之前预定数量p的先前天中的每一天gpn的观察时间间隔[tsn,ten]期间已由移动通信网络服务的用户装备的第二数量upnk;d)将用户装备的第一数量unk和用户装备的第二数量upnk组合,用于获得统计量znk;e)如果统计量znk达到一定阈值zth,那么检测到人的聚集的发生;f)将感兴趣区域半径ra的最佳半径值ro计算为其中检测到人的聚集的计算出的半径值rk的平均值;g)估计在具有等于最佳半径值ro的感兴趣区域半径rs的感兴趣区域内聚集的人数an。

在从属权利要求中阐述本发明的优选特征。

在本发明的一个实施例中,关于移动通信网络的使用的聚合数据uq,t包括被服务的用户装备流量负载的数量、语音呼叫的数量、所发送的sms的数量和/或优选地在移动通信网络的通信站中的每个内交换的二进制数据的量。

在本发明的一个实施例中,该方法还包括对于每个计算出的半径值:i)将被覆盖的地理地区细分为多个表面元素,以及j)接收涉及所述表面元素中的每一个的、关于移动通信网络的使用的多个聚合数据uq,t。

在本发明的一个实施例中,接收用于所述表面元素中的每一个的关于移动通信网络的使用的多个聚合数据的步骤j)包括接收聚合数据的集合{uq,t},聚合数据的集合{uq,t}中的每个聚合数据uq,t涉及相应的参考时间间隔dt,该参考时间间隔是期间收集聚合数据uq,t的获取周期t的一部分。

在本发明的一个实施例中,基于关于移动通信网络的使用的聚合数据uq,t计算在感兴趣区域内在天gn的观察时间间隔[tsn,ten]期间已由移动通信网络服务的用户装备的第一数量unk的步骤b)包括基于涉及被包括在天gn的观察时间间隔[tsn,ten]内的相应参考时间间隔dt的聚合数据的集合{uq,t}来计算用户装备的第一数量unk,并且其中基于关于移动通信网络的使用的聚合数据uq,t来计算在感兴趣区域内在该天gn之前的预定数量p的先前天中的每一天gpn的观察时间间隔[tsn,ten]期间已由移动通信网络服务的用户装备的第二数量upnk的步骤c)包括基于涉及被包括在天gn之前的预定数量p的先前天中相应的先前天gpn的观察时间间隔[tsn,ten]内的相应参考时间间隔dt的聚合数据uq,t的集合{uq,t}来计算用户装备的每个第二数量unpk。

在本发明的一个实施例中,可以将用户装备的第一数量unk和/或用户装备的每个第二数量upnk计算为被包括在感兴趣区域中的相关表面元素中的用户装备的总数量、平均数量或最大数量。

在本发明的一个实施例中,该方法还包括步骤k):识别多个表面元素中的数个相关表面元素,其中所述相关表面元素至少部分地叠加在感兴趣区域上。

在本发明的一个实施例中,如果表面元素验证了以下条件,那么它被识别为相关表面元素:

dist(c,b)≤|rs+rk|,

其中c是感兴趣区域的中心,b是被服务的表面元素的中心,dist(c,b)是感兴趣区域的中心c与表面元素的中心b之间的地理距离,rs是表面元素的半径,并且rk是计算出的半径值。

在本发明的一个实施例中,组合用户装备的第一数量unk和用户装备的第二数量upnk用于获得统计量znk的步骤d)包括:组合先前天gpn中的每一天用户装备的第二数量upnk,以便确定平均用户装备数量μnk和用户装备数量标准偏差σnk。

在本发明的一个实施例中,组合用户装备的第一数量unk和用户装备的第二数量upnk用于获得统计量znk的步骤d)还包括:将统计量计算为:

znk=(unk-μnk)/σnk,

其中unk是第一用户装备数量,μnk是平均用户装备数量,并且σnk是用户装备数量标准偏差。

在本发明的一个实施例中,多个计算出的半径值rk在从最小半径值rmin到最大半径值rmax的范围内,每个计算出的半径值与下一个计算出的半径值分开迭代宽度δ。

在本发明的一个实施例中,估计在具有等于最佳半径值ro的感兴趣区域半径rs的感兴趣区域内聚集的人数an的步骤g)包括:l)在细分被覆盖的地理地区的表面元素之中识别数个相关表面元素,其中所述相关表面元素是至少部分地叠加在具有等于最佳半径值ro的感兴趣区域半径rs的感兴趣区域上的表面元素。

在本发明的一个实施例中,如果表面元素验证了以下不等式,那么它被识别为相关表面元素:

dist(c,b)≤|rs+r0|,

其中c是感兴趣区域(107)的中心,b是被服务区域的中心,dist(c,b)是感兴趣区域的中心c与表面元素的中心b之间的地理距离,rs是表面元素的半径,并且ro是最佳半径值。

在本发明的一个实施例中,估计在具有等于最佳半径值ro的感兴趣区域半径rs的感兴趣区域内聚集的人数an的步骤g)还包括:基于关于移动通信网络的使用的聚合数据uq,t将用户装备的第三数量un|aoi计算为在时间间隔[tsn,ten]期间被包括在具有等于最佳半径值ro的感兴趣区域半径rs的感兴趣区域中的相关表面元素内所包括的用户装备的数量。

在本发明的一个实施例中,计算第三用户装备数量包括基于涉及被包括在天gn的观察时间间隔[tsn,ten]内的相应参考时间间隔dt的聚合数据的集合{uq,t}来计算用户装备的第三数量un|aoi。

在本发明的一个实施例中,估计在具有等于最佳半径值的感兴趣区域半径rs的感兴趣区域内聚集的人数an的步骤g)还包括:基于关于移动通信网络的使用的聚合数据uq,t来将用户装备的第四数量upn|aoi计算为对于天gn之前的预定数量p的先前天中的每一天gpn被包括在具有等于最佳半径值ro的感兴趣区域半径rs的感兴趣区域中的相关表面元素内所包括的用户装备的数量。

在本发明的一个实施例中,计算用户装备的第四数量upn|aoi包括基于涉及在天gn之前预定数量p的先前天中相应先前天gpn的观察时间间隔[tsn,ten]内所包括的相应参考时间间隔dt的聚合数据的集合{uq,t}来计算用户装备的每个第四数量upn|aoi。

在本发明的一个实施例中,可以将用户装备的第三数量un|aoi和/或用户装备的每个第四数量upn|aoi计算为被包括在具有等于最佳半径值ro的感兴趣区域半径rs的感兴趣区域中的相关表面元素中的用户装备的总数量、平均数量或最大(峰)数量。

在本发明的一个实施例中,估计在具有等于最佳半径值ro的感兴趣区域半径rs的感兴趣区域内聚集的人数an的步骤g)还包括:组合先前天中的每一天的用户装备的第四数量upn|aoi,以便确定另外的平均用户装备数量μn|aoi,该另外的平均用户装备数量μn|aoi提供在任何天的所考虑的观察时间间隔[tsn,ten]期间通常被包括在具有等于最佳半径值ro的感兴趣区域半径rs的感兴趣区域内的平均人数的指示。

在本发明的一个实施例中,估计在具有等于最佳半径值ro的感兴趣区域半径rs的感兴趣区域内聚集的人数an的步骤g)还包括:组合用户装备的第三数量un|aoi和另外的平均用户装备数量μn|aoi,以便获得在具有等于最佳半径值的感兴趣区域半径的感兴趣区域内聚集的人数an。

在本发明的一个实施例中,组合用户装备的第三数量un|aoi和另外的平均用户装备数量μn|aoi包括从第三用户装备数量un|aoi中减去该另外的平均用户装备数量μn|aoi。

在本发明的一个实施例中,在一天的观察时间间隔期间人在感兴趣区域的聚集包括在相应天gn的观察时间间隔[tsn,ten]期间人在感兴趣区域的多次聚集,该方法还包括步骤:h)对于人的每次聚集迭代步骤b)至e),并且其中将感兴趣区域半径rs的最佳半径值ro计算为其中检测到人聚集的计算出的半径值rk的平均值的步骤f)包括:将感兴趣区域半径rs的最佳半径值ro计算为通过在具有等于计算出的半径值rk的感兴趣区域半径rs的感兴趣区域内的人的检测到的聚集的次数dsk加权的计算出的上述半径值rk的平均值,所述检测到的人的聚集的次数dsk是通过迭代步骤e)确定的人的聚集的总和。

在本发明的一个实施例中,对于人的多次聚集中的人的每次聚集,迭代估计在具有等于最佳半径值的感兴趣区域半径的感兴趣区域内聚集的人数an的步骤g)。

本发明的另一方面提出了与无线电信网络耦合以用于估计在感兴趣区域处聚集的人数an的系统。该系统包括:适于处理从移动电话网络检索(retrieve)的数据的计算引擎、适于存储关于用户装备和移动电话网络之间的交互的数据、由计算引擎生成的计算结果以及可能由系统生成的和/或提供给系统的任何处理数据的存储库(repository)、以及可操作用于修改由计算引擎使用的参数和/或算法和/或访问存储在存储库中的数据的管理员接口。而且,该系统还包括存储被配置用于通过系统实现以上方法的软件程序产品的存储器元件。

在本发明的一个实施例中,系统还包括至少一个用户接口,其适于接收来自系统的用户的输入,以及向系统的用户提供输出,用户包括由系统提供的服务的一个或多个外部计算系统订户和/或一个或多个人。

根据本发明的解决方案的优点之一在于它是计算上简单的,仅涉及计数和代数运算的操作。

附图说明

通过阅读仅仅作为非限制性示例提供的、要结合附图阅读的本发明的实施例的以下详细描述,将更好地理解根据本发明的解决方案的这些和其它特征及优点,其中:

图1是根据本发明的实施例的人群估计系统的示意表示;

图2a-2e是根据本发明的实施例的表面元素可以采取的示例性形状;

图3a-3b是根据本发明的实施例的、被细分为表面元素的对应集合中的、与移动通信网络相关联的覆盖地理地区的示例;

图4a-4e是根据本发明的实施例的、待确定的aoi可以采用的示例性形状;

图5a-5d是根据本发明的实施例的、其中被覆盖的地理地区被细分的表面元素当中的相关表面元素,以及

图6a-6c是根据本发明的实施例的公开集会评估算法的示意流程图。

具体实施方式

参考附图,图1是根据本发明的示例性实施例的在下文中简单地表示为系统100的人群估计系统的示意表示。

下面描述的人群估计系统和方法允许执行对例如为了参加一个或多个具有最不同性质的公开集会(例如(并非穷举)直播电视节目、艺术/娱乐表演、文化展览、戏剧演出、体育比赛、音乐会、电影、示威等)而聚集的人群中的人数的估计。

此外,正如将清楚地理解的,下面描述的人群估计系统和方法还允许对为了参观特定感兴趣的地方(诸如像博物馆、纪念碑、历史建筑等)而聚集的人群中的人数执行估计。

系统100与移动通信网络105(诸如(2g、3g、4g或更高代)移动电话网络)耦合。

移动通信网络105能够在被覆盖的地理地区中向请求通信资源(例如,可用的通信带宽的一部分)的用户装备(以下称为ue)(例如,移动电话、智能电话、具有2g-3g-4g连接的平板电脑等)提供该通信资源(图1中未详细描述,但在下文中参考图3a和图3b描述)。换句话说,被覆盖的地理地区内的ue可以由移动通信网络105服务。

在本发明的一个实施例中,被覆盖的地理地区可以包括由移动通信网络105覆盖(即,服务)的整个地域(territory),但是在本发明的其它实施例中,可以考虑仅包括由移动通信网络105覆盖的整个地域的一部分的被覆盖的地理地区。

移动通信网络105包括部署在被覆盖的地理地区内的多个(即,两个或更多个)通信站105a(例如,移动电话网络的无线电基站)。

每个通信站105a适于管理一个或多个被服务区域或小区105b中的ue(未示出,诸如像移动电话)的通信(在所述示例中,每个通信站105a服务三个小区)。

因而,被覆盖的地理地区包括移动通信网络105的多个小区105b的区域,例如在本发明的一个实施例中,移动通信网络105的所有小区105b的区域的总和构建(buildup)被覆盖的地理地区。

不同的是,图1中被示意为点划线内的区域107的(地理)感兴趣区域(简称为aoi)107在移动通信网络105的一个或多个小区105b上延伸。aoi107是人们例如为了参加一个或多个公开集会而聚集在人群中的区域,并且该区域的范围由本发明的人群估计算法确定(如下所述)。

系统100被配置为从移动通信网络105接收在一个或多个参考时间间隔内关于移动通信网络105的使用的聚合数据(如下文所述)。

如本公开中使用的,术语‘聚合数据’指示关于移动通信网络105的操作的数据,诸如例如被服务的ue的数量、流量负载、语音呼叫的数量、所发送的sms的数量、所交换的二进制数据的量等。聚合数据通常由管理移动通信网络105的运营商使用,用于分析利用移动通信网络105的资源(例如,带宽和/或计算能力)的一般趋势或值(例如,被服务的ue的数量随时间的改变)而不识别与移动通信网络105交互的每个单个ue(以及因此ue的所有者)。

特别地,聚合数据不包括由移动通信网络105服务的ue的任何标识符,因此不能从由移动通信网络105提供的聚合数据获得关于ue所有者身份、习惯或经常出入的地方(诸如像家和工作地)的指示,从而确保ue所有者的隐私。

在本发明的一个实施例中,由系统100从移动通信网络105获取的聚合数据包括关于ue的数量的指示,即,还指示位于被覆盖的地理地区中的个人(ue所有者)的数量。

刚刚描述的被覆盖的地理地区包括aoi107。

aoi107(在下文中进一步描述)一般可以包括吸引相应人群的一个或多个公开集会发生的核心地方(例如,体育场、剧院、城市广场等)以及可能的该核心地方的周围(例如,附近的停车场、附近的街道、附近的运输站等)。

应当注意的是,由于aoi107被包括在移动通信网络105的被覆盖的地理地区中,因此aoi107内的ue可以由移动通信网络105服务。

优选地,由系统100从移动通信网络105接收的聚合数据包括由移动通信网络105服务的ue的数量的指示。

更优选地,由系统100从移动通信网络105接收的聚合数据包括在被覆盖的地理地区的多个子部分或表面元素(下面描述)中由通信网络105服务的ue数量的指示。例如,每个表面元素可以包括移动通信网络105的小区105b中的一个、一组两个或更多个小区105b、和/或部分小区105b的部分(例如,在本发明的一个实施例中,表面元素可以被成形为具有150m的边的正方形,因此小区105b中的每一个包括多于一个表面元素,尤其是在其中小区105b相对于城市区域中的小区105b通常具有更大范围的城市外区域中)。

一般而言,移动通信网络105的每个通信站105a适于与位于由这种通信站105a服务的小区105b中的一个内的任何ue交互(例如,在电源接通/断开时、在地点区域更新时、在来电/去电呼叫时、在发送/接收sms和/或mms时、在互联网访问时等)。在下文中,ue和移动通信网络105之间的这种交互将一般地被表示为事件ei(i=1,...,i;其中i是整数)。

因此,可以通过简单地计数与移动通信网络105具有至少一次交互的ue的数量来计算包括ue的数量的指示的聚合数据。换句话说,聚合数据包括以下ue的数量的指示:该ue产生与在移动通信网络105的相应小区105b上提供服务的通信站105a中的一个的至少一个事件ei。

可替代地,ue的数量的指示可以基于由移动通信网络105经历的流量负载。实际上,为了被执行,每个事件ei需要由移动通信网络105管理的通信资源的一部分(例如,通信带宽的部分),即,每个事件ei产生一定量的流量负载。因而,聚合数据优选地基于流量负载除以平均ue流量负载(即,由与移动通信网络105相关联的每个ue生成的平均流量负载)来提供对ue的数量的估计。

在本公开中,假设聚合数据由移动通信网络105根据移动通信网络105收集、处理和提供这种聚合数据的能力而周期性地提供,例如,在预定的参考时间间隔过去时(例如,每隔一定数量的分钟、小时、每天或每周)提供。

例如,在本发明的一个实施例中,聚合数据由移动通信网络105以等于或小于十五(15)分钟的周期性来收集(即,参考时间间隔具有每个十五分钟的持续时间),这是当前移动通信网络的计算能力可持续(sustainable)的周期性。

不过,移动通信网络105可以被配置为异步地提供聚合数据或者,可替代地,聚合数据可以由与移动通信网络105相关联(用于接收关于移动通信网络105的操作的数据)并与系统100相关联(用于提供聚合数据)的第三处理模块提供,而不背离本发明的范围。系统100包括被配置为处理从移动通信网络105检索的聚合数据的计算引擎110,以及被配置为存储从移动通信网络105接收的聚合数据、由计算引擎110生成的计算结果以及可能的由系统100生成和/或提供给系统100的任何处理数据(通常以二进制格式)的存储库115(诸如数据库、文件系统等)。系统100设有被配置为并可操作以修改由计算引擎110使用的算法和/或参数、和/或访问存储在存储库115中的数据的管理员接口120(例如,计算机)。

优选地,系统100包括适于从系统100的用户接收输入和向系统100的用户提供输出的一个或多个用户接口125(例如,用户终端、在连接到系统100的远程终端上运行的软件)。如在本公开中使用的,术语“系统的用户”可以指一个或多个人和/或指作为由系统100提供的服务的订户并且使得能够访问系统100的第三方的外部计算系统(诸如计算机网络,未示出)--例如,依据与系统100的服务提供商所有者签订合同,并且与由通过管理员接口120操作的系统100的管理员拥有的访问权限相比,通常具有对系统100的减少的访问权限。

应当认识到的是,系统100可以以任何已知的方式实现;例如,系统100可以包括具有物理类型(例如,具有实现计算引擎110和存储库115的一个或多个主机器,该主机器连接到实现管理员和用户接口120和125的其它机器)或者虚拟类型(例如,通过在计算机网络中实现一个或多个虚拟机)中的任何一种的单个计算机或分布式计算机的网络。

优选地,计算引擎110处理由存储在系统110的存储器元件110a(例如,被包括在图1的示例中的计算引擎110中)中的软件程序产品实现的人群估计算法(在下文中描述),但是软件程序产品也可以存储在存储库115中(或者在系统100中提供的任何其它存储器元件中)。

在操作中,可以由系统100从移动通信网络105连续检索聚合数据。例如,聚合数据可以在生成时以某种“压入(push)”的形式从移动通信网络105传送到系统100。

可替代地,聚合数据可以由移动通信网络105以第一周期性(例如,每15分钟)收集,然后以比第一周期性低的第二周期性(例如,每24小时)或者仅在由系统100请求时被打包并传送到系统100。

从移动通信网络105检索的聚合数据优选地存储在存储库115中,在存储库115中它们被使得可用于计算引擎110以进行处理。

根据由系统管理员(通过管理员接口120)提供的指令(例如存储在存储库115中)以及可能根据由用户(通过用户接口125)提供的指令来处理聚合数据。最后,计算引擎110通过用户接口125向用户提供对聚合数据执行的处理的结果,并且可选地将这种处理结果存储在存储库115中。

还应当注意的是,本公开中描述的方法可以通过使用任何数据源(例如,由wifi、wimax、蓝牙网络中的一个或多个或其与移动电话网络的组合提供)来实现,从该数据源可以获得可以与预定区域(例如,表面元素或aoi107)内的人数相关的聚合数据。

现在转到图2a-图2e,它们是与移动通信网络105相关联的被覆盖地理地区(即,移动通信网络105能够服务于ue的被覆盖的地理地区)的表面元素205可以根据本发明的实施例进行建模的示例性形状。

为了本发明的目的,由移动通信网络105覆盖的地理地区的每个表面元素205可以被建模为具有相应的表面中心b和相应的表面半径rs的表面(如图2a中所示)。

根据本发明的实施例,一般而言,表面元素205的表面中心b和表面半径rs与一个或多个通信站105a的地理位置或移动通信网络105的小区105b的位置不相关。

如前面所提到的,表面元素205可以在移动通信网络105的一个或多个小区105b上延伸,或者相反地,表面元素205可以小于移动通信网络105的小区105b。

应当注意的是,表面元素205不限于盘状形状(disk-likeshape),事实上,表面元素205可以具有优选地但不是严格必须规则的多边形(regularpolygon)的形状。在这种情况下,表面中心b与多边形的质心(或形心(centroid))对应,而表面半径rs与连接多边形的质心(即,表面中心b)和多边形的顶点(如图2b和2d中所示)或多边形的边的中点(如图2c和2e中所示)的线段(segment)对应。可替代地,可以通过voronoi细分图(voronoitessellationdiagram)来建模移动通信网络105,其中每个voronoi小区与由移动通信网络105覆盖的地理地区的表面元素205对应(因为voronoi细分图在本领域中是众所周知的,在这里不进一步讨论)。

与移动通信网络105相关联的覆盖地理地区的表面元素205的建模、列表和数量可以由移动通信网络105、由系统100预先确定,或者由管理员通过管理员接口120输入到系统100。

考虑图3a和3b,它们是根据本发明的实施例的、分别被细分为表面元素2051-9和205'1-9的对应集合的、与移动通信网络105相关联的被覆盖地理地区300和300'的示例。

图3a中所示的被覆盖的地理地区300已经被细分为具有规则多边形形状(即,正方形)的九个表面元素2051-9。相反,图3b中所示的地理地区300'已经被细分为具有不规则多边形形状的九个表面元素205'1-9。

一般而言,表面元素2051-9和205'1-9的几何特征可以基于地理地区的多个参数,诸如像城市特征(街道、病房(ward)等的存在和分布)和/或自然特征(河流、丘陵等的存在和分布)。而且,可以考虑其它参考和/或映射系统(诸如像由移动通信网络105的提供商使用的众所周知的网络规划软件工具),以用于限定表面元素2051-9和205'1-9的形状和尺寸,作为城市和自然特征的附加或替代。

应当注意的是,并不阻止根据移动通信网络105的小区105b的分布来限定表面元素2051-9和205'1-9的形状和尺寸。

此外,一般而言,在aoi107以及表面元素2051-9和205'1-9的数量、形状和尺寸之间没有关系。

在本发明的一个实施例中,优选地使用正方形表面元素,诸如被覆盖的地理地区300的表面元素2051-9。甚至更优选地,表面元素2051-9与由上述网络规划软件工具进行网络规划期间确定的像素对应。

实际上,正方形表面元素2051-9允许简单地细分被覆盖的地理地区300,例如,已经确定了通用表面元素205q的参考点(诸如像表面中心b)和正方形表面元素2051-9的边的尺寸,可以简单地确定所有表面元素2051-9的顶点和表面中心b。

例如,用作表面元素的像素可以被成形为具有以下的边的正方形:该边具有被包括在200m和50m之间的尺寸(诸如150m)。这确保被覆盖的地理地区300的细节水平与分析涉及被覆盖的地理地区300的聚合数据所需的计算复杂度之间的良好权衡。

根据本发明的一个实施例,由移动通信网络105提供的聚合数据包括关于用于表面元素2051-9和205'1-9中的每一个的ue(并且因此ue所有者)的数量的指示。

在下文中,为了简单和简洁,仅参考图3a的覆盖地理地区300和相应表面元素2051-9;但是,应当注意的是,类似的考虑也可以应用于图3b的覆盖地理地区300'和相应表面元素205'1-9。

在本发明的一个实施例中,对于每个通用表面元素205q(q=1,…,q;其中q是正整数,在图3a的示例中q=9),系统100从移动通信网络105接收相应的聚合的ue数量uq。

优选地,系统100从移动通信网络105接收针对每个通用表面元素205q的多个聚合的ue数量uq,t。聚合的ue数量uq,t的每个ue数量uq,t被称为多个连续参考时间间隔dt(t=1,…,t;其中t是正整数)的第t个参考时间间隔。

换句话说,系统100接收q个聚合的ue数量uq,t的集合{uq,t}(对于表面元素205q中的每一个表面元素有一个该集合,即,在图3a的示例中有9个聚合的ue数量uq,t),每个集合被称为连续t个参考时间间隔dt的参考时间间隔dt,例如,q个聚合的ue数量uq,t的每个集合{uq,t}在与相应时间间隔dt的结束对应的时刻tt生成。

例如,通过考虑二十四小时长的获取周期δt(δt=24小时),(其间由系统100接收q个聚合的ue数量uq,t的t个集合{uq,t}以用于存储和/或处理(如下所述))、以及十五分钟长的时间间隔dt(dt=15分钟),在获取周期δt结束时,系统100具有q=9个聚合的ue数量uq,t的可用的t=96个集合{uq,t},对于每个参考时间间隔dt有一个。实际上,获取周期δt被细分为具有以下结构的96个连续的参考时间间隔dt:d1=[00:00,00:15),d2=[00:15,00:30),…,d95=[23:30,23:45),以及d96=[23:45,00:00)。

根据本发明的实施例,在对应的参考时间间隔dt期间,基于移动通信网络105的每个小区105b的流量负载来计算聚合的ue数量uq,t。

优选地,通过组合在对应的第t个参考时间间隔dt期间在覆盖地理地区300中包括的小区105b中的每一个处测得的流量负载(例如,以erlang)与为小区105b中的ue估计的平均ue流量负载(即,由与移动通信网络105相关联的每个ue生成的平均流量负载)来计算聚合的ue数量uq,t。

将每个小区105b的流量负载除以平均ue流量负载,从而获得在参考时间间隔dt期间由每个小区105b服务的ue的数量的估计。随后,由小区105b服务的ue的数量在被覆盖的地理地区300的表面元素205q之间被分布。

例如,基于由小区105b服务的ue的数量,被覆盖的地理地区300的表面元素205q中的每一个内的ue的数量的确定(即,分布)可以基于在上面提到的由francescocalabrese,carloratti所写的文章:“realtimerome”,networksandcommunicationstudies20(3-4)2006年第247-258页中描述的方法。

被指出的是,本发明独立于用于确定聚合的ue数量uq,t的量。实际上,除了以erlangs测得的流量负载外,还可以使用计算流量负载的其它形式,例如,每个小区105b的呼叫的数量、每个小区105b的连接的数量或每个小区105b连接的独特(unique)ue的数量(即,各自涉及对应的第t个参考时间间隔dt)。

还要指出的是,本发明独立于用来在被覆盖的地理地区300的表面元素205q中分布由小区105b服务的ue的数量的功能(function)。

在本发明的另一实施例中,移动通信网络105具有连接到小区105b中每一个的ue的数量的知识,因此,不需要通过流量负载来确定ue的数量,并且聚合的ue数量uq,t可以通过将相应参考时间间隔dt期间由被包括在表面元素205q中的小区105b服务的ue的数量加在一起而直接确定。

现在转到图4a-图4e,它们是根据本发明的实施例的、待确定的aoi107可以采取的示例性形状。

一般而言,一个或多个公开集会的aoi107可以被建模为具有aoi中心c和aoi半径ra的区域。例如,aoi107可以由中心位于aoi中心c并且具有aoi半径ra作为圆周(circumference)半径的圆周界定(如图4a中所示)。

应当注意的是,aoi107可以具有与圆周不同的形状。例如,aoi107可以具有优选地是规则多边形的形状。在这种情况下,以类似于上面讨论的表面元素205b建模的方式,aoi中心c与多边形的质心(或形心)对应,而aoi半径ra与连接多边形的质心与多边形的顶点(如图4b和4d中所示)或多边形的边的中点(如图4c和4e中所示)的线段对应。

aoi中心c可以被(例如,由用户通过用户接口125或由系统管理员通过管理员接口120)设置为aoi107的(地理)中心点(例如,核心地方的地理中心点)、设置为一个或多个公开集会的核心地方的地址、设置为由地图软件(诸如web地图服务(例如,googlemapstm、openstreetmaptm等))提供的点。

如将在以下更详细描述的,aoi半径ra可以取零或负值以及正值。在aoi半径ra取零或负值的情况下,aoi107限于aoi中心c(即,一个或多个公开集会的核心地方)。aoi半径ra的零值或负值的含义将通过参考下面描述的实施例中的这些零值或负值进一步阐明。

以下描述的算法被配置为确定用于aoi107的aoi半径ra的最佳半径值ro。在本发明的一个实施例中,最佳半径值ro通过从最小半径值rmin开始到最大半径值rmax的迭代步骤来确定(如下文所述)。优选地,最小半径值rmin和最大半径值rmax由系统100的管理员通过管理员接口120设置。

在本发明的实施例中,基于关于多个过去的公开集会的经验数据的统计分析,最小半径值rmin被设置为等于-1500m(rmin=-1500m),而最大半径值rmax被设置为等于1500m(rmax=1500m)。

已经限定了表面元素205b的形状和aoi107的形状,现在将介绍根据本发明的实施例的相关表面元素(即,被认为至少部分地属于aoi107的被覆盖的地理地区300的表面元素205q)的概念。

图5a-5d是根据本发明的实施例的、被覆盖地理地区的表面元素205q之中关于aoi107的相关表面元素505a-d。

在本发明的一个实施例中,给定具有aoi中心c的aoi107以及具有表面中心b和表面半径rs的表面元素205q,如果以下不等式得到验证,那么通用表面元素205q可以被认为是用于aoi107的相关表面元素505a-d:

dist(c,b)≤|rs+ra|,(1)

其中dist(c,b)是aoi中心c和表面中心b之间的地理距离。

根据aoi107的aoi半径ra的值,不等式(1)可能有三个不同的含义。

即,如果aoi107的aoi半径ra大于零(即,ra>0),那么不等式(1)简化成:

dist(c,b)≤(rs+ra)(2)

并且,如果aoi107和通用表面元素205q的区域至少部分地叠加(即使aoi中心c落在通用表面元素205q之外),那么通用表面元素205b被认为是用于aoi半径ra大于零的aoi107的相关表面元素(诸如图5a中的相关表面元素505a的情况)。

如果aoi107的aoi半径ra等于零(即,ra=0),那么不等式(1)简化成:

dist(c,b)≤rs(3)

并且,如果aoi107的aoi中心c被包含在通用表面元素205q中,那么通用表面元素205q被认为是用于具有等于零的aoi半径ra的aoi107的相关表面元素(诸如图5b和图5c中的相关表面元素505b和505c的情况)。

最后,如果aoi107的aoi半径ra小于零(即,ra<0),那么,如果aoi107的aoi中心c被包括在通用表面元素205q内离表面中心b等于或小于rs-|ra|的距离处,那么通用表面元素205q被认为是用于具有小于零的aoi半径ra的aoi107的相关表面元素(诸如图5d中的相关表面元素505d的情况)。

除了在特定地点(即,aoi107)举行以外,通用公开集会s还具有开始时间ts和结束时间te。因此,为了本发明的目的,通用公开集会s具有等于观察时间间隔[ts,te]的相关持续时间(即,以开始时间ts开始并在结束时间te结束的时间间隔,持续te-ts时间单位,例如秒、分钟或小时)。

开始时间ts和结束时间te两者可以被限定以便与为那个通用公开集会s计划的正式(正式公告的)开始和结束时间对应。不过,申请人已经观察到,通过相对于通用公开集会s的正式开始时间而预期开始时间ts,可以考虑到在通用公开集会s正式开始时间之前人们(即,参加通用公开集会s的ue所有者)到达aoi107的事实,这可以有助于收集关于到达通用公开集会s的参加者的流动的时间趋势的数据。例如,基于先前的公开集会的经验数据,申请人已经发现开始时间ts可以有用地被预期在通用公开集会s的正式开始时间之前60分钟,以便考虑到达通用公开集会s的参加者的趋势。

类似地,申请人观察到,结束时间te可以相对于通用公开集会s的正式结束时间推迟,以便考虑到在通用公开集会s的正式结束时间之后人们离开aoi107的事实,这对于收集关于离开通用公开集会s的参加者的流动的时间趋势的数据可以是有用的。例如,基于先前的公开集会的经验数据,申请人已经发现结束时间ts可以有用地被推迟到通用公开集会s的正式结束时间之后30分钟,以便考虑离开通用公开集会s的参加者的趋势。

无论如何,管理员通过管理员接口120和/或用户通过用户接口125可以为通用公开集会s设置任何定制的开始时间ts和结束时间te。例如,开始时间ts和结束时间te可以被设置以便限定比通用公开集会s的有效持续时间短(即,比整个公开集会的持续时间短)的观察时间间隔[ts,te],以便分析仅在通用公开集会s的整个持续时间的子部分期间参加通用公开集会s的人群中的人的数量或变化。

已经描述了系统100以及通用公开集会s的时间(即,开始时间ts和结束时间te)和空间(即,aoi107的aoi中心c和aoi半径ra)特点,现在将参考图6a-6c描述根据本发明的实施例的参加一个或多个公开集会的人的人群估计算法(或人群计数算法),图6a-6c是该算法的示意性框图。

令n(其中n是可以由管理员通过管理员接口120和/或由用户通过用户接口125限定的整数)是在参加公开集会的相应人群中的人数要被确定的同一个aoi107中举行的公开集会sn的数量,其中n是集会变量,该集会变量指示n个公开集会中哪个被考虑(即,1≤n≤n)。

对于每个公开集会sn,限定其间举行公开集会sn的观察日(observationday)gn、开始时间tsn和结束时间ten。应当注意的是,开始时间tsn和结束时间ten可以从一个公开集会sn到另一个公开集会而变化。

而且,对于每个公开集会sn,考虑观察日gn之前的先前天gpn(其中1≤p≤p并且p是整数)的集合。所考虑的先前天gpn的数量p优选地由管理员(通过管理员接口120)设置。在本发明的实施例中,管理员根据存储库115的存储能力(即,为了能够存储关于p个先前天gpn的所有数据)和/或基于计算引擎110的计算能力(即,为了能够处理关于p个先前天gpn的所有数据)设置先前天gpn的数量p。优选地,管理员也基于对相同种类的过去的公开集会(即,文化、娱乐、政治或体育节目)的统计分析来设置先前天gpn的数量p。

申请人已经发现,通过将先前天gpn的数量p设置为等于6(即,p=6),为大多数种类的公开集会提供了良好的结果(但是这不应当被解释为对本发明的限制)。

人群估计算法的第一部分被配置为基于关于所考虑的所有n个公开集会sn的数据来确定aoi107的aoi半径ra的最佳半径值ro。

最初(步骤602)aoi中心c、观察日gn以及开始时间tsn和结束时间ten被输入到系统100,例如,由用户通过用户接口125或由管理员通过管理员接口120。

其后(步骤604),迭代变量k被初始化为零(即,k=0),集会变量的检测到的数量dsk也被初始化为零(即,dsk=0),并且计算出的半径值rk最初被设置为最小半径值rmin(即,rk=rmin)。迭代变量k解释算法的第一部分的迭代次数,集会变量的检测到的数量dsk解释在算法的第一部分的迭代期间检测到的公开集会sn的数量(如以下所述),并且计算出的半径值rk用来确定最佳半径值ro。

接下来(步骤606),用于具有等于计算出的半径值rk的aoi半径ra(ra=rk)的aoi107的相关表面元素505a-d通过如上所述的不等式(1)来识别。

之后(步骤608),天变量n被初始化成例如一(unity)(n=1)。

从存储库115检索(步骤610)观察时间间隔[tsn,ten]期间的涉及观察日gn的(即,涉及观察时间间隔[tsn,ten]中所包括的时间间隔dt)并涉及在步骤606确定的相关表面元素505a-d的q个聚合的ue数量uq,t的所有集合{uq,t}。

随后(步骤612),基于在先前步骤606已经检索出的q个聚合的ue数量uq,t的集合{uq,t},将第一ue数量unk计算为相关表面元素505a-d中的ue的数量(第一ue数量unk依赖于相关表面元素,因此依赖于计算出的半径值rk)。

可以将第一ue数量unk计算为相关表面元素505a-d中的ue的总数量、平均数量或最大(峰)数量,例如根据由系统100的管理员通过管理员接口120和/或由系统100的用户通过用户接口125选择的设置。

例如,可以以下列方式计算作为相关表面元素505a-d中的总ue数量的第一ue数量unk。首先,计算在所有相关表面元素505a-d(在步骤606中确定)中在所考虑的天gn期间的观察时间间隔[tsn,ten]中所包括的每个参考时间间隔dt内的聚合的ue数量uq,t(在步骤610中确定)的值的总和。随后,执行刚刚为被包括在所考虑的天gn期间的观察时间间隔[tsn,ten]中的每个参考时间间隔dt计算的值的求和。换句话说,作为相关表面元素505a-d中的总ue数量的第一ue数量unk可以被计算为:

类似地,可以以下列方式计算作为相关表面元素505a-d中的平均ue数量的第一ue数量unk。首先,计算在所有相关表面元素505a-d(在步骤606中确定)中在所考虑的天gn期间的观察时间间隔[tsn,ten]中所包括的每个参考时间间隔dt内的聚合的ue数量uq,t(在步骤610中确定)的值的总和。随后,执行刚刚为被包括在所考虑的天gn期间的观察时间间隔[tsn,ten]中的每个参考时间间隔dt计算的值的求和。最后,将刚刚获得的值除以在所考虑的天gn期间的观察时间间隔[tsn,ten]中所包括的参考时间间隔dt的数量t'。换句话说,作为相关表面元素505a-d中的平均ue数量的第一ue数量unk可以被计算为:

相反,可以以下列方式计算作为相关表面元素505a-d中的最大(峰)ue数量的第一ue数量unk。首先,计算在所有相关表面元素505a-d(在步骤606中确定)中在所考虑的天gn期间的观察时间间隔[tsn,ten]中所包括的每个参考时间间隔dt内的聚合的ue数量uq,t(在步骤610中确定)的值的总和。随后,将刚刚计算出的值中的最大值选择作为第一ue数量unk。换句话说,作为相关表面元素505a-d中的最大(峰)ue的第一ue数量unk可以被计算为:

应当注意的是,无论是被计算为相关表面元素505a-d中的ue的总数量、平均数量还是最大(峰)数量,第一ue数量unk总是依赖于用来确定聚合的ue数量uq,t所涉及的相关表面元素505a-d的、计算出的半径值rk。

类似地,从存储库115检索(步骤614)在观察时间间隔[tsn,ten]期间涉及先前天gpn并在步骤606确定的相关表面元素505a-d内发生的q个聚合的ue数量u'q,t的所有集合{u'q,t}。

然后(步骤616),基于涉及已经在先前步骤606检索出的相关表面元素505a-d的q个聚合的ue数量u'q,t的集合{u'q,t}来将对于先前天gpn中的每一天的第二ue数量upnk计算为相关表面元素505a-d中的ue的数量(第二ue数量upnk依赖于相关表面元素505a-d,并且因此依赖于计算出的半径值rk)。

类似于第一ue数量unk,可以将第二ue数量upnk中的每一个计算为相关表面元素505a-d中的ue的总数量、平均数量或最大(峰)数量,例如根据由系统100的管理员通过管理员接口120和/或由系统100的用户通过用户接口125选择的设置。

例如,作为相关表面元素505a-d中ue的总数量的第二ue数量upnk可以以下列方式计算。首先,对于先前天gp中的每一天,计算在所有相关表面元素505a-d(在步骤606中确定)中(在所考虑的天gn之前的)所考虑的先前天gp期间的观察时间间隔[tsn,ten]中所包括的每个参考时间间隔dt内的聚合的ue数量u'q,t(在步骤614中确定)的值的总和。随后,执行刚刚为(在所考虑的天gn之前的)所考虑的先前天gp期间的观察时间间隔[tsn,ten]中所包括的每个参考时间间隔dt计算的值的求和。换句话说,作为相关表面元素505a-d中的总ue数量的用于(在所考虑的天gn之前的)先前天gp的第二ue数量upnk可以被计算为:

作为相关表面元素505a-d中的平均ue数量的第二ue数量upnk可以以下列方式计算。首先,对于先前天gp中的每一天,计算在所有相关表面元素505a-d(在步骤606中确定)中(在所考虑的天gn之前的)所考虑的先前天gp期间的观察时间间隔[tsn,ten]中所包括的每个参考时间间隔dt内的聚合的ue数量u'q,t(在步骤614中确定)的值的总和。随后,执行刚刚为(在所考虑的天gn之前的)所考虑的先前天gp期间的观察时间间隔[tsn,ten]中所包括的每个参考时间间隔dt计算的值的求和。最后,将刚刚获得的值除以(所考虑的天gn之前的)所考虑的先前天gp期间的观察时间间隔[tsn,

ten]中所包括的参考时间间隔dt的数量t'。换句话说,作为相关表面元素505a-d中的平均ue数量的用于(所考虑的天gn之前的)先前天gp的第二ue数量upnk可以被计算为:

作为相关表面元素505a-d中的最大(峰)ue数量的第二ue数量upnk可以以下列方式计算。首先,对于先前天gp中的每一天,计算在所有相关表面元素505a-d(在步骤606中确定)中(在所考虑的天gn之前的)所考虑的先前天gp期间的观察时间间隔[tsn,ten]中所包括的每个参考时间间隔dt内的聚合的ue数量u'q,t(在步骤614中确定)的值的总和。随后,对于(所考虑的天gn之前的)所考虑的先前天gp,选择刚刚计算出的值中的最大值作为第二ue数量upnk。换句话说,作为相关表面元素505a-d中的最大(峰)ue数量的用于所考虑的先前天gp的第二ue数量upnk可以被计算为:

在这种情况下同样,无论是被计算为相关表面元素505a-d中的ue的总数量、平均数量还是最大(峰)数量,第二ue数量upnk总是依赖于用来确定聚合的ue数量uq,t涉及的相关表面元素505a-d的、计算出的半径值rk。

组合(步骤618)刚刚计算出的第二ue数量upnk,以便确定在所考虑的p个先前天gpn的观察时间间隔[tsn,ten]期间在相关表面元素505a-d内的ue数量的平均ue数量μnk(其中因此平均ue数量μnk清楚地不同于第二ue数量upnk,即使它们被计算为相关表面元素505a-d中的ue的平均数量)以及ue数量标准偏差μnk(其中)。

将平均ue数量μnk和ue数量标准偏差σnk与第一ue数量unk组合(步骤620),以便获得(统计)量限定的z得分znk(其依赖于计算出的半径值rk):

znk=(unk-μnk)/σnk(7)

将刚刚计算出的z得分znk与z得分阈值zth进行比较(步骤622),并且检查z得分znk是否大于z得分阈值zth,或者:

znk>zth(8)

z得分阈值zth是优选地基于对相同种类的过去的公开集会(例如,文化、娱乐、政治或体育集会)的统计分析而由管理员通过管理员接口120限定的值。

申请人已经发现,将z得分阈值zth设置为等于2(即,zth=2)对于大多数种类的公开集会提供良好的结果(但是这不应当被解释为对本发明的限制)。

在肯定的情况下(判定方框622的退出分支y),即,z得分znk大于z得分阈值zth(即,znk>zth),检测出n个公开集会sn中的一个,并且集会变量的检测到的数量dsk增加一(步骤624;即,dsk=dsk+1),并且操作在步骤626(下面描述)继续。

在否定的情况下(判定方框622的退出分支n),即,z得分znk等于或低于z得分阈值zth(即,znk≤zth),集会变量n增加一(步骤626;即,n=n+1)。

然后(步骤628),检查集会变量n是否低于或等于公开集会sn的数量n:

n≤n(9)

在肯定的情况下(判定方框628的退出分支y),即,变量n小于或等于总体公开集会sn的数量n(n≤n),操作返回到步骤610,用于分析涉及在下一个观察日gn举行的公开集会sn的q个聚合的ue数量uq,t的集合{uq,t}。

在否定的情况下(判定方框628的退出分支n),即,集会变量n大于总体公开集会sn的数量n(n>n;即,已经分析了所有n个公开集会sn),变量k增加一(步骤630;即,k=k+1)并且计算出的半径值rk增加(步骤632):

rk=rmin+kδ(10)

其中δ是可以由管理员限定的迭代宽度(例如,δ=100m),因此每个计算出的半径值rk与下一个计算出的半径值分开迭代宽度δ。应当注意的是,迭代宽度δ限定迭代变量k的最大迭代值kmax(以及因此用于确定最佳半径值ro的最大迭代次数)为:

kmax=(|rmin|+rmax)/δ(11)

应当注意的是,迭代宽度δ可以由系统管理员使用来调节利用其确定最佳半径值ro的粒度(即,精细度),即,由管理员设置的迭代宽度δ越小,由最大迭代值kmax限定的迭代次数越高,因此,人群估计算法的粒度越精细。

在本发明的实施例中,由于最小半径值rmin被设置为-1500m,最大半径值rmax被设置为1500m,迭代宽度δ被设置为100m,迭代变量k的最大迭代值kmax结果等于30,并且因此用于确定最佳半径值ro的最大迭代次数被限制到30。

然后,检查(步骤634)计算出的半径值rk是否低于或等于最大半径值rmax:

rk≤rmax(12)

在肯定的情况下(判定方框634的退出分支y),即,计算出的半径值rk小于或等于最大半径值rmax(即,rk≤rmax),操作返回到步骤606,用于基于刚刚增加(在步骤632)另外第k个迭代宽度δ的计算出的半径值rk而开始对算法的第一部分的新迭代。

在否定的情况下(判定方框634的退出分支n),即,计算出的半径值rk大于最大半径值rmax(即,rk>rmax),计算(步骤636)最佳半径值ro作为由在具有等于计算出的半径值rk的aoi半径ra的aoi107中检测到的公开集会sn的数量dsk(即,检测出的集会变量的数量dsk)加权的该计算出的半径值rk(其中1≤k≤kmax)的平均值,或者:

迭代人群估计算法的第一部分的步骤606至634,直到计算出的半径值rk大于最大半径值rmax(即,rk>rmax)为止,并计算(在步骤636)最佳半径值ro。

通过在步骤636对最佳半径值ro的计算,人群估计算法的第一部分结束,然后人群估计算法的第二部分开始(在下面描述的步骤638)。在人群估计算法的第一部分结束时,aoi107由aoi中心c并由设置为等于最佳半径值ro的aoi半径ra(ra=ro)适当地限定。

根据本发明的实施例的人群估计算法的第二部分被配置为确定在所考虑的n个公开集会sn中的每一个处聚集的人群中的人数。

在步骤636中计算出最佳半径值ro之后,限定(步骤638)实际相关表面元素505a-d的集合。这个集合包括以下的所有表面元素205b:对于该表面元素205b,当aoi半径ra被设置为等于最佳半径值ro时验证了不等式(1),或者:

dist(c,b)≤|rs+ro|。(14)

然后(步骤640),将集会变量n重新初始化为一(n=1),并且从存储库115检索(步骤642)在观察时间间隔[ts,te]内涉及观察日gn并发生在于步骤638处确定的实际相关表面元素505a-d中的所有集合{uq,t}。

随后(步骤644),基于在步骤642检索出的集合{uq,t}将第三ue数量un|aoi计算为在观察时间间隔[ts,te]期间具有等于最佳半径值ro的aoi半径ra的aoi107中包括的相关表面元素505a-d内所包含的ue的数量。

类似于第一ue数量unk,可以将第三ue数量un|aoi计算为相关表面元素505a-d中的ue的总数量、平均数量或最大(峰)数量,例如根据由系统100的管理员通过管理员接口120和/或系统100的用户通过用户接口125选择的设置。应当注意的是,在这种情况下,第三ue数量u|aoi被计算为具有等于最佳半径值ro的半径ra的aoi内的相关表面元素505a-d中ue的总数量、平均数量或者最大(峰)数量,因此第三ue数量依赖于最佳半径值ro,而不依赖于计算出的半径值rk(第一ue数量unk依赖于rk)。

一旦计算出第三ue数量un|aoi,就将人数an初始化为零(即,an=0)(步骤646)。人数an解释为了参加公开集会sn而聚集的人群中的人数(如下所述)。

从存储库115检索(在步骤648)在观察时间间隔[tsn,ten]内涉及先前天gpn中的每一天并且已经在于步骤638处确定的实际相关表面元素505a-d中发生的所有集合{u'q,t}。

然后(步骤650),对于p个先前天gpn中的每一天,基于在步骤648检索出的集合{u'q,t}将第四ue数量upn|aoi计算为在观察时间间隔[ts,te]期间被包括在具有等于最佳半径值ro的aoi半径ra的aoi107中的相关表面元素505a-d内所包含的ue的数量。

在这种情况下同样,类似于第二ue数量upnk,可以将第四ue数量upn|aoi中的每一个计算为相关表面元素505a-d中的ue的总数量、平均数量或最大(峰)数量,例如根据由系统100的管理员通过管理员接口120和/或由系统100的用户通过用户接口125选择的设置。应当注意的是,在这种情况下,第四ue数量up|aoi被计算为具有等于最佳半径值ro的aoi半径ra的aoi107内的相关表面元素505a-d中ue的总数量、平均数量或最大(峰)数量;因此第四ue数量依赖于最佳半径值ro而不依赖于计算出的半径值rk(第二ue数量upnk依赖于rk)。

组合(步骤652)刚刚计算出的第四ue数量upn|aoi,以便确定相关表面元素505a-d内的ue数量的另一个平均ue数量μn|aoi。例如,另一个平均ue数量μn|aoi可以被计算为:

另一个平均ue数量μn|aoi提供了在任何天中所考虑的观察时间间隔[tsn,ten]期间通常被包括在具有等于最佳半径值ro的aoi半径ra的aoi107内的人(即,不在人群中聚集的人)的平均数量的指示。

应当指出的是,虽然如上所述计算的另一个平均ue数量μn|aoi可以提供一种有限的准确度(因为在所考虑的观察时间间隔[tsn,ten]内来自同一个ue的两个或更多个活动可以被认为各自属于不同的ue),但是另一个平均ue数量μn|aoi提供对通常被包括在aoi107内的平均人数的估计,该估计具有令人满意的准确度、具有低计算复杂度并且确保完全尊重ue所有者的隐私。

然后通过组合(例如,相减)在步骤652确定的另一个平均ue数量μn|aoi和在步骤644确定的第三ue数量un|aoi来计算(步骤654)人数an,或者

an=un|aoi-μn|aoi。(16)

因此,涉及在观察日gn举行的公开集会sn的人数an被存储(步骤656)在存储库115中,然后集会变量n增加一(步骤658;即,n=n+1)并检查(步骤660)集会变量n是否小于或等于公开集会sn的数量n(以与先前的步骤628相同的方式进行):

n≤n(9)

在肯定的情况下(判定方框660的退出分支y),即,集会变量n小于或等于公开集会sn的数量n(n≤n),操作返回到步骤642,以便分析在下一个集会日gn举行的下一个公开集会sn。

在否定的情况下(判定方框660的退出分支n),即,集会变量n大于总体公开集会sn的数量n(n>n),所有n个公开集会sn已被分析,因此人群估计算法可以终止。

优选地,通过经由用户终端125向用户提供(步骤662)结果(即,n个人数an)以供检查和/或进一步处理来终止该算法。

迭代人群估计算法的第二部分的步骤642至660,直到已经分析了所有n个公开集会sn为止,并且因此人群估计算法被终止(在步骤662),其中通过用户终端125向用户提供结果。

总之,人群估计算法包括第一部分和第二部分。

进而,人群估计算法的第一部分包括两个嵌套循环。第一外部循环扫描(步骤606-634)最小半径值rmin和最大半径值rmax之间所有计算出的半径值rk,而第一内部循环扫描(步骤610-628)所有n个待分析的公开集会sn。对于每个计算出的半径值rk,确定相应的表面元素505a-d和z-得分znk。基于这种数据(即,相应的相关表面元素505a-d和z-得分znk),计算检测到的集会变量dsk并且识别最佳半径值ro。在人群估计算法的第一部分结束时,限定具有最佳半径值ro的aoi107。

算法的第二部分包括扫描(步骤642-660)在aoi107内举行的所有n个公开集会sn,并且确定参加公开集会sn的人群中的人数。

根据本发明的实施例的人群估计系统100和人群估计算法允许以可靠的方式对参加一个或多个公开集会sn的人群中的人数的后验估计,并允许适当地识别(通过确定最佳半径值ro)与一个或多个公开集会sn中的每一个相关联的aoi107的有效范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1