用于分析目标实体的移动的装置、系统和方法_4

文档序号:9770019阅读:来源:国知局
某些情况下,如果特定位置在特定时间点被过度表示(例如,许多ID同时与同一地理坐标关联),则位置数据点的置信度得分(指示目标实体在该特定时间点位于该特定位置处)可以很低。
[0098]例如,如果某城镇具有25,000名居民,并且如果聚合位置信息指示22,000个目标实体同时位于特定位置处,则指示目标实体位于该特定位置处的位置数据点可能不准确。因此,此类位置数据点可以与低置信度得分关联。再如,如果与特定位置关联的位置数据点的数量多于整组位置数据点的0.1%,则与该特定位置关联的位置数据点不准确的可能性极高。因此,此类位置数据点可以与低置信度得分关联。换言之,如果与特定位置关联的位置数据点的数量大于预定阈值,则与该特定位置关联的任何位置数据点可以被视为不准确并且与低置信度得分关联。
[0099]在某些实施例中,用于丢弃位置数据点的预定阈值可以适合于位置信息数据集的特征。例如,用于与小城镇关联的数据集的预定阈值可以不同于用于与加利福尼亚州洛杉矶关联的数据集的预定阈值。
[0100]在某些实施例中,LIF模块112可以应用各种过滤器以便进一步丢弃不需要的数据点。例如,可以从进一步处理中排除没有足够数据量的目标实体。
[0101]在某些实施例中,LIF模块112可以减少位置数据点中的噪声。因为预计目标实体的移动是平稳的,所以以特定位置为中心的任何快速移动都可以被视为噪声,该噪声可以源于位置感测设备的不理想特征,例如GPS抖动。因此,LIF模块112可以将时间噪声建模为高斯分布并且对位置数据点进行时间平均,以便从位置数据点中删除时间抖动。例如,如果目标实体每天晚上7点去往同一家星巴克,并且如果目标实体在晚上7点的位置信息指示用户在同一家星巴克附近,则LIF模块112可以对GPS坐标进行时间平均,以便平均后的GPS坐标更密切地对齐同一家星巴克。在某些实施例中,LIF模块112可以对与感兴趣位置时间点相隔预定时间窗口内的位置数据点进行平均。例如,LIF模块112可以对与感兴趣位置数据点相隔5秒窗口内的位置数据点进行平均。在其它实施例中,LIF模块112可以对属于前几天或前几个月的同一时间点的位置数据点进行平均。例如,在上面的星巴克实例中,LIF模块112可以对与过去5天的晚上7点关联的位置数据点进行平均,以便删除今天的与晚上7点关联的位置数据点的噪声。
[0102]在步骤604中,LIF模块112可以可选地从预处理后的位置信息确定会话和集群。会话是用于从位置数据点中删除冗余的抽象。该抽象可以将LIF模块112与来自同一目标实体的类似或相同位置数据点的快速重新提交相隔离。例如,如果LIF模块112在彼此一秒内从同一目标实体并且从同一位置接收第一位置数据点和第二位置数据点,则LIF模块112可以将这些数据点折叠为单个会话,因为第二数据点未提供任何感兴趣的信息。查看会话的另一种方法是该会话标记了事件。LIF模块112基本上将位置数据点流分组为高熵事件。
[0103]基于会话的该视图,会话可以包括来自同一目标实体(例如,同一标识符)的以空间和/或时间界定的一组位置数据点。因此,LIF模块112可以被配置为对以空间和/或时间界定的任何位置数据点进行分组,并且使用该组中时间最早的位置数据点表示所有分组后的位置数据点。例如,会话可以包括(I)与洛杉矶中心的距离在5英里之内和/或(2)跨度在10分钟之内的一组位置数据点。因此,LIF模块112可以被配置为对(I)与洛杉矶中心的距离在5英里之内和/或(2)跨度在10分钟之内的所有数据点进行分组,并且使用该组数据点中最早的位置数据点表示所有这些数据点。
[0104]在某些实施例中,可以使用多个参数表示会话。多个参数之一可以表示对应于会话的时间段;多个参数之一可以表示对应于会话的地理界限。因此,例如,单个会话可以包括当特定用户的移动电话在特定时间间隔(例如,从2012年6月12日的上午10:00到上午1:15)期间在特定位置(例如,在100-120号大街之间)时收集的所有位置数据点。因此,LIF模块112可以使用多个参数将位置数据点分组为一个或多个会话。在某些实施例中,空间和/或时间的界限可以由服务器102的操作者提供。在其它实施例中,LIF模块112可以使用诸如K平均聚集之类的聚集技术,自动确定空间和/或时间的界限。
[0105]在某些实施例中,会话可以包括事件。地理位置坐标序列的熵的快速变化可以指示两个不同事件之间的转变。因此,LIF模块112可以被配置为确定地理位置坐标序列的熵的快速变化。
[0106]在某些实施例中,LIF模块112可以使用地理多边形来从地理位置坐标序列标识会话。例如,地理多边形可以与洛杉矶中的特定建筑物关联。如果用户在地理多边形内,则与地理多边形关联的所有以时间界定的位置数据点可以被视为属于同一会话。LIF模块112可以使用分层机制来快速判定位置数据点是否与特定地理多边形相关联。例如,LIF模块112可以使用如在上面的 “APPARATUS ,SYSTEMS ,AND METHODS FOR PROVIDING LOCAT1NINFORMAT1N(用于提供位置信息的装置、系统和方法)”中公开的多边形匹配机制。
[0107]在会话处理期间,位置数据点可以与仅一个会话关联。相反,一个会话可与任何数量的位置数据点关联,前提是这些数据点满足空间和/或时间会话参数。例如,会话可以包括单个位置数据点。
[0? 08]在会话处理之后,会话中的位置数据点可以表示特定ID访问的事件或地点。
[0109]在某些实施例中,LIF模块112可能未从位置数据点标识任何会话。例如,LIF模块112可以跳过会话标识步骤。这种情形与其中会话包括单个位置数据点的情形相同。因此,以下对使用会话确定集群和/或属性的讨论还可以适用于其中LIF模块112未标识任何会话的情况。
[0110]在LIF模块112从时间系列位置数据点标识一个或多个会话之后,LIF模块112可以基于所标识的会话确定一个或多个集群。集群可以包括表示随时间的重复行为的会话的分组。在概念上,具有新地理空间位置的任何会话可以对应于新集群,并且可以将之后的会话添加到现有集群之一,前提是这些之后的会话满足特定地理准则。因此,LIF模块112被配置为通过标识在地理上靠近集群中心的会话,将一个或多个会话分组为单个集群。例如,某人的移动电话第一次移动到新位置(例如,200号大街)时,可以将与该新位置关联的位置数据分组为新会话。如果该同一移动电话随后返回到该位置(200号大街),则可以将与该第二访问关联的数据分组为另一个会话。然后,可以将两个会话分组为单个集群,因为这些会话与同一位置关联。
[0111]图7示出根据某些实施例的用于将两个或更多会话聚集为集群的过程。在步骤702中,LIF模块112可以可选地以时间顺序对会话进行排序。例如,LIF模块112可以对会话进行排序,以便由较早的位置数据点表示的会话在由较后的位置数据点表示的会话之前出现。尽管该排序步骤不是必需的,但这允许LIF模块112也对集群进行时间排序。
[0112]在步骤704中,LIF模块112可以将第一会话指定为第一集群。在步骤706中,LIF模块112可以分析后续会话,该会话在此被称为候选会话。具体地说,LIF模块112可以确定候选会话的中心和现有集群的代表性会话的中心之间的距离。在步骤708中,LIF模块112可以判定在步骤706中计算的距离的最小值是否小于预定阈值。如果是,则在步骤710中,LIF模块112可以将候选会话与对应于最小距离的集群相关联。如果否,则在步骤712中,LIF模块112可以针对候选会话创建新集群,并且将候选会话指定为新集群的代表性会话。
[0113]在步骤714中,LIF模块112可以重复步骤706-712,直至每个会话均与集群关联。
[0114]在某些实施例中,在步骤706中,LIF模块112可以被配置为计算候选会话的中心和现有集群中的所有会话的中心之间的距离,而不是候选会话的中心和现有集群的代表性会话的中心之间的距离。现有集群中的所有会话的中心可以包括由现有集群中的会话形成的图心(centroid)的中心。当将会话添加到集群时,LIF模块112可以重新计算集群中的所有会话的中心。在某些实施例中,集群可以用作图2-5中示出的AoA。
[0115]图8示出根据某些实施例的如何将位置数据点分组为会话以及如何将会话分组为集群的实例。将理解,图8提供一种简化后的情况。在图8中,每个会话对应于一个位置和时间。实际上,位置数据可能不以均匀时间间隔提供,因为用户通常更随机地从一个位置移动到另一个位置,并且不会以恒定速率发送数据。会话可以包括许多个体数据点,如会话I示出那样。此外,在图8中,以地址(例如,200号大街)的形式提供位置信息。但是,位置信息通常采用(经度,玮度)地理坐标的形式。会话和集群处理通常基于此类地理坐标。在下面讨论的“注释”处理步骤(步骤606)期间,可以添加地址(例如,200号大街)或其它更高级位置描述符。
[0116]通常基于集群包含的会话数量对集群加权。因此,对于特定ID,通常具有表示访问次数最多的地理位置的主集群,后跟任何数量的辅助集群。在图8中,集群I是主集群,并且具有最高权重。集群2和3是辅助集群。
[0117]集群可以被构造为补偿小的局部移动(例如,与位置数据点关联的噪声),同时还准确地确定与该移动关联的特定位置。实现该目的的一种方法是将地理位置分为例如50 X50平方米的重叠图块。图9A-9G示出根据某些实施例的用于小地理区域的这种划分。图9A-9G中示出的每个图块是50X50平方米。示出的图块彼此偏移图块的一半长度,即偏移25米。使用图9A-9G中示出的重叠排列,所限定的区域中的任何点都将落入四个图块内。例如,坐标为(10,10)的点落入图9A、9E、9F和9G中示出的图块内。再如,坐标为(49,49)的点落入图9A、9B、9C和9D中示出的图块内。将理解,图块可以在保持重叠模式的情况下延伸到图9中示出的范围之外,以便覆盖更大的地理区域。
[0118]在某些实施例中,LIF模块112可以微调所确定的集群。在某些情形下,目标实体可以由于两个不同原因访问两个邻近位置。例如,在上班路上,目标实体有规律地访问纽约的格林威治街300号以便喝杯咖啡,并且在回家路上,目标实体有规律地访问纽约格林威治街301号以便获取食物。如果位置数据不准确,则可能将两个实体合并为单个集群,并且无法分离合并后的实体。
[0119]LIF模块112可以通过基于与会话关联的各种特征(而不是仅基于位置坐标)聚集会话来解决该问题。例如,LIF模块112可以基于路径或坐标的时间进展或访问时间来创建集群。更具体地说,在步骤706-712中,LIF模块112可以通过不仅考虑物理邻近性,而且还考虑其它类型的相关信息(例如,时间信息)来标识集群。在其中两个邻近位置具有不同语义显著性的情况下,该特性很有用。例如,当同一建筑物(因此同一玮度/经度对)处的两个楼层由两个不同公司经营时,该特性很有用。
[0120]为此,在步骤706中,LIF模块112可以量化会话的时间以及地理坐标(或者,如果LIF模块112未标识会话,则量化位置数据点的地理坐标)。具体地说,LIF模块112可以被配置为标识公共时间模式。例如,会话或位置数据点与“工作日结束”或“星期六早上”关联。然后,LIF模块112可以被配置为将会话或位置数据点添加到上次访问的集群或最近N个访问的集群。
[0121]在某些实施例中,LIF模块112可以被配置为使用最大似然模型聚集事件。LIF模块112可以被配置为基于沿着任意信息轴(例如,时间、先前位置)的信息增益来表征集群。然后,当LIF模块112接收到要添加到集群之一的新事件时,LIF模块112确定该新事件与集群相关联的似然,并且选择具有最大似然的集群。
[0122]更具体地说,为了基于信息增益表征集群,LIF模块112可以被配置为接收当前在集群中的所有数据点,并且量化与这些数据点关联的字段值(例如,属性)。然后,LIF模块112可以构造这些量化后的字段的直方图,并且将它们解释为统计分布。随后,当LIF模块112接收新事件时,LIF模块112可以通过以下操作确定应该将新事件添加到的集群:量化新事件中的字段,基于先前构造的直方图确定新事件属于该集群的概率(例如,P(eventcluster)),并且选择概率最高的集群。在某些实施例中,为了避免其中概率P (eventcluster)是O的
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1