用于分析目标实体的移动的装置、系统和方法与流程

文档序号:18562142发布日期:2019-08-30 23:26阅读:156来源:国知局
用于分析目标实体的移动的装置、系统和方法与流程

相关申请的交叉引用

根据美国法典第35篇第119(e)条,本申请要求以下临时申请的较早提交日期的权益:

·2013年3月15日提交的标题为“systemforanalyzingandusinglocationbasedbehavior(用于分析和使用基于位置的行为的系统)”的第61/799,986号美国临时申请;

·2013年3月15日提交的标题为“geographiclocationdescriptorandlinker(地理位置描述符和链接器)”的第61/800,036号美国临时申请;

·2013年3月15日提交的标题为“systemandmethodforcrowdsourcingdomainspecificintelligence(用于众包领域特定智能的系统和方法)”的第61/799,131号美国临时申请;

·2013年3月15日提交的标题为“systemwithbatchandrealtimedataprocessing(具有批量和实时数据处理的系统)”的第61/799,846号美国临时申请;以及

·2013年3月15日提交的标题为“systemforassigningscorestolocationentities(用于为位置实体分配得分的系统)”的第61/799,817号美国临时申请。

本申请还涉及:

·与本申请同一日期提交的标题为“apparatus,systems,andmethodsforanalyzingmovementoftargetentities(用于分析目标实体移动的装置、系统和方法)”的第14/214,208号美国专利申请;

·与本申请同一日期提交的标题为“apparatus,systems,andmethodsforprovidinglocationinformation(用于提供位置信息的装置、系统和方法)”的第14/214,296号美国专利申请;

·与本申请同一日期提交的标题为“apparatus,systems,andmethodsforcrowdsourcingdomainspecificintelligence(用于众包领域特定智能的装置、系统和方法)”的第14/214,213号美国专利申请;

·与本申请同一日期提交的标题为“apparatus,systems,andmethodsforbatchandrealtimedataprcessing(用于批量和实时数据处理的装置、系统和方法)”的第14/214,219号美国专利申请;

·与本申请同一日期提交的标题为“apparatus,systems,andmethodsforanalyzingcharacteristicsofentitiesofinterest(用于分析感兴趣实体的特征的装置、系统和方法)”的第14/214,309号美国专利申请;以及

·与本申请同一日期提交的标题为“apparatus,systems,andmethodsforgroupingdatarecords(用于对数据记录进行分组的装置、系统和方法)”的第14/214,231号美国专利申请。

上面引用的每个申请(包括临时申请和非临时申请)的全部内容在此引入作为参考。

本公开一般地涉及用于分析目标实体的移动的数据处理装置、系统和方法。



背景技术:

许多服务提供者可以访问许多移动设备的位置信息。服务提供者与配备有诸如全球定位系统(gps)之类的地理定位系统的移动设备通信,该地理定位系统被配置为确定关联移动设备的位置,并且这些移动设备能够与服务提供者共享其位置信息。位置信息对于服务提供者而言能够很有用,因为服务提供者能够基于移动设备的位置调整服务。例如,推荐餐馆的移动应用能够基于所确定的运行该应用的移动设备的位置,对推荐的餐馆列表进行重新排序。

尽管近年来对位置信息的使用明显增加,但对位置信息的使用仍然相当有限。位置信息通常被视为时间无关的测量。因此,尽管服务提供者基于移动设备在特定时间点的位置调整其服务,但服务提供者在很大程度上忽略移动设备在某时间段内的行进路径。因此,服务提供者在很大程度上忽略嵌入位置信息中的丰富上下文信息。需要提供用于提取嵌入位置信息中的丰富上下文信息的有效机制。



技术实现要素:

通常,在一个方面,所公开的主题的实施例能够包括一种装置。所述装置包括一个或多个接口,所述一个或多个接口被配置为提供与计算设备的通信。所述装置还包括与所述一个或多个接口通信的处理器。所述处理器被配置为运行一个或多个模块,所述一个或多个模块可操作以便导致所述装置从所述计算设备接收对应于目标实体的时间系列位置数据点,基于所述时间系列位置数据点确定与所述目标实体关联的一个或多个属性,以及基于与所述目标实体关联的所述一个或多个属性提供所述目标实体的简档。

通常,在一个方面,所公开的主题的实施例能够包括一种方法。所述方法能够包括由第一计算设备从第二计算设备接收对应于目标实体的时间系列位置数据点,由所述第一计算设备基于对应于所述目标实体的所述时间系列位置数据点确定与所述目标实体关联的一个或多个属性,以及由所述第一计算设备基于与所述目标实体关联的所述一个或多个属性提供所述目标实体的简档。

通常,在一个方面,所公开的主题的实施例能够包括一种非瞬时性计算机可读介质。所述非瞬时性计算机可读介质能够包括可执行指令,所述可执行指令可操作以便导致数据处理装置从与所述数据处理装置通信的计算设备接收对应于目标实体的时间系列位置数据点,基于对应于所述目标实体的所述时间系列位置数据点确定与所述目标实体关联的一个或多个属性,以及基于与所述目标实体关联的所述一个或多个属性提供所述目标实体的简档。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:确定所述时间系列位置数据点的准确性,以及基于所确定的准确性丢弃所述时间系列位置数据点中的一个或多个所述位置数据点。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:基于与其它目标实体关联的时间系列位置数据点,确定所述时间系列位置数据点的所述准确性。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:基于在特定时间点的与其它目标实体关联的位置信息,确定所述时间系列位置数据点在所述特定时间点的所述准确性。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:通过对以空间和/或时间界定的所述时间系列位置数据点中的一个或多个进行分组,从所述时间系列位置数据点确定一个或多个会话,以及基于所述一个或多个会话确定与所述目标实体关联的所述一个或多个属性。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:通过对以空间和/或时间界定的所述时间系列位置数据点中的一个或多个进行分组,从所述时间系列位置数据点确定一个或多个会话,根据会话之间的物理邻近性确定基于所述一个或多个会话的一个或多个集群,以及基于所述一个或多个会话和所述一个或多个集群确定与所述目标实体关联的所述一个或多个属性。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:将所述位置数据点、所述会话或所述集群中的一个与所述位置数据点、会话或集群的地理位置所关联的注释信息相关联,并且使用所述注释信息确定与所述目标实体关联的所述一个或多个属性。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:基于所述目标实体在两个或更多集群之间的移动,确定与所述目标实体关联的所述一个或多个属性。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:至少部分地基于有关所述目标实体的移动的统计测量和与所述目标实体关联的所述注释信息,确定归属位置属性。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:至少部分地基于特定位置与居住地关联的似然,确定归属位置属性。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:至少部分地基于与所述目标实体关联的位置数据点的时间戳,确定归属位置属性。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:以批量模式接收所述时间系列位置数据点,其中所述计算设备是由服务提供者操作的服务器。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:以流模式接收所述时间系列位置数据点,其中所述计算设备是所述目标实体。

在此处公开的任何一个实施例中,所述装置、所述方法或所述非瞬时性计算机可读介质能够包括用于以下操作的模块、步骤或可执行指令:基于所述一个或多个属性确定预测模型,其中所述预测模型被配置为预测所述目标实体在将来的行为。

附图说明

当结合以下附图考虑时,可以参考以下详细描述更全面地理解本公开的各种目标、特性和优点,其中相同的参考标号标识相同的元素。以下附图仅用于例示目的而并非旨在限制所公开的主题,所公开的主题的范围在随附权利要求中给出,这些附图是:

图1示出根据某些实施例的位置信息分析系统的图;

图2示出根据某些实施例的一个活动区域(aoa);

图3示出根据某些实施例的一组活动区域(aoa);

图4示出根据某些实施例的aoa之间的移动模式;

图5a-5c示出根据某些实施例的aoa周围的用户活动的简档;

图6示出根据某些实施例的用于生成目标实体的简档的过程;

图7示出根据某些实施例的用于将两个或更多会话聚集为集群的过程;

图8示出根据某些实施例的如何将位置数据点分组为会话以及如何将会话分组为集群的实例;

图9a-9g示出根据某些实施例的用于小地理区域的这种划分;

图10示出根据某些实施例的目标实体的简档的地理属性;

图11示出根据某些实施例的目标实体的简档的归属位置属性;

图12示出根据某些实施例的在目标实体的简档中提供的位置实体的列表;

图13a-13b示出根据某些实施例的目标实体的简档的dma属性和metro属性;

图14示出根据某些实施例的目标实体的简档的人口统计属性;

图15示出根据某些实施例的目标实体的简档的行为属性;

图16示出根据某些实施例的表格形式的目标实体的简档;

图17a-17b示出根据某些实施例的用于训练和应用预测行为模型的过程。

具体实施方式

本公开涉及用于提供位置信息分析机制的装置、系统和方法。位置信息分析机制被配置为分析位置信息以便提取有关移动设备或移动设备用户(被统称为目标实体)的上下文信息(例如,简档)。在高级别,位置信息分析机制可以包括分析与目标实体关联的位置数据点以便确定与目标实体关联的特性,并且使用所述特性预测与目标实体关联的属性。一组预测的属性可以形成目标实体的简档。

更具体地说,位置信息分析机制可以分析时间系列(time-series)位置信息(也被称为位置数据点,或简称为位置信息)。位置信息可以包括地理空间坐标、地址,或者能够标识位置的任何位置标识符。位置信息分析机制可以分析时间系列位置信息(例如由目标实体产生的时间系列地理空间坐标),以便确定与目标实体关联的特征(例如,特性)。随后,位置信息分析机制可以使用所确定的目标实体特性来确定目标实体的一个或多个简档。简档可以包括描述目标实体的一组高级属性,包括基于目标实体的行为的分类。例如,位置信息分析机制可以生成简档,该简档指示特定移动设备由某人使用,此人的主要居住地在加利福尼亚州的贝弗利希尔斯,并且主要工作地点在加利福尼亚州的洛杉矶。服务提供者(例如提供目标实体内容的发布者和开发者)可以使用该简档,以便根据目标实体个性化其应用并且定制其内容。

在某些实施例中,位置信息分析机制使用的实体的特性可以包括有关实体(或实体的用户)的时间无关的信息。例如,特性可以指示移动设备用户经常去往小学,该用户经常去往购物中心,并且该用户的公寓位于加利福尼亚州洛杉矶附近。实体的特性还可以提供时间无关的信息之间的时间关系。参考上面提供的实例,特性可以指示移动设备用户在早上去往其小孩就读的学校,该用户随后去往购物中心,该用户在下午返回到其小孩就读的学校,并且该用户随后返回到其在洛杉矶附近的公寓。位置信息分析机制可以使用这些特性预测有关用户的信息,例如用户并未在一天的全部时间内工作。

在某些实施例中,服务提供者可以使用简档预测目标实体的未来行为,并且基于预测的未来行为,为目标实体提供适合的服务。例如,位置信息分析机制可以使用一个或多个简档生成预测模型,该预测模型可以预测对应目标实体在任何给定时间可能位于的位置和/或位置/地点的类型。还可以组合这些简档,以便确定作为一个整体的一组目标实体的特征。

在某些实施例中,所公开的位置信息分析机制可以通过使用会话和集群表示时间系列位置信息,有效地确定目标实体的一个或多个简档。时间系列位置信息包括通常在连续时间点测量的位置数据点序列。在某些情况下,连续时间点可以具有均匀间隔;在其它情况下,连续时间点可以具有不均匀间隔。所公开的位置信息分析机制可以将时间系列位置信息分段,以便生成会话和集群。例如,位置信息分析机制可以将地理空间坐标分组(或分段)为会话,并且将会话分组为集群。时间系列位置信息的这种基于会话和集群的表示可以在接收到用于新时间点的额外位置信息时,不需要重新计算或重新处理全部时间系列位置信息。

在某些实施例中,所公开的位置信息分析机制可以将目标实体的位置数据点、会话和/或集群与注释信息相关联,该注释信息可以提供有关位置数据点、会话和/或集群的元数据。注释信息可以是用于确定与目标实体关联的属性的特性之一。注释信息可以从外部源接收,这些外部源例如包括所公开的位置信息分析机制可以访问的网站、数据库或任何源信息。

在某些实施例中,所公开的位置信息分析机制可以基于仅1个位置数据点而提供简档。但是,随着位置数据点数量的增加,所生成的简档的准确性和内容可以改进。因此,在某些实施例中,所公开的位置信息分析机制可以基于多于3个位置数据点、5个位置数据点、10个位置数据点或任何预定数量的位置数据点而提供简档。

在某些实施例中,简档中的一个或多个属性可以与置信度得分关联,该置信度得分指示关联属性的置信度得分或准确性。在某些情况下,置信度得分的范围可以在0和1之间。但是,可以使用任何其它范围表示置信度得分。

在某些情况下,如果所公开的位置信息分析机制可以访问很长一段时间内的大量位置数据点,则所公开的位置信息分析机制可以确定目标实体的时间相关(或具有时间范围的)简档。例如,所公开的位置信息分析机制可以确定移动设备的用户喜欢晚上11点-凌晨1点之间在加利福尼亚州洛杉矶附近的in-n-out快餐店吃夜宵。

在某些实施例中,位置信息分析机制可以使用一种或多种机器学习技术来确定或完善一个或多个简档中的属性。例如,如果目标实体的简档的特定属性缺失,则位置信息分析机制可以基于有关目标实体的已知信息,填充(或预测)缺失的信息。在某些实施例中,这可以使用逻辑回归完成。在其它实施例中,它可以使用其它机器学习技术,例如但不限于随机森林、线性回归、隐马尔可夫模型和神经网络。

用于位置信息分析机制目的的机器学习技术可以包括任何功能(function),该功能接收“训练数据”集合(例如,指定为行,每个行包含多个特性标量和一个或多个目标标量),并且产生估计器或“模型”,该估计器或模型从不包括训练数据的新数据行的输入特性来预测目标值。不严格地说,例如可以作为估计器预测新数据行的目标值的能力来衡量估计器的质量。例如,给出“golfers(高尔夫球员)”和用于已知“golfers”的一组有注释的会话的实例(即,训练数据),则系统可以确定“sessionsongolfcourses(有关高尔夫球场的会话)”与“golfers”高度相关,并且为“sessionsongolfcourses”特性分配导致针对“golfers”的更优目标值预测的值。

实际上,多达数百万个此类特性可以交互,以便产生用于预测此类目标的模型。在某些实施例中,系统可以包括对目标或简档进行聚集或分组的机器学习技术。在这些情况下,系统可以包括任何功能,该功能接收数据集合(例如指定为行,每个行包含多个特性标量),并且产生预测目标集群的估计器或“模型”。例如,此类功能可以帮助标识看似形成组的类似特性(例如行为模式)。这种分组可以用于建议新目标简档,可以为这些新目标简档提供后续名称(例如在人类解释集群成员拥有的常见定性方面之后,“cluster123ofsimilarthings(类似事物集群123)”变成“divebarlovers(廉价酒吧爱好者)”)。此外,分组可以与期望行为或质量(例如点击广告)相关,并且集群的其它成员可以被标记为是登广告者所期望的(不必解释什么定性方面使他们这样做)并且是广告的目标。

在某些实施例中,位置信息分析机制可以针对每个简档(例如,每个行为分段)使用单独的估计器。例如,位置信息分析机制可以从可观察的属性(例如“numberofvisitstoarestaurantperweek(每周餐馆的顾客数量)”或“numberofvisitstostarbucks(星巴克的顾客数量)”)构建特性标量,并且针对不同的变量(例如“userisafoodconnoisseur(用户是美食家)”或“userisespeciallyaffluent(用户极其富有)”)使用单独的估计器。

位置信息分析机制可以可选地包括用于清理(或丢弃)不准确位置数据点的智能数据处理机制。位置数据点可以是断续的并且具有不同的质量。位置信息的质量可以变化,这是由于位置信息的源和准确性具有很大的差异。例如,可以基于大量源确定位置信息:移动设备的网际(ip)地址、移动设备附接到的手机信号塔、移动设备附接到的wifi接入点和/或移动设备中运行的全球定位系统(gps)。但是,所确定的位置信息的准确性可以显著变化。从移动设备的ip地址确定的位置信息通常高度不准确,而从wifi接入点或gps确定的位置信息通常更加准确。为了解决该问题,所公开的位置信息分析机制结合多种数据验证技术,这些技术在提交位置信息时清理该信息。取决于应用,位置信息分析机制可以可选地丢弃大约15-25%的位置信息,因为这些信息与简档构建无关。该数据清理过程可以改进所生成的目标实体简档的准确性。

图1示出根据某些实施例的位置信息分析系统的图。系统100包括服务器102、通信网络104、一个或多个客户机设备106和服务提供者118。服务器102可以包括处理器108、存储设备110、位置信息格式化(lif)模块112、位置信息分析(lia)模块114和一个或多个接口116。

服务器102的处理器108可以以硬件实现。处理器108可以包括专用集成电路(asic)、可编程逻辑阵列(pla)、数字信号处理器(dsp)、现场可编程门阵列(fpga)或任何其它集成电路。处理器108还可以包括一个或多个任何其它适用的处理器,例如组合cpu、应用处理器和闪存的一个或多个的片上系统,或者精简指令集计算(risc)处理器。处理器108的存储设备110可以包括计算机可读介质、闪存、磁盘驱动器、光盘驱动器、可编程只读存储器(prom)和/或只读存储器(rom)。

lif模块112可以被配置为接收目标实体的时间系列位置信息(例如,对应于目标实体的移动的时间系列地理位置坐标),并且将时间系列位置信息分段为会话。此外,lif模块112还可以将两个或更多会话分组(或合并)为集群,并且可选地基于来自外部数据源的信息,将注释信息添加到会话和/或集群。在某些实施例中,lif模块112可以从与多个目标实体关联的地理位置坐标中提取对应于单个目标实体的所有地理位置坐标,并且生成对应于该单个目标实体的会话、集群和/或注释信息。在某些实施例中,注释信息可以包括以下一个或多个:人口统计信息,例如有关某个位置的位置住房成本统计的人口普查数据(例如来自公共记录以便知道平均房屋销售价格或租赁成本);先前在不同时间从该位置处的设备收集的环境噪声测量;来自源于该位置的社交网络数据(例如推特或社交网络站点帖子)的情感或关键字;附近企业的名称和类别;来自对附近企业的评论的关键字和评级;犯罪统计、卫星图像(例如为了判定是否具有水池);来自公共记录的地界线多边形(例如为了确定居住地的大小,例如房屋、公寓或共有公寓);从该位置附近的设备收集的加速度计数据(例如为了知道是步行交通还是车辆)。

在某些实施例中,lif模块112可以以批量模式接收地理位置坐标。在其它实施例中,lif模块112可以以流模式接收地理位置坐标。

lia模块114可以被配置为分析由lif模块112生成的会话、集群和/或注释信息,以便确定目标实体(例如客户机106)的简档。简档可以包括描述目标实体的一组高级属性。取决于关联的高级属性,简档可以被表征为:行为简档,其描述目标实体的行为特征;人口统计简档,其描述对应于目标实体的人口统计分组或市场细分,例如年龄范围、社会阶层范围和性别范围;或者地理简档,其描述关联系列事件的位置或目标实体访问的位置。行为简档、人口统计简档和地理简档中的一个或多个可以形成针对目标实体的单个聚合简档。

在某些实施例中,lia模块114可以使用机器学习技术来生成简档。例如,lia模块114可以使用随机森林技术来从会话、集群和/或注释信息确定简档属性。

在某些实施例中,lif模块112和/或lia模块114可以以存储在非瞬时性存储设备110(例如非瞬时性计算机可读介质)中的软件实现。存储在存储设备110中的软件可以在能够执行计算机指令或计算机代码的处理器108上运行。

在某些实施例中,lif模块112和/或lia模块114可以以使用asic、pla、dsp、fpga或任何其它集成电路的硬件实现。在某些实施例中,lif模块112和lia模块114两者可以在同一集成电路(例如asic、pla、dsp或fpga)上实现,从而形成片上系统。

在某些实施例中,服务器102可以从服务提供者118接收目标实体的位置信息。服务提供者118可以与一个或多个客户机106通信以便接收与客户机106关联的位置数据点,并且向服务器102提供所接收的位置数据点。在某些实施例中,服务提供者118可以聚合预定时间段内的位置数据点,并且批量提供聚合的位置数据点。在其它实施例中,服务提供者118可以将位置数据点流式传输到服务器102,或者将在很短一段时间内聚合的位置数据点发送到服务器102。服务提供者118可以包括软件服务提供者、应用提供者、通信服务提供者、发布者或任何其它类型的服务提供者。

在某些实施例中,服务器102可以例如经由软件应用编程接口(api)与客户机106直接通信,以便接收客户机106的位置信息。服务器102随后可以分析位置信息以计算客户机106的简档。然后,服务器102可以递增地或以批量模式,或者当感兴趣的新属性被添加到简档时,向服务提供者提供所计算的简档。

服务器102可以包括一个或多个接口116。一个或多个接口116提供通信机制以便在服务器102的内部和外部进行通信。例如,一个或多个接口116使能通过通信网络104与客户机106和/或服务提供者118通信。一个或多个接口116还可以提供到其它服务器、服务提供者118或耦合到网络104的计算机的应用编程接口(api),以便服务器102可以接收诸如地理位置坐标之类的位置信息。一个或多个接口116以硬件实现,以便以各种介质(例如光、铜和无线)并且以多种不同协议(其中某些协议可以是非瞬时性的)发送和接收信号。

在某些实施例中,服务器102可以使用操作系统(os)软件操作。在某些实施例中,os软件基于linux软件内核并且在服务器中运行特定应用,例如监视任务和提供协议栈。os软件允许针对控制和数据路径单独分配服务器资源。例如,某些分组加速卡和分组业务卡专用于执行路由或安全控制功能,而其它分组加速卡/分组业务卡专用于处理用户会话业务。随着网络要求的变化,在某些实施例中可以动态部署硬件资源以便满足要求。

可以将服务器的软件分为执行特定功能的系列任务。这些任务根据需要彼此通信以便在服务器102中共享控制和数据信息。任务可以是执行与系统控制或会话处理相关的特定功能的软件过程。在某些实施例中,在服务器102中运行三种类型的任务:关键任务、控制器任务和管理器任务。关键任务控制与服务器处理调用的能力相关的功能,例如服务器初始化、错误检测和恢复任务。控制器任务可以向用户隐藏软件的分布式性质,并且执行诸如以下任务:监视从属管理器(多个)的状态,在同一子系统中提供管理器内通信,并且通过与属于其它子系统的控制器(多个)通信而使能子系统间通信。管理器任务可以控制系统资源并且维护系统资源之间的逻辑映射。

可以将在应用卡中的处理器上运行的个体任务分为子系统。子系统是执行特定任务或者作为多个其它任务的终点(culmination)的软件元素。单个子系统包括关键任务、控制器任务和管理器任务。在服务器102上运行的某些子系统包括系统启动任务子系统、高可用性任务子系统、共享配置任务子系统和资源管理子系统。

系统启动任务子系统负责在系统启动时启动一组初始任务,并且根据需要提供个体任务。高可用性任务子系统与恢复控制任务子系统协同工作,以便通过监视服务器102的各种软件和硬件组件而维护服务器102的操作状态。恢复控制任务子系统负责针对服务器102中出现的故障执行恢复动作,并且从高可用性任务子系统接收恢复动作。将处理任务分发成并行运行的多个实例,以便如果出现不可恢复的软件故障,则不会失去用于该任务的全部处理能力。

共享配置任务子系统可以为服务器102提供设置、检索和接收服务器配置参数更改的通知的能力,并且负责存储用于在服务器102中运行的应用的配置数据。资源管理子系统负责为任务分配资源(例如,处理器和存储能力),并且负责监视任务的资源使用。

在某些实施例中,服务器102可以驻留在数据中心中,并且形成云计算基础架构中的节点。服务器102还可以根据需要提供服务。托管客户机的模块能够从一个服务器无缝迁移到另一个服务器,而不会导致程序故障或系统崩溃。可以使用管理系统管理云上的服务器102。尽管图1将服务器102表示为单个服务器,但服务器102可以包括多个服务器。

客户机106(其可以是位置信息分析平台的目标实体)可以包括台式计算机、移动计算机、平板计算机、蜂窝设备,或者具有处理器和存储器的任何其它计算设备。服务器102和一个或多个客户机设备106可以经由通信网络104通信。

在某些实施例中,客户机106可以包括蜂窝网络的用户设备。用户设备与一个或多个无线电接入网络通信,并且与有线通信网络通信。用户设备可以是具有语音通信能力的蜂窝电话。用户设备还可以是提供诸如以下服务的智能电话:字处理、web浏览、游戏、电子书能力、操作系统和整字键盘。用户设备还可以是平板计算机,其提供网络接入和智能电话提供的大部分服务。用户设备使用诸如以下操作系统操作:symbianos、iphoneos、rim的blackberry、windowsmobile、linux、hpwebos和android。屏幕可以是用于将数据定位到移动设备的触摸屏,在这种情况下可以使用屏幕代替整字键盘。用户设备还可以保存全球定位坐标、简档信息或其它位置信息。

客户机106还包括能够计算的任何平台。非限制性实例可以包括计算机、上网本、膝上型计算机、服务器和具有计算能力的任何设备。客户机106具备一个或多个处理器,这些处理器处理指令并且运行可以存储在存储器中的软件。处理器还与存储器通信,并且对接以便与其它设备通信。处理器可以是任何适用的处理器,例如组合cpu、应用处理器和闪存的片上系统。客户机106还可以提供各种用户接口,例如键盘、触摸屏、轨迹球、触摸板和/或鼠标。在某些实施例中,客户机106还可以包括扬声器和显示设备。

通信网络104可以包括因特网、蜂窝网络、电话网络、计算机网络、分组交换网络、线路交换网络、局域网(lan)、广域网(wan)、全球区域网络,或者任何数量的专用网络(当前被称为内联网),和/或可以适合数据通信的任何其它网络或网络组合。此类网络可以使用任何数量的硬件和软件组件、传输介质和网络协议实现。尽管图1将网络104表示为单个网络,但网络104可以包括上面列出的多个互连网络。

服务器102可以被配置为基于与目标实体关联的位置信息,对特定活动区域(aoa)—目标实体多次访问的位置—进行标识和分类。服务器102随后统一分析aoa以便确定行为和参考的模式,并且将这些模式变成地理、人口统计和/或行为简档。图2示出根据某些实施例的一个活动区域。在图2中,将单个目标实体的不规则和断续的活动202a-202c规范化为一个活动区域(aoa)204。

可以将单个目标实体的aoa聚合成一组aoa。图3示出根据某些实施例的一组aoa。aoa204a-204o的大小可以指示该aoa中的活动在预定时间段内的相对频率。在确定该组aoa之后,服务器102可以分析aoa204之间的移动的一般模式,并且按照重要性对它们进行排序。图4示出根据某些实施例的aoa之间的移动模式。例如,图4使用线406示出移动设备频繁地在圣塔莫尼卡(santamonica)402和洛杉矶(losangeles)404之间旅行。两个aoa之间的旅行频率可以使用桥接两个aoa的线406的粗度示出,或者通过使用颜色编码方案示出。该分析可以使服务器102能够确定与家庭居住地关联的邮政编码、典型的通勤开始和结束时间以及日间行为模式,以便通知预测模型。

在某些实施例中,可以将aoa周围的用户活动汇总在简档中。图5a-5c示出根据某些实施例的aoa周围的用户活动的简档。图5a示出加利福尼亚州圣塔莫尼卡周围的用户活动的简档,服务器102将圣塔莫尼卡标识为“家”。简档可以包括地图502,该地图指示促成aoa506的一个或多个位置数据点504。简档还可以包括时间表508,该时间表指示促成aoa506的位置数据点504在aoa506附近出现的时间点。简档可以进一步包括促成aoa506的位置数据点504的概要510。图5b同样示出在被标识为工作地点的洛杉矶(losangeles)周围的用户活动的简档。图5c示出与预定准则关联的用户活动。在这种情况下,预定准则是“在匹配附近餐馆的位置处从正午到凌晨1点洛杉矶(losangeles)周围的用户活动。(useractivitiesaroundlosangeles(losangeles)fromnoonto1pmatlocationsmatchingnearbyrestaurants.)”。此类预定准则允许服务器102推断用户在预定位置处的活动。

除了这些aoa的位置、排序和企业类别及其相对重要性之外,服务器102可以在用户简档中提供所有城市、区域、国家、都会区域和dma的排序明细。更具体地说,服务器102可以被配置为判定特定位置是否在与特定城市、区域、国家、都会区域和/或dma对应的多边形(或感兴趣区域)中,并且作为用户简档的一部分而提供所确定的信息。例如,服务器102被配置为使用诸如纬度/经度对之类的位置信息,以便标识包含与所述位置信息关联的位置的所有“区域”(例如,多边形)。这允许服务器102接收与这些区域的每一个关联的属性,例如包括区域的名称、包含区域的地区的名称,以及与区域或地区关联的任何元数据(例如平均收入、人口统计信息)。该信息允许内容提供者使用基于位置的上下文信息,以便当不存在地理信号时有效地定制内容事件。

图6示出根据某些实施例的用于生成目标实体的简档的过程。在步骤1中,lif模块112可以从服务提供者或移动设备106接收与一个或多个移动设备106关联的位置信息。在某些实施例中,位置信息可以包括目标实体的(1)地理空间坐标,(2)时间戳和/或(3)标识符(id)中的一个或多个。例如,单个位置数据点可以是[42.3583°n,71.0603°w(boston),10:30amjan.10,2012,johndoe’smobilephone],这指示某人的移动电话在2012年1月10日的上午10:30位于波士顿。位置数据点中的地理空间坐标可以采取坐标对的形式(例如[经度,纬度]),或者目标实体为了指示位置所采用的其它形式。使用具有该性质的多个位置数据点创建简档。在某些实施例中,服务提供者或目标实体可以对位置信息的标识符进行预散列,以便目标实体的实际用户对服务器102保持匿名。

在某些实施例中,lif模块112可以批量(例如,以聚合形式)接收位置信息。例如,服务提供者或目标实体可以随时间聚合位置信息,并且向lif模块112批量(例如,基本上同时)提供聚合后的位置信息。在其它实施例中,lif模块112可以在位置信息变得可用时(例如,以流模式)接收位置信息。例如,lif模块112可以在位置信息变得可用时,通过代表性状态传输(rest)接口从服务提供者或一个或多个目标实体接收位置信息。在某些实施例中,lif模块112可以在位置信息变得可用时批量接收位置信息。例如,lif模块112可以批量接收第一移动设备的位置信息,并且lif模块112可以以流模式(例如,在位置信息变得可用时)接收第二移动设备的位置信息。

在lif模块112接收位置信息之后,lif模块112可以预处理位置信息。具体地说,lif模块112可以被配置为量化接收的位置信息的空间维度。例如,lif模块112可以被配置为将地理空间坐标(例如,纬度/经度对)量化为预定精度的坐标。再如,lif模块112可以被配置为将地理空间坐标量化为地理散列表示。

在某些实施例中,因为位置信息可以由各种源(例如,设备上gps系统、web浏览器、具有地理标记的图像和企业登记)生成,所以某些接收的位置数据点可能不足够准确。如果位置数据点中的地理空间坐标不足够准确,则lif模块112可以丢弃位置数据点,并且丢弃的位置数据点不经受进一步处理。这种清理过程(例如,从进一步处理中发现和删除位置数据点的过程)可以跨多个用户标识符执行,并且可以跨多个数据集进行以获得更准确的结果。

在某些情况下,已知某些位置数据点已坏或不准确。例如,如果数据点对应于核电站的中心,或者对应于没有进入路径的沙漠,则数据点已坏或不准确的可能性很高。因此,在某些实施例中,lif模块112可以维护应该被丢弃的数据点特征的黑名单。例如,lif模块112可以将与已知地理实体(例如邮政编码和城市图心(centroid))或已知蜂窝塔位置的坐标对齐的位置数据点标识为列入黑名单,因为这些位置数据点对于感兴趣应用而言可能太粗糙。

在某些实施例中,如果表示位置数据点的准确性的置信度得分低于预定阈值,则lif模块112可以丢弃位置数据点。可以基于各种信息确定位置数据点的置信度得分。在某些情况下,如果特定位置在特定时间点被过度表示(例如,许多id同时与同一地理坐标关联),则位置数据点的置信度得分(指示目标实体在该特定时间点位于该特定位置处)可以很低。

例如,如果某城镇具有25,000名居民,并且如果聚合位置信息指示22,000个目标实体同时位于特定位置处,则指示目标实体位于该特定位置处的位置数据点可能不准确。因此,此类位置数据点可以与低置信度得分关联。再如,如果与特定位置关联的位置数据点的数量多于整组位置数据点的0.1%,则与该特定位置关联的位置数据点不准确的可能性极高。因此,此类位置数据点可以与低置信度得分关联。换言之,如果与特定位置关联的位置数据点的数量大于预定阈值,则与该特定位置关联的任何位置数据点可以被视为不准确并且与低置信度得分关联。

在某些实施例中,用于丢弃位置数据点的预定阈值可以适合于位置信息数据集的特征。例如,用于与小城镇关联的数据集的预定阈值可以不同于用于与加利福尼亚州洛杉矶关联的数据集的预定阈值。

在某些实施例中,lif模块112可以应用各种过滤器以便进一步丢弃不需要的数据点。例如,可以从进一步处理中排除没有足够数据量的目标实体。

在某些实施例中,lif模块112可以减少位置数据点中的噪声。因为预计目标实体的移动是平稳的,所以以特定位置为中心的任何快速移动都可以被视为噪声,该噪声可以源于位置感测设备的不理想特征,例如gps抖动。因此,lif模块112可以将时间噪声建模为高斯分布并且对位置数据点进行时间平均,以便从位置数据点中删除时间抖动。例如,如果目标实体每天晚上7点去往同一家星巴克,并且如果目标实体在晚上7点的位置信息指示用户在同一家星巴克附近,则lif模块112可以对gps坐标进行时间平均,以便平均后的gps坐标更密切地对齐同一家星巴克。在某些实施例中,lif模块112可以对与感兴趣位置时间点相隔预定时间窗口内的位置数据点进行平均。例如,lif模块112可以对与感兴趣位置数据点相隔5秒窗口内的位置数据点进行平均。在其它实施例中,lif模块112可以对属于前几天或前几个月的同一时间点的位置数据点进行平均。例如,在上面的星巴克实例中,lif模块112可以对与过去5天的晚上7点关联的位置数据点进行平均,以便删除今天的与晚上7点关联的位置数据点的噪声。

在步骤604中,lif模块112可以可选地从预处理后的位置信息确定会话和集群。会话是用于从位置数据点中删除冗余的抽象。该抽象可以将lif模块112与来自同一目标实体的类似或相同位置数据点的快速重新提交相隔离。例如,如果lif模块112在彼此一秒内从同一目标实体并且从同一位置接收第一位置数据点和第二位置数据点,则lif模块112可以将这些数据点折叠为单个会话,因为第二数据点未提供任何感兴趣的信息。查看会话的另一种方法是该会话标记了事件。lif模块112基本上将位置数据点流分组为高熵事件。

基于会话的该视图,会话可以包括来自同一目标实体(例如,同一标识符)的以空间和/或时间界定的一组位置数据点。因此,lif模块112可以被配置为对以空间和/或时间界定的任何位置数据点进行分组,并且使用该组中时间最早的位置数据点表示所有分组后的位置数据点。例如,会话可以包括(1)与洛杉矶中心的距离在5英里之内和/或(2)跨度在10分钟之内的一组位置数据点。因此,lif模块112可以被配置为对(1)与洛杉矶中心的距离在5英里之内和/或(2)跨度在10分钟之内的所有数据点进行分组,并且使用该组数据点中最早的位置数据点表示所有这些数据点。

在某些实施例中,可以使用多个参数表示会话。多个参数之一可以表示对应于会话的时间段;多个参数之一可以表示对应于会话的地理界限。因此,例如,单个会话可以包括当特定用户的移动电话在特定时间间隔(例如,从2012年6月12日的上午10:00到上午10:15)期间在特定位置(例如,在100-120号大街之间)时收集的所有位置数据点。因此,lif模块112可以使用多个参数将位置数据点分组为一个或多个会话。在某些实施例中,空间和/或时间的界限可以由服务器102的操作者提供。在其它实施例中,lif模块112可以使用诸如k平均聚集之类的聚集技术,自动确定空间和/或时间的界限。

在某些实施例中,会话可以包括事件。地理位置坐标序列的熵的快速变化可以指示两个不同事件之间的转变。因此,lif模块112可以被配置为确定地理位置坐标序列的熵的快速变化。

在某些实施例中,lif模块112可以使用地理多边形来从地理位置坐标序列标识会话。例如,地理多边形可以与洛杉矶中的特定建筑物关联。如果用户在地理多边形内,则与地理多边形关联的所有以时间界定的位置数据点可以被视为属于同一会话。lif模块112可以使用分层机制来快速判定位置数据点是否与特定地理多边形相关联。例如,lif模块112可以使用如在上面的“apparatus,systems,andmethodsforprovidinglocationinformation(用于提供位置信息的装置、系统和方法)”中公开的多边形匹配机制。

在会话处理期间,位置数据点可以与仅一个会话关联。相反,一个会话可与任何数量的位置数据点关联,前提是这些数据点满足空间和/或时间会话参数。例如,会话可以包括单个位置数据点。

在会话处理之后,会话中的位置数据点可以表示特定id访问的事件或地点。

在某些实施例中,lif模块112可能未从位置数据点标识任何会话。例如,lif模块112可以跳过会话标识步骤。这种情形与其中会话包括单个位置数据点的情形相同。因此,以下对使用会话确定集群和/或属性的讨论还可以适用于其中lif模块112未标识任何会话的情况。

在lif模块112从时间系列位置数据点标识一个或多个会话之后,lif模块112可以基于所标识的会话确定一个或多个集群。集群可以包括表示随时间的重复行为的会话的分组。在概念上,具有新地理空间位置的任何会话可以对应于新集群,并且可以将之后的会话添加到现有集群之一,前提是这些之后的会话满足特定地理准则。因此,lif模块112被配置为通过标识在地理上靠近集群中心的会话,将一个或多个会话分组为单个集群。例如,某人的移动电话第一次移动到新位置(例如,200号大街)时,可以将与该新位置关联的位置数据分组为新会话。如果该同一移动电话随后返回到该位置(200号大街),则可以将与该第二访问关联的数据分组为另一个会话。然后,可以将两个会话分组为单个集群,因为这些会话与同一位置关联。

图7示出根据某些实施例的用于将两个或更多会话聚集为集群的过程。在步骤702中,lif模块112可以可选地以时间顺序对会话进行排序。例如,lif模块112可以对会话进行排序,以便由较早的位置数据点表示的会话在由较后的位置数据点表示的会话之前出现。尽管该排序步骤不是必需的,但这允许lif模块112也对集群进行时间排序。

在步骤704中,lif模块112可以将第一会话指定为第一集群。在步骤706中,lif模块112可以分析后续会话,该会话在此被称为候选会话。具体地说,lif模块112可以确定候选会话的中心和现有集群的代表性会话的中心之间的距离。在步骤708中,lif模块112可以判定在步骤706中计算的距离的最小值是否小于预定阈值。如果是,则在步骤710中,lif模块112可以将候选会话与对应于最小距离的集群相关联。如果否,则在步骤712中,lif模块112可以针对候选会话创建新集群,并且将候选会话指定为新集群的代表性会话。

在步骤714中,lif模块112可以重复步骤706-712,直至每个会话均与集群关联。

在某些实施例中,在步骤706中,lif模块112可以被配置为计算候选会话的中心和现有集群中的所有会话的中心之间的距离,而不是候选会话的中心和现有集群的代表性会话的中心之间的距离。现有集群中的所有会话的中心可以包括由现有集群中的会话形成的图心(centroid)的中心。当将会话添加到集群时,lif模块112可以重新计算集群中的所有会话的中心。在某些实施例中,集群可以用作图2-5中示出的aoa。

图8示出根据某些实施例的如何将位置数据点分组为会话以及如何将会话分组为集群的实例。将理解,图8提供一种简化后的情况。在图8中,每个会话对应于一个位置和时间。实际上,位置数据可能不以均匀时间间隔提供,因为用户通常更随机地从一个位置移动到另一个位置,并且不会以恒定速率发送数据。会话可以包括许多个体数据点,如会话1示出那样。此外,在图8中,以地址(例如,200号大街)的形式提供位置信息。但是,位置信息通常采用(经度,纬度)地理坐标的形式。会话和集群处理通常基于此类地理坐标。在下面讨论的“注释”处理步骤(步骤606)期间,可以添加地址(例如,200号大街)或其它更高级位置描述符。

通常基于集群包含的会话数量对集群加权。因此,对于特定id,通常具有表示访问次数最多的地理位置的主集群,后跟任何数量的辅助集群。在图8中,集群1是主集群,并且具有最高权重。集群2和3是辅助集群。

集群可以被构造为补偿小的局部移动(例如,与位置数据点关联的噪声),同时还准确地确定与该移动关联的特定位置。实现该目的的一种方法是将地理位置分为例如50×50平方米的重叠图块。图9a-9g示出根据某些实施例的用于小地理区域的这种划分。图9a-9g中示出的每个图块是50×50平方米。示出的图块彼此偏移图块的一半长度,即偏移25米。使用图9a-9g中示出的重叠排列,所限定的区域中的任何点都将落入四个图块内。例如,坐标为(10,10)的点落入图9a、9e、9f和9g中示出的图块内。再如,坐标为(49,49)的点落入图9a、9b、9c和9d中示出的图块内。将理解,图块可以在保持重叠模式的情况下延伸到图9中示出的范围之外,以便覆盖更大的地理区域。

在某些实施例中,lif模块112可以微调所确定的集群。在某些情形下,目标实体可以由于两个不同原因访问两个邻近位置。例如,在上班路上,目标实体有规律地访问纽约的格林威治街300号以便喝杯咖啡,并且在回家路上,目标实体有规律地访问纽约格林威治街301号以便获取食物。如果位置数据不准确,则可能将两个实体合并为单个集群,并且无法分离合并后的实体。

lif模块112可以通过基于与会话关联的各种特征(而不是仅基于位置坐标)聚集会话来解决该问题。例如,lif模块112可以基于路径或坐标的时间进展或访问时间来创建集群。更具体地说,在步骤706-712中,lif模块112可以通过不仅考虑物理邻近性,而且还考虑其它类型的相关信息(例如,时间信息)来标识集群。在其中两个邻近位置具有不同语义显著性的情况下,该特性很有用。例如,当同一建筑物(因此同一纬度/经度对)处的两个楼层由两个不同公司经营时,该特性很有用。

为此,在步骤706中,lif模块112可以量化会话的时间以及地理坐标(或者,如果lif模块112未标识会话,则量化位置数据点的地理坐标)。具体地说,lif模块112可以被配置为标识公共时间模式。例如,会话或位置数据点与“工作日结束”或“星期六早上”关联。然后,lif模块112可以被配置为将会话或位置数据点添加到上次访问的集群或最近n个访问的集群。

在某些实施例中,lif模块112可以被配置为使用最大似然模型聚集事件。lif模块112可以被配置为基于沿着任意信息轴(例如,时间、先前位置)的信息增益来表征集群。然后,当lif模块112接收到要添加到集群之一的新事件时,lif模块112确定该新事件与集群相关联的似然,并且选择具有最大似然的集群。

更具体地说,为了基于信息增益表征集群,lif模块112可以被配置为接收当前在集群中的所有数据点,并且量化与这些数据点关联的字段值(例如,属性)。然后,lif模块112可以构造这些量化后的字段的直方图,并且将它们解释为统计分布。随后,当lif模块112接收新事件时,lif模块112可以通过以下操作确定应该将新事件添加到的集群:量化新事件中的字段,基于先前构造的直方图确定新事件属于该集群的概率(例如,p(event|cluster)),并且选择概率最高的集群。在某些实施例中,为了避免其中概率p(event|cluster)是0的情况,lif模块112可以将本底噪声(noisefloor)添加到针对每个集群构造的直方图。

在某些实施例中,lif模块112可以被配置为使用最大似然模型合并两个或更多集群。在某些情况下,lif模块112可以被配置为基于集群之间的联合熵来合并集群,该联合熵可以基于库尔贝克-莱布勒(kl)散度来测量。在其它情况下,lif模块112可以使用任何分层聚集技术合并集群。

在步骤606中,lif模块112可以可选地使用来自外部数据源的信息来注释会话和/或集群。在该步骤中,使用外部数据源丰富会话和集群,此过程称为注释。例如,将描述与位置关联的周围企业类别或人口统计信息的信息附加到该位置处的对应集群或会话。共同地,这些注释创建用于充实目标实体简档的丰富数据集,并且充当进一步注释的基础。

在某些实施例中,lif模块112可以从外部数据库接收注释数据。在其它实施例中,lif模块112可以分析网页上的文本以便生成注释数据。

在某些实施例中,可以进行某些内部优化以便减少lif模块112对外部数据源执行的查询数量。这些内部优化可以包括合并附近会话,以及通过内插结果重用旧查询。

在步骤608中,lif模块112可以向lia模块114提供与目标实体关联的会话、集群和/或注释数据,以便lia模块114可以基于会话、集群和/或注释数据,确定目标实体的一个或多个简档。

在某些实施例中,lif模块112可能未从会话和/或位置数据点标识任何集群。例如,lif模块112可以跳过集群标识步骤。这种情形与其中集群包括单个会话或单个位置数据点的情形相同。因此,下面的对使用集群确定属性的讨论还可适用于其中lif模块112未标识任何集群的情况。

lia模块114被配置为分析在某时段内的位置数据点、会话、集群和/或注释数据以便构建目标实体的一般描述,并且以简档的形式提供一般描述。简档可以是javascript对象表示法(json)散列。简档可以包括(1)描述目标实体的一个或多个属性值和(2)与一个或多个属性值关联的一个或多个置信度得分。在某些实施例中,属性值可以包括(1)活动区域,其按照企业类型分类并且按照国家、都会区域和dma汇总,(2)人口统计信息,其包括家庭收入(如果提供),和/或(3)行为特征和分类。简档可以被专门设计为增强服务提供者和个体用户之间的交互。简档可以帮助服务提供者提供正确的本地新闻和更相关的信息,以便按照位置定制信息内容,并且确保仅在正确时间为用户提供上下文最相关的信息。

在某些实施例中,简档的地理属性可以提供目标实体最活跃的位置的概述。可以以不同物理标度(例如以超本地、区域和/或国家标度)表示位置。简档还可以包括与用户活动关联的特定超本地地点,例如包括超本地地点的图心、关联的邮政编码、超本地地点的类型和/或区域的商业密度。图10示出根据某些实施例的简档的地理属性。简档的地理属性包括“活动区域(aoa)”项,该项包括aoa的标识符、aoa的中心、aoa中的商业密度(其测量aoa的对应于商业区域的部分)、与aoa关联的邮政编码,aoa的排序(例如,与aoa关联的频率或重要性),以及超本地地点的类型(例如,远离,其指示aoa不是主要活动区域。)

在某些实施例中,简档还可以包括指示目标实体的归属位置的属性。lia模块114可以被配置为通过以下各项确定归属位置(也被称为简档的归属属性):分析目标实体在aoa之间的移动模式、特定位置(例如,对应于特定位置的aoa)是否已知是(或可能是)居住地(例如包括房屋、公寓和共有公寓)、位置周围的商业/居住密度、特定位置(例如,对应于特定位置的aoa)相对于其它aoa的频率,和/或与移动模式关联的位置数据点的时间戳。在某些实施例中,归属位置可以被表示为邮政编码。在其它实施例中,归属位置可以被表示为地理空间坐标,例如gps坐标或纬度/经度坐标对。

图11示出根据某些实施例的目标实体的简档的归属(home)位置属性。归属位置属性可以指示对应于归属位置的图心(或aoa)的中心、aoa中的商业密度,以及邮政编码。在某些实施例中,归属位置属性中的邮政编码可以与归属位置本身关联。在其它实施例中,归属位置属性中的邮政编码可以与家所在的aoa关联。此类实施例可以改进用户的隐私性。在某些实施例中,商业密度可以被表示为百分比。例如,归属位置的图心中的居住区域的百分比可以是81.1%(如图11中指示),并且归属位置的图心中的企业的百分比可以是4.6%。商业密度在确定用户居住地的市区/郊区/农村上下文中可以很有用。

在某些实施例中,lia模块114可以被配置为提供其中用户活跃的位置实体的列表。位置实体可以包括国家、区域和/或所在地(城镇)。lia模块114可以以相对显著性的顺序提供此类位置实体的列表。在某些情况下,lia模块114可以基于在特定位置实体处花费的时间量,确定与位置实体关联的显著性。例如,当用户90%的时间待在家中时,家可以是重要的位置实体。在某些情况下,lia模块114可以基于与特定位置实体关联的注释的信息性如何,确定与位置实体关联的显著性。此外,在某些情况下,lia模块114可以基于与特定位置实体关联的行为如何重要,确定与位置实体关联的显著性。例如,当用户90%的时间待在家中,但用户还在早上和下午花费10分钟待在学校时,该位置实体可以很重要,因为它可以告诉我们用户可能是父母亲。

图12示出根据某些实施例的在目标实体的简档中提供的位置实体列表。每个位置实体可以与特定地理标度关联。例如,图12示出三个位置实体,第一实体与“countries(国家)”关联,第二实体与“regions(区域)”关联,并且第三实体与“localities(所在地)”关联。每个位置实体可以与唯一标识符(图12中被称为“factual_id”)关联,并且可以与位置数据点(例如纬度/经度坐标对)关联。此外,位置实体中的一个或多个项可以与置信度得分关联。

在某些实施例中,当目标实体与美国内的位置关联时,简档还可以包括其它地理概要。其它地理概要可以包括尼尔森的直接营销区域(dma)和/或其中用户活跃的metro(正式地为msa,如美国人口普查定义的)。图13a-13b示出根据某些实施例的目标实体的简档中的dma属性和metro属性。

在某些实施例中,lia模块114可以确定目标实体的简档的人口统计属性。具体地说,lia模块114可以基于用户的归属位置(美国人口普查数据以街区群级别聚合)和/或基于用户的活动,确定人口统计属性。图14示出根据某些实施例的目标实体的简档的人口统计属性。人口统计属性可以包括收入水平、性别、年龄、家庭类型和种族。此外,一个或多个人口统计属性可以与置信度得分关联。

在某些实施例中,lia模块114可以确定目标实体的简档的行为属性。行为属性可以将目标实体分类为一个或多个类别,这些类别可以用于在线广告。仅当置信度得分足够高以使目标设备有资格存在于这些类别中时,才对目标设备进行分类。图15示出根据某些实施例的目标实体的简档的行为属性。行为属性可以包括一个或多个预定类别和置信度得分,该置信度得分指示目标实体与一个或多个预定类别关联的似然。预定类别可以包括:目标实体是否由商业旅行者拥有,目标实体是否由休闲旅行者拥有,目标实体是否由频繁旅行者拥有,目标实体是否由医疗保健提供者拥有,目标实体是否由大学生拥有,目标实体是否由对购车感兴趣的人拥有,目标实体是否由常看电影的人拥有,目标实体是否由休假者拥有,目标实体是否由直播体育爱好者拥有,和/或目标实体是否由富裕客户拥有。可以跨数据集应用标准类别,以便查找共享趋势或模式的id组。

在某些实施例中,lia模块114可以基于与目标实体关联的会话、集群和/或注释数据,确定目标实体与特定类别关联的似然(也被称为类别置信度得分)。例如,有注释的集群可以指示id(目标实体)被偏置以便在更昂贵的人口统计区域中操作,并且有注释的会话可以指示id从一个位置行进到另一个位置。

在某些实施例中,可以定期地更新简档中的属性以便简档不会变得陈旧(或过时)。例如,lia模块114可以被配置为定期地重新计算简档的属性。此外,lia模块114可以被配置为在属性变老时减小属性的置信度得分值(例如,根据生成或计算属性的时间点)。

在某些实施例中,lia模块114可以使用交叉验证机制,以便判定目标实体是否与特定属性或类别关联。在高级别,lia模块114被配置为提取表示目标实体在任何给定时刻在做什么的特性。从附近地点(如果有)、时间本地化后的事件(例如音乐会)和地标生成这些特性。例如,当目标实体正在去往洛杉矶道奇体育场时,并且如果在该时间点道奇体育场正在举办摇滚音乐会,则目标实体可以优先地与摇滚音乐相关。再如,lia模块114可以通过确定目标实体在夜间(例如在晚上8点以后)返回到的位置或停留时间最多的位置,确定归属位置。

为此,lia模块114例如可以将企业类别、企业名称中的每个字以及有关事件的高级类别信息确定为个体特性。随后,lia模块114例如同等地对这些特性进行加权,并且使用结果向量的范数(例如,l1范数)来执行交叉验证。

对目标实体的行为进行分类中的一个挑战是确保lia模块114不会与模型过拟合。例如,假设lia模块114发现目标实体仅在7月17日星期五的下午15:38在星巴克的旁边。尽管在该时间点对应于目标实体的目标实体物理位置是非常强的信号,但花费精力缩小该观察的时间片范围不是特别有意义。因此,lia模块114可以考虑描述该观察所花费的工作量,以及当lia模块114就目标实体得出结论时的观察结果的强度。因此,例如,如果lia模块114连续四个星期五观察到目标实体在每个星期五下午4点在星巴克的旁边,则这是更有价值的洞察。

在某些实施例中,lia模块114被配置为基于特定空间-时间位置数据点(或集群)在时间系列位置数据点中的出现次数,确定目标实体的行为类别。为此,lia模块114被配置为(1)将位置数据点或集群的时间分量投影到循环空间(例如,24小时时间跨度,忽略日期),(2)确定位置数据点或集群的特定[空间,投影时间]表示在时间系列位置数据点中的出现次数,以及(3)确定时间系列位置数据点中的最高k个[空间,投影时间]。更具体地说,lia模块114被配置为(1)将每个位置数据点表示为一对[空间,投影时间],(2)构造此类对的频率表,并且可选地按照降频对频率表中的项进行排序,以及(3)标识该频率表中频率大于预定阈值(例如2)的对。

作为分类处理的结果,要指出的有用属性的其它实例是:

·特定的人是习惯性的星巴克顾客。尽管这个人去过国家的许多地方,但不管他/她的当前位置,他/她经常在上午8:30-9:00之间去星巴克。

·特定的人一贯地在高端、昂贵的商店购物,并且从不去低端、廉价的商店。

·特定的人喜欢汉堡包,并且可能去他所在位置方便到达的并且提供汉堡包的任何餐馆。

·特定的人是纽约扬基队的球迷;这个人参与扬基队的主客场比赛,并且还去销售体育纪念品的商店。

其它类型的分类是可能的,并且通常将取决于位置数据的质量以及已注释到位置信息的注释的类型。

在某些情况下,lia模块114可以批量执行简档计算。例如,服务提供者可以具有用于许多用户和设备的数月或数年的地理空间信息,并且lia模块114可以批量处理这些信息以便提供对所覆盖的时间跨度的分析。在其它情况下,lia模块114可以在新位置数据点变得可用时执行简档计算。例如,服务提供者可能没有在很长一段时间内的位置数据点的详细日志,而是可以实时访问短暂的位置数据点流或前一天的位置数据点的滚动日志。在这些情况下,服务提供者可以通过在新位置数据变得可用时断续地将新位置数据发布到lif模块112来使用lif模块112和lia模块114。

在某些实施例中,可以以批量或实时模式处理位置数据点。在实时模式下,lia模块114可以将新信息与过去信息对照以便构建新简档。这种对照可以通过任何数量的方式发生,例如键/值查找或表连接。在某些情况下,lia模块114可以执行新信息的初步处理,以便确定简档更新的优先级。例如,当lia模块114确定移动设备当前位于体育活动附近的感兴趣的边界框内时,lia模块114可以标记对应于移动设备的用户是用于接收简档更新的高优先级目标。

在lia模块114完成简档计算之后,lia模块114可以向服务提供者提供计算的简档。在某些实施例中,服务提供者可以批量接收计算的简档。在其它实施例中,服务提供者可以递增地查询lif模块112和/或lia模块114以便根据需要获得计算的简档,或者可以以预定间隔接收批量简档更新。

在某些实施例中,lia模块114所生成的简档可以仅可由向lia模块114提供位置信息的应用来访问。此外,在由lif模块112和/或lia模块114接收之前,可以对lif模块112和/或lia模块114接收的目标实体进行散列或加密,从而提供用户的匿名性。这些特性可以允许lif模块112和/或lia模块114考虑向lif模块112和/或lia模块114提供位置数据点的目标实体的隐私性。

在某些实施例中,可以以表格形式提供计算的简档。图16示出根据某些实施例的表格形式的目标实体简档。

在某些实施例中,lia模块114可以被配置为基于所计算的简档学习预测模型,该预测模型可以预测与所计算的简档关联的目标实体的行为。在某些情况下,预测模型可以是非参数模型。

图17a示出根据某些实施例的学习预测模型的过程。在步骤1702中,lia模块114被配置为将目标实体表示为特征向量。特征向量可以指示与目标实体关联的各种特征。例如,特征向量可以包括目标实体的所计算的简档中的属性。再如,特征向量可以包括指示目标实体由男性还是女性操作的元素。当目标实体由男性操作时,特征向量中的元素可以具有值“1”;当目标实体由女性操作时,特征向量中的元素可以具有值“0”;以及当目标实体由未知性别操作时,特征向量中的元素可以具有值“0.5”。

在步骤1704中,lia模块114可以可选地将目标实体的特征向量与目标实体的位置数据点相关联以便形成特性向量。例如,目标实体的特征向量可以与目标实体的位置数据点串接以便形成特性向量。在某些情况下,位置数据点可以被表示为各种空间和时间分辨率。例如,可以使用具有预定精度(例如,20到40位精度之间的任何精度)的地理散列来表示位置数据点的空间坐标,并且可以以各种时间分辨率(例如,15分钟到6小时之间的任何时间)来表示与空间坐标关联的时间信息。

在步骤1706中,lia模块114可以聚集对应于数据集中的所有目标实体的所有特性向量,并且对每个集群中的特性向量进行平均以便针对每个集群形成平均向量。连同平均向量一起,lia模块114还可以维护对应于每个集群的多个目标实体。集群的平均向量以及可选地对应于该集群的多个目标实体可以形成用于行为特征的非参数预测模型。

在某些实施例中,跳过步骤1704,并且针对步骤1706使用特征向量作为特性向量。

在某些实施例中,lia模块114可以使用预测模型预测与所计算的简档关联的目标实体的行为。图17b示出使用预测模型预测与所计算的简档关联的目标实体的行为的过程。在步骤1752中,lia模块114被配置为确定目标实体的特性向量。可以根据用于在步骤1704中训练预测模型的格式向量来格式化特性向量。在步骤1754中,lia模块114可以检索预测模型,并且在步骤1756中,lia模块114被配置为确定目标实体的特性向量与预测模型中的集群之间的关联。可以通过以下操作确定关联:查找要应用于集群的平均向量的一组权重,以便将特性向量表示为集群的平均向量的加权平均值。该组权重可以标识特性向量和预测模型之间的共享信息量。

如在本申请中使用的,术语“一”或“一个”可以被定义为一个或多个。此外,诸如“至少一个”和“一个或多个”之类的引导短语的使用不应被解释为暗示由不定冠词“一”或“一个”引入的另一个元素将对应元素限制为仅一个此类元素。这同样适用于定冠词的使用。

将理解,所公开的主题并未将其应用限于构造细节以及在以下描述中给出或在附图中示出的组件的布置。所公开的主题能够具有其它实施例,并且能够以各种方式实现和执行。此外,将理解,在此采用的措辞和术语用于描述目的而不应被视为限制。

因此,所属技术领域的技术人员将理解,可以很容易地使用本公开所基于的概念作为设计用于实现所公开主题的数个目的的其它结构、方法和系统的基础。因此,重要的是权利要求被视为包括此类等效构造,只要这些等效构造不偏离所公开的主题的精神和范围。

尽管在前面的示例性实施例中描述和示出了所公开的主题,但应理解,本公开仅通过实例的方式做出,并且可以对所公开的主题的实施细节进行许多更改而不偏离所公开的主题的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1