用于分析目标实体的移动的装置、系统和方法_2

文档序号：9770019阅读：来源：国知局

析机制被配置为分析位置信息以便提取有关移动设备或移动设备用户(被统称为目标实体)的上下文信息(例如，简档)。在高级别，位置信息分析机制可以包括分析与目标实体关联的位置数据点以便确定与目标实体关联的特性，并且使用所述特性预测与目标实体关联的属性。一组预测的属性可以形成目标实体的简档。
[0054]更具体地说，位置信息分析机制可以分析时间系列(time-ser i e s)位置信息(也被称为位置数据点，或简称为位置信息)。位置信息可以包括地理空间坐标、地址，或者能够标识位置的任何位置标识符。位置信息分析机制可以分析时间系列位置信息(例如由目标实体产生的时间系列地理空间坐标)，以便确定与目标实体关联的特征(例如，特性)。随后，位置信息分析机制可以使用所确定的目标实体特性来确定目标实体的一个或多个简档。简档可以包括描述目标实体的一组高级属性，包括基于目标实体的行为的分类。例如，位置信息分析机制可以生成简档，该简档指示特定移动设备由某人使用，此人的主要居住地在加利福尼亚州的贝弗利希尔斯，并且主要工作地点在加利福尼亚州的洛杉矶。服务提供者(例如提供目标实体内容的发布者和开发者)可以使用该简档，以便根据目标实体个性化其应用并且定制其内容。
[0055]在某些实施例中，位置信息分析机制使用的实体的特性可以包括有关实体(或实体的用户)的时间无关的信息。例如，特性可以指示移动设备用户经常去往小学，该用户经常去往购物中心，并且该用户的公寓位于加利福尼亚州洛杉矶附近。实体的特性还可以提供时间无关的信息之间的时间关系。参考上面提供的实例，特性可以指示移动设备用户在早上去往其小孩就读的学校，该用户随后去往购物中心，该用户在下午返回到其小孩就读的学校，并且该用户随后返回到其在洛杉矶附近的公寓。位置信息分析机制可以使用这些特性预测有关用户的信息，例如用户并未在一天的全部时间内工作。
[0056]在某些实施例中，服务提供者可以使用简档预测目标实体的未来行为，并且基于预测的未来行为，为目标实体提供适合的服务。例如，位置信息分析机制可以使用一个或多个简档生成预测模型，该预测模型可以预测对应目标实体在任何给定时间可能位于的位置和/或位置/地点的类型。还可以组合这些简档，以便确定作为一个整体的一组目标实体的特征。
[0057]在某些实施例中，所公开的位置信息分析机制可以通过使用会话和集群表示时间系列位置信息，有效地确定目标实体的一个或多个简档。时间系列位置信息包括通常在连续时间点测量的位置数据点序列。在某些情况下，连续时间点可以具有均匀间隔;在其它情况下，连续时间点可以具有不均匀间隔。所公开的位置信息分析机制可以将时间系列位置信息分段，以便生成会话和集群。例如，位置信息分析机制可以将地理空间坐标分组(或分段)为会话，并且将会话分组为集群。时间系列位置信息的这种基于会话和集群的表示可以在接收到用于新时间点的额外位置信息时，不需要重新计算或重新处理全部时间系列位置?目息O
[0058]在某些实施例中，所公开的位置信息分析机制可以将目标实体的位置数据点、会话和/或集群与注释信息相关联，该注释信息可以提供有关位置数据点、会话和/或集群的元数据。注释信息可以是用于确定与目标实体关联的属性的特性之一。注释信息可以从外部源接收，这些外部源例如包括所公开的位置信息分析机制可以访问的网站、数据库或任何源信息。
[0059]在某些实施例中，所公开的位置信息分析机制可以基于仅I个位置数据点而提供简档。但是，随着位置数据点数量的增加，所生成的简档的准确性和内容可以改进。因此，在某些实施例中，所公开的位置信息分析机制可以基于多于3个位置数据点、5个位置数据点、10个位置数据点或任何预定数量的位置数据点而提供简档。
[0060]在某些实施例中，简档中的一个或多个属性可以与置信度得分关联，该置信度得分指示关联属性的置信度得分或准确性。在某些情况下，置信度得分的范围可以在O和I之间。但是，可以使用任何其它范围表示置信度得分。
[0061]在某些情况下，如果所公开的位置信息分析机制可以访问很长一段时间内的大量位置数据点，则所公开的位置信息分析机制可以确定目标实体的时间相关(或具有时间范围的)简档。例如，所公开的位置信息分析机制可以确定移动设备的用户喜欢晚上11点-凌晨I点之间在加利福尼亚州洛杉矶附近的In-N-Out快餐店吃夜宵。
[0062]在某些实施例中，位置信息分析机制可以使用一种或多种机器学习技术来确定或完善一个或多个简档中的属性。例如，如果目标实体的简档的特定属性缺失，则位置信息分析机制可以基于有关目标实体的已知信息，填充(或预测)缺失的信息。在某些实施例中，这可以使用逻辑回归完成。在其它实施例中，它可以使用其它机器学习技术，例如但不限于随机森林、线性回归、隐马尔可夫模型和神经网络。
[0063]用于位置信息分析机制目的的机器学习技术可以包括任何功能(funct1n)，该功能接收“训练数据”集合(例如，指定为行，每个行包含多个特性标量和一个或多个目标标量)，并且产生估计器或“模型”，该估计器或模型从不包括训练数据的新数据行的输入特性来预测目标值。不严格地说，例如可以作为估计器预测新数据行的目标值的能力来衡量估计器的质量。例如，给出“goIf ers (高尔夫球员)”和用于已知“goIf ers”的一组有注释的会话的实例(即，训练数据)，则系统可以确定“sess1ns on golf courses(有关高尔夫球场的会话)”与“golfers”高度相关，并且为“sess1ns on golf courses”特性分配导致针对“golfers”的更优目标值预测的值。
[0064]实际上，多达数百万个此类特性可以交互，以便产生用于预测此类目标的模型。在某些实施例中，系统可以包括对目标或简档进行聚集或分组的机器学习技术。在这些情况下，系统可以包括任何功能，该功能接收数据集合(例如指定为行，每个行包含多个特性标量)，并且产生预测目标集群的估计器或“模型”。例如，此类功能可以帮助标识看似形成组的类似特性(例如行为模式)。这种分组可以用于建议新目标简档，可以为这些新目标简档提供后续名称(例如在人类解释集群成员拥有的常见定性方面之后，“cluster 123 ofsimilar things(类似事物集群123)”变成“dive bar lovers(廉价酒吧爱好者)”)。此外，分组可以与期望行为或质量(例如点击广告)相关，并且集群的其它成员可以被标记为是登广告者所期望的(不必解释什么定性方面使他们这样做)并且是广告的目标。
[0065]在某些实施例中，位置信息分析机制可以针对每个简档(例如，每个行为分段)使用单独的估计器。例如，位置信息分析机制可以从可观察的属性(例如“number of visitsto a restaurant per week(每周餐馆的顾客数量)”或“number of visits to Starbucks(星巴克的顾客数量)”)构建特性标量，并且针对不同的变量(例如“user is a foodconnoisseur(用户是美食家)”或“user is especially aff luent(用户极其富有)”)使用单独的估计器。
[0066]位置信息分析机制可以可选地包括用于清理(或丢弃)不准确位置数据点的智能数据处理机制。位置数据点可以是断续的并且具有不同的质量。位置信息的质量可以变化，这是由于位置信息的源和准确性具有很大的差异。例如，可以基于大量源确定位置信息:移动设备的网际(IP)地址、移动设备附接到的手机信号塔、移动设备附接到的WiFi接入点和/或移动设备中运行的全球定位系统(GPS)。但是，所确定的位置信息的准确性可以显著变化。从移动设备的IP地址确定的位置信息通常高度不准确，而从WiFi接入点或GPS确定的位置信息通常更加准确。为了解决该问题，所公开的位置信息分析机制结合多种数据验证技术，这些技术在提交位置信息时清理该信息。取决于应用，位置信息分析机制可以可选地丢弃大约15-25%的位置信息，因为这些信息与简档构建无关。该数据清理过程可以改进所生成的目标实体简档的准确性。
[0067]图1示出根据某些实施例的位置信息分析系统的图。系统100包括服务器102、通信网络104、一个或多个客户机设备106和服务提供者118。服务器102可以包括处理器108、存储设备110、位置信息格式化(LIF)模块112、位置信息分析(LIA)模块114和一个或多个接口116。
[0068]服务器102的处理器108可以以硬件实现。处理器108可以包括专用集成电路(ASIC)、可编程逻辑阵列(PLA)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)或任何其它集成电路。处理器108还可以包括一个或多个任何其它适用的处理器，例如组合CPU、应用处理器和闪存的一个或多个的片上系统，或者精简指令集计算(RISC)处理器。处理器108的存储设备110可以包括计算机可读介质、闪存、磁盘驱动器、光盘驱动器、可编程只读存储器(PROM)和/或只读存储器(ROM)。
[0069]LIF模块112可以被配置为接收目标实体的时间系列位置信息(例如，对应于目标实体的移动的时间系列地理位置坐标)，并且将时间系列位置信息分段为会话。此外，LIF模块112还可以将两个或更多会话分组(或合并)为集群，并且可选地基于来自外部数据源的信息，将注释信息添加到会话和/或集群。在某些实施例中，LIF模块112可以从与多个目标实体关联的地理位置坐标中提取对应于单个目标实体的所有地理位置坐标，并且生成对应于该单个目标实体的会话、集群和/或注释信息。在某些实施例中，注释信息可以包括以下一个或多个:人口统计信息，例如有关某个位置的位置住房成本统计的人口普查数据(例如来自公共记录以便知道平均房屋销售价格或租赁成本)；先前在不同时间从该位置处的设备收集的环境噪声测量;来自源于该位置的社交网络数据(例如推特或社交网络站点帖子)的情感或关键字;附近企业的名称和类别;来自对附近企业的评论的关键字和评级;犯罪统计、卫星图像(例如为了判定是否具有水池)；来自公共记录的地界线多边形(例如为了确定居住地的大小，例如房屋、公寓或共有公寓)；从该位置附近的设备收集的加速度计数据(例如为了知道是步行交通还是车辆)。
[0070]在某些实施例中，LIF模块112可以以批量模式接收地理位置坐标。在其它实施例中，LIF模块112可以以流模式接收地理位置坐标。
[0071]LIA模块114可以被配置为分析由LIF模块112生成的会话、集群和/或注释信息，以便确定目标实体(例如客户机106)的简档。简档可以包括描述目标实体的一组高级属性。取决于关联的高级属性，简档可以被表征为:行为简档，其描述目标实体的行为特征;人口统计简档，其描述对应于目标实体的人口统计分组或市场细分，例如年龄范围、社会阶层范围和性别范围；或者地理简档，其描述关联系列事件的位置或目标实体访问的位置。行为简档、人口统计简档和地理简档中的一个或多个可以形成针对目标实体的单个聚合简档。
[0072]在某些实施例中，LIA模块114可以使用机器学习技术来生成简档。例如，LIA模块114可以使用随机森林技术来从会话、集群和/或注释信息确定简档属性。
[0073]在某些实施例中，LIF模块112和/或LIA模块114可以以存储在非瞬时性存储设备110(例如非瞬时性计算机可读介质)中的软件实现。存储在存储设备110中的软件可以在能够执行计算机指令或计算机代码的处理器108上运行。
[0074]在某些实施例中，LIF模块112和/或LIA模块114可以以使用ASIC、PLA、DSP、FPGA或任何其它集成电路的硬件实现。在某些实施例中，LIF模块112和LIA模块114两者可以在同一集成电路(例如ASIC、PLA、DSP或FPGA)上实现，从而形成片上系统。
[0075]在某些实施例中，服务器102可以从服务提供者118接收目标实体的位置信息。月艮务提供者118可以与一个或多个客户机106通信以便接收与客户机106关联的位置数据点，并且向服务器102提供所接收的位置数据点。在某些实施例中，服务提供者118可以聚合预定时间段内的位置数据点，并且批量提供聚合的位置数据点。在其它实施例中，服务提供者118可以将位置数据点流式传输到服务器102，或者将在很短一段时间内聚合的位置数据点发送到服务器102。服务提供者118可以包括软件服务提供者、应用提供者、通信服务提供者、发布者或任何其它类型的服务提供者。

完整全部详细技术资料下载

当前第2页1 2 3 4 5 6