用于分析目标实体的移动的装置、系统和方法_5

文档序号:9770019阅读:来源:国知局
情况,LIF模块112可以将本底噪声(noise floor)添加到针对每个集群构造的直方图。
[0123]在某些实施例中,LIF模块112可以被配置为使用最大似然模型合并两个或更多集群。在某些情况下,LIF模块112可以被配置为基于集群之间的联合熵来合并集群,该联合熵可以基于库尔贝克-莱布勒(KL)散度来测量。在其它情况下,LIF模块112可以使用任何分层聚集技术合并集群。
[0124]在步骤606中,LIF模块112可以可选地使用来自外部数据源的信息来注释会话和/或集群。在该步骤中,使用外部数据源丰富会话和集群,此过程称为注释。例如,将描述与位置关联的周围企业类别或人口统计信息的信息附加到该位置处的对应集群或会话。共同地,这些注释创建用于充实目标实体简档的丰富数据集,并且充当进一步注释的基础。
[0125]在某些实施例中,LIF模块112可以从外部数据库接收注释数据。在其它实施例中,LIF模块112可以分析网页上的文本以便生成注释数据。
[0126]在某些实施例中,可以进行某些内部优化以便减少LIF模块112对外部数据源执行的查询数量。这些内部优化可以包括合并附近会话,以及通过内插结果重用旧查询。
[0127]在步骤608中,LIF模块112可以向LIA模块114提供与目标实体关联的会话、集群和/或注释数据,以便LIA模块114可以基于会话、集群和/或注释数据,确定目标实体的一个或多个简档。
[0128]在某些实施例中,LIF模块112可能未从会话和/或位置数据点标识任何集群。例如,LIF模块112可以跳过集群标识步骤。这种情形与其中集群包括单个会话或单个位置数据点的情形相同。因此,下面的对使用集群确定属性的讨论还可适用于其中LIF模块112未标识任何集群的情况。
[0129]LIA模块114被配置为分析在某时段内的位置数据点、会话、集群和/或注释数据以便构建目标实体的一般描述,并且以简档的形式提供一般描述。简档可以是JavaScript对象表示法(JSON)散列。简档可以包括(I)描述目标实体的一个或多个属性值和(2)与一个或多个属性值关联的一个或多个置信度得分。在某些实施例中,属性值可以包括(I)活动区域,其按照企业类型分类并且按照国家、都会区域和DMA汇总,(2)人口统计信息,其包括家庭收入(如果提供),和/或(3)行为特征和分类。简档可以被专门设计为增强服务提供者和个体用户之间的交互。简档可以帮助服务提供者提供正确的本地新闻和更相关的信息,以便按照位置定制信息内容,并且确保仅在正确时间为用户提供上下文最相关的信息。
[0130]在某些实施例中,简档的地理属性可以提供目标实体最活跃的位置的概述。可以以不同物理标度(例如以超本地、区域和/或国家标度)表示位置。简档还可以包括与用户活动关联的特定超本地地点,例如包括超本地地点的图心、关联的邮政编码、超本地地点的类型和/或区域的商业密度。图10示出根据某些实施例的简档的地理属性。简档的地理属性包括“活动区域(AoA)”项,该项包括AoA的标识符、AoA的中心、AoA中的商业密度(其测量AoA的对应于商业区域的部分)、与AoA关联的邮政编码,AoA的排序(例如,与AoA关联的频率或重要性),以及超本地地点的类型(例如,远离,其指示AoA不是主要活动区域。)
[0131]在某些实施例中,简档还可以包括指示目标实体的归属位置的属性。LIA模块114可以被配置为通过以下各项确定归属位置(也被称为简档的归属属性):分析目标实体在AoA之间的移动模式、特定位置(例如,对应于特定位置的AoA)是否已知是(或可能是)居住地(例如包括房屋、公寓和共有公寓)、位置周围的商业/居住密度、特定位置(例如,对应于特定位置的AoA)相对于其它AoA的频率,和/或与移动模式关联的位置数据点的时间戳。在某些实施例中,归属位置可以被表示为邮政编码。在其它实施例中,归属位置可以被表示为地理空间坐标,例如GPS坐标或玮度/经度坐标对。
[0132]图11示出根据某些实施例的目标实体的简档的归属(home)位置属性。归属位置属性可以指示对应于归属位置的图心(或AoA)的中心、AoA中的商业密度,以及邮政编码。在某些实施例中,归属位置属性中的邮政编码可以与归属位置本身关联。在其它实施例中,归属位置属性中的邮政编码可以与家所在的AoA关联。此类实施例可以改进用户的隐私性。在某些实施例中,商业密度可以被表示为百分比。例如,归属位置的图心中的居住区域的百分比可以是81.1% (如图11中指示),并且归属位置的图心中的企业的百分比可以是4.6%。商业密度在确定用户居住地的市区/郊区/农村上下文中可以很有用。
[0133]在某些实施例中,LIA模块114可以被配置为提供其中用户活跃的位置实体的列表。位置实体可以包括国家、区域和/或所在地(城镇)IIA模块114可以以相对显著性的顺序提供此类位置实体的列表。在某些情况下,LIA模块114可以基于在特定位置实体处花费的时间量,确定与位置实体关联的显著性。例如,当用户90%的时间待在家中时,家可以是重要的位置实体。在某些情况下,LIA模块114可以基于与特定位置实体关联的注释的信息性如何,确定与位置实体关联的显著性。此外,在某些情况下,LIA模块114可以基于与特定位置实体关联的行为如何重要,确定与位置实体关联的显著性。例如,当用户90%的时间待在家中,但用户还在早上和下午花费10分钟待在学校时,该位置实体可以很重要,因为它可以告诉我们用户可能是父母亲。
[0134]图12示出根据某些实施例的在目标实体的简档中提供的位置实体列表。每个位置实体可以与特定地理标度关联。例如,图12示出三个位置实体,第一实体与“countries(国家)”关联,第二实体与“reg1ns(区域)”关联,并且第三实体与“localitieS(所在地)”关联。每个位置实体可以与唯一标识符(图12中被称为“factual_id”)关联,并且可以与位置数据点(例如玮度/经度坐标对)关联。此外,位置实体中的一个或多个项可以与置信度得分关联。
[0135]在某些实施例中,当目标实体与美国内的位置关联时,简档还可以包括其它地理概要。其它地理概要可以包括尼尔森的直接营销区域(DMA)和/或其中用户活跃的Metro(正式地为MSA,如美国人口普查定义的)。图13A-13B示出根据某些实施例的目标实体的简档中的DMA属性和Metro属性。
[0136]在某些实施例中,LIA模块114可以确定目标实体的简档的人口统计属性。具体地说,LIA模块114可以基于用户的归属位置(美国人口普查数据以街区群级别聚合)和/或基于用户的活动,确定人口统计属性。图14示出根据某些实施例的目标实体的简档的人口统计属性。人口统计属性可以包括收入水平、性别、年龄、家庭类型和种族。此外,一个或多个人口统计属性可以与置信度得分关联。
[0137]在某些实施例中,LIA模块114可以确定目标实体的简档的行为属性。行为属性可以将目标实体分类为一个或多个类别,这些类别可以用于在线广告。仅当置信度得分足够高以使目标设备有资格存在于这些类别中时,才对目标设备进行分类。图15示出根据某些实施例的目标实体的简档的行为属性。行为属性可以包括一个或多个预定类别和置信度得分,该置信度得分指示目标实体与一个或多个预定类别关联的似然。预定类别可以包括:目标实体是否由商业旅行者拥有,目标实体是否由休闲旅行者拥有,目标实体是否由频繁旅行者拥有,目标实体是否由医疗保健提供者拥有,目标实体是否由大学生拥有,目标实体是否由对购车感兴趣的人拥有,目标实体是否由常看电影的人拥有,目标实体是否由休假者拥有,目标实体是否由直播体育爱好者拥有,和/或目标实体是否由富裕客户拥有。可以跨数据集应用标准类别,以便查找共享趋势或模式的ID组。
[0138]在某些实施例中,LIA模块114可以基于与目标实体关联的会话、集群和/或注释数据,确定目标实体与特定类别关联的似然(也被称为类别置信度得分)。例如,有注释的集群可以指示ID(目标实体)被偏置以便在更昂贵的人口统计区域中操作,并且有注释的会话可以指示ID从一个位置行进到另一个位置。
[0139]在某些实施例中,可以定期地更新简档中的属性以便简档不会变得陈旧(或过时)。例如,LIA模块114可以被配置为定期地重新计算简档的属性。此外,LIA模块114可以被配置为在属性变老时减小属性的置信度得分值(例如,根据生成或计算属性的时间点)。
[0140]在某些实施例中,LIA模块114可以使用交叉验证机制,以便判定目标实体是否与特定属性或类别关联。在高级别,LIA模块114被配置为提取表示目标实体在任何给定时刻在做什么的特性。从附近地点(如果有)、时间本地化后的事件(例如音乐会)和地标生成这些特性。例如,当目标实体正在去往洛杉矶道奇体育场时,并且如果在该时间点道奇体育场正在举办摇滚音乐会,则目标实体可以优先地与摇滚音乐相关。再如,LIA模块114可以通过确定目标实体在夜间(例如在晚上8点以后)返回到的位置或停留时间最多的位置,确定归属位置。
[0141]为此,LIA模块114例如可以将企业类别、企业名称中的每个字以及有关事件的高级类别信息确定为个体特性。随后,LIA模块114例如同等地对这些特性进行加权,并且使用结果向量的范数(例如,LI范数)来执行交叉验证。
[0142]对目标实体的行为进行分类中的一个挑战是确保LIA模块114不会与模型过拟合。例如,假设LIA模块114发现目标实体仅在7月17日星期五的下午15:38在星巴克的旁边。尽管在该时间点对应于目标实体的目标实体物理位置是非常强的信号,但花费精力缩小该观察的时间片范围不是特别有意义。因此,LIA模块114可以考虑描述该观察所花费的工作量,以及当LIA模块114就目标实体得出结论时的观察结果的强度。因此,例如,如果LIA模块114连续四个星期五观察到目标实体在每个星期五下午4点在星巴克的旁边,则这是更有价值的洞察。
[0143]在某些实施例中,LIA模块114被配置为基于特定空间-时间位置数据点(或集群)在时间系列位置数据点中的出现次数,确定目标实体的行为类别。为此,LIA模块114被配置为(I)将位置数据点或集群的时间分量投影到循环空间(例如,24小时时间跨度,忽略日期),(2)确定位置数据点或集群的特定[空间,投影时间]表示在时间系列位置数据点中的出现次数,以及(3)确定时间系列位置数据点中的最高K个[空间,投影时间]。更具体地说,LIA模块114被配置为(I)将每个位置数据点表示为一对[空间,投影时间],(2)构造此类对的频率表,并且可选地按照降频对频率表中的项进行排序,以及(3)标识该频率表中频率大于预定阈值(例如2)的对。
[0144]作为分类处理的结果,要指出的有用属性的其它实例是:
[0145]?特定的人是习惯性的星巴克顾客。尽管这个人去过国家的许多地方,但不管他/她的当前位置,他/她经常在上午8:30-9:00之间去星巴克。
[0146]?特定的人一贯地在高端、昂贵的商店购物,并且从不去低端、廉价的商店。
[0147]?特定的人喜欢汉堡包,并且可能去他所在位置方便到达的并且提供汉堡包的任何餐馆。
[0148]?特定的人是纽约扬基队的球迷;这个人参与扬基队的主客场比赛,并且还去销售体育纪念品的商店。
[0149]其它类型的分类是可能的,并且通常将取决于位置数据的质量以及已注释到位置信息的注释的类型。
[0150]在某些情况下,LIA模块114可以批量执行简档计算。例如,服务提供者可以具有用于许多用户和设备的数月或数年的地理空间信息,并且LIA模块114可以批量处理这些信息以便提供对所覆盖的时间跨度的分析。在其它情况下,LIA模块114可以在新位置数据点变得可用时执行简档计算。例如,服务提供者可能没有在很长一段时间内的位置数据点的详细日志,而是可以实时访问短暂的位置数据点流或前一天的位置数据点的滚动日志。在这些情况下,服务提供者可以通过在新位置数据变得可用时断续地将新位置数据发布到LIF模块112来使用LIF模块112和LIA模块114。
[0151]在某些实施例中,可以以批量或实时模式处理位置数据点。在实时模式下,LIA模块114可以将新信息与过去信息对照以便构建新简档。这种对照可以通过任何数量的方式发生,例如键/值查找或表连接。在某些情况下,LIA模块114可以执行新信息的初步处理,以便确定简档更新的优先级。例如,当LIA模
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1