用于基于移动装置数据产生简档的方法和系统的制作方法_3

文档序号:8361503阅读:来源:国知局
可以是被配置为将启发规则和聚类算法应用于在关系数据仓库系统120内所产生的中间结果和最终结果中的若干个的计算机,以为了对移动用户进行分类、得到对于区域102的特性的见解、帮助计算机140的数据提供者程序142将通信信息发送到移动用户、以及其他目的。
[0037]计算机140包括数据提供者程序142和数据库144。计算机140可以是被配置用于到移动用户的通信的发送的计算机,并且可以例如是由营销实体或其他数据提供者实体操作的计算机。如以下所讨论的,数据提供者程序142可以至少部分基于关系数据仓库系统120和计算机130中的一个或两个所产生的见解来将存储在数据库144中的通信信息发送到区域102中的移动用户。
[0038]现在参照图2,示出了根据本发明的实施例的流程图200,该流程图描绘在基于存储在关系数据仓库系统120中的移动装置数据产生移动性简档和聚集地简档期间所采用的步骤。一般来讲,移动性度量是作为移动性和活动的指示符的一系列算法和计算的结果,移动性简档是针对个体的移动用户的、在特定的日时间跨度(time-of-day span)(例如,一天可以分割为几个大致的日时间跨度,诸如“早餐”、“早上”、“午餐”、“下午”、“晚餐”和“晚上”等)以及特定的星期跨度(day-of-week span)(例如,一周可以分割为几个大致的星期跨度,诸如“工作日”和“周末”等)上的移动性度量的集合。就这点儿论,在一个实施例中,对于每一个个体,可以存在十二个度量(即,日时间跨度的数量乘以星期跨度的数量),这些度量共同构成个体移动性简档。更一般地讲,可以对移动性简档进行分析以创建指示个体移动用户的总体生活方式类型的分组,使得每一个移动性简档对于个体移动用户可以是唯一的。
[0039]在步骤210中,嵌入式分析126从移动装置记录124产生空间-时间盒子聚合数据(aggregated data),并且将结果(即,中间结果)存储在分析结果记录128中。嵌入式分析126可以通过下述操作来产生空间-时间盒子聚合数据:确定每个空间-时间盒子的空间和时间分辨率,然后将包括关于移动装置的带有时间戳的位置和活动数据的每个记录分配给空间-时间盒子。在一个实施例中,步骤210包括将关于每个移动装置的地理位置数据变换为关于每个移动装置的逻辑位置数据(例如,将地理位置数据变换为地理散列,等等)的预处理步骤。在每个空间-时间盒子具有图1的区域102中所示的方形网格的空间分辨率(例如,方形网格2E具有描绘的市中心106的部分的空间分辨率,等等)并且具有五分钟的时间分辨率的实施例中,嵌入式分析126可以将在每个方形网格内的任何地方发生并且在给定的五分钟间隔中在任何时间发生的每个记录分配给相应的空间-时间盒子。另举一例,在给定区域102中所描绘的每一个方形网格以及给定的等同一小时的移动装置数据的情况下,五分钟的时间分辨率得到聚合到252个空间-时间盒子中的数据(即,所描绘的二^ 个方形网格和一小时内的十二个五分钟间隔的乘积为252个空间-时间盒子)。因此,步骤200可以被认为是将移动装置记录124的“原始”移动装置数据“装盒”至空间-时间盒子中,这些空间-时间盒子作为中间结果存储在分析结果记录128中。
[0040]在步骤210完结时,流程图200分叉成两个路径,第一路径通过步骤212以及后面的步骤进行,第二路径通过符号A进行,其在图3中继续。在各种实施例中,当嵌入式分析126进一步对移动装置数据进行处理时,可以遵循分叉的路径中的一个或两者。以下,在图2的上下文中讨论第一路径,在图3的上下文中进一步讨论第二路径。
[0041]在步骤212中,嵌入式分析126在步骤210的中间结果中生成每一移动用户的对于每个空间-时间盒子的活动计数,并且将结果作为新的中间结果存储在分析结果记录128中。嵌入式分析126可以通过对移动用户在空间-时间盒子中执行的活动的总数进行求和来生成每一移动用户的对于每个空间-时间盒子的活动计数。例如,如果方形网格3G中所描绘的唯一的移动用户在给定的等同一小时的移动装置数据的头五分钟内发送和接收总共三个文本消息,并且在第二个五分钟内打了一个电话和发送了一个文本消息,则对于方形网格3G的相应的空间-时间盒子的两个五分钟间隔,嵌入式分析126可以分别产生并且存储活动计数3和2。
[0042]在步骤214中,嵌入式分析126确定步骤212的中间结果中的每一时间间隔的每一移动用户的排序最高的位置,并且将结果作为新的中间结果存储在分析结果记录128中。嵌入式分析126可以通过下述操作来确定每一时间间隔的每一移动用户的排序最高的位置:首先,按降序的活动计数的次序对在其中给定的移动用户具有活动计数的空间-时间盒子进行排序,然后识别排序靠前的那些排序的空间-时间盒子的阈值数。例如,如果方形网格3 G中所描绘的唯一的移动用户随着时间过去移动到相邻的方形网格3 F、3 E和3D (全都同时执行各种移动活动(mobile activity)),并且如果阈值数为3,则在步骤214中,嵌入式分析126将确定总共四个方形网格中的排序前三位的方形网格。特别地,如果方形网格3G中所描绘的唯一的移动用户如所描述的那样移动,并且在进入市中心106时增加他或她的移动活动,则在所描述的情况下,这可以被反映为嵌入式分析126确定所述唯一的移动用户的排序最高的位置是方形网格3F、3E和3D。
[0043]在步骤216中,嵌入式分析126调整步骤214的中间结果中的空间-时间盒子的粒度,并且将结果作为新的中间结果存储在分析结果记录128中。嵌入式分析126可以通过提高或降低每个空间-时间盒子的空间或时间分辨率来调整空间-时间盒子的粒度。调整粒度的一个目的是减小“颤振”,即,减少随着给定的移动用户跨越两个空间-时间盒子的空间边界来回移动(例如,通过越过两个方形网格之间的边界来回移动,等等)而记录的转变的数量。因此,可以通过降低所有的空间-时间盒子的空间分辨率来减小颤振。嵌入式分析126可以通过例如合并一组相邻的方形网格以生成新的更大的方形网格(例如,按3X3方形布置的九个I平方米的方形网格可以合并为单个9平方米的方形网格,等等)来降低空间分辨率。可替代地,嵌入式分析126可以通过例如将移动装置数据重构为新的一组方形网格(一般更大,但是不是相对直接合并的结果)来降低空间分辨率。一般来讲,步骤216可以被认为是以被确定为改变空间-时间盒子的粒度的方式对现有的中间结果进行“重新装盒”。
[0044]在步骤218中,嵌入式分析126用元数据(诸如日时间跨度和星期跨度)来标记步骤216的中间结果中的空间-时间盒子的记录,并将结果作为新的中间结构存储在分析结构记录128中。嵌入式分析126可以通过为包括关于移动装置的带有时间戳的位置和活动数据的每个记录分配基于其时间戳或者基于其相关联的空间-时间盒子的时间维度的标签,来用元数据标记记录。如以上所陈述的,例如,日时间跨度可以包括跨度“早餐”、“早上”、“午餐”、“下午”、“晚餐”和“晚上”,而星期跨度可以包括跨度“工作日”和“周末”。因此,如果给定记录的时间戳落在例如8AM与1AM之间,则嵌入式分析126可以用“早餐”日时间跨度来标记该给定记录,并且如果同一给定记录的时间戳落在星期一,则可以用“工作日”星期跨度来标记该同一给定记录。就这点而论,应当理解,每个记录可以具有一个或多个标签。在步骤218完结时,嵌入式分析126产生了新的中间结果以存储在分析结果记录128中,其包括各种标签。
[0045]在步骤220中,嵌入式分析126按照移动用户、位置和元数据标签来对步骤218的中间结果中的空间-时间盒子的记录进行分组,并且将结果作为新的中间结果存储在分析结果记录128中。嵌入式分析126可以通过例如执行如下数据库指令(例如,SQL语句等)来对记录进行分组,所述数据库指令包括对每个记录的移动用户、位置、日时间跨度以及星期跨度进行操作的“group by”子句。作为结果的新的中间结果对于每一个移动用户有效地记载了每个用户在各种元数据标记的跨度期间所占据的独特位置。
[0046]在步骤220完结时,流程图200分叉成两个路径,第一路径通过步骤222和224进行,第二路径通过步骤226进行。在各种实施例中,当嵌入式分析126进一步对移动装置数据进行处理时,可以遵循分叉的路径中的一个或两者。以下又将从第一路径开始讨论这些路径。
[0047]在步骤222中,嵌入式分析126按照移动用户和元数据标签来对步骤220的中间结果中的空间-时间盒子的记录进行分组,并且将结果作为新的中间结果存储在分析结果记录128中。嵌入式分析126可以通过例如执行如下数据库指令(例如,SQL语句等)来对记录进行分组,所述数据库指令包括对每个记录的移动用户、日时间跨度以及星期跨度进行操作的“group by”子句。因此,特别是,在作为分组因子移除了位置的情况下,步骤222的分组可以被认为是步骤220的分组的更窄分组。作为结果的新的中间结果对于每一个移动用户有效地记载了每个用户在各种元数据标记的跨度期间所占据的独特位置。该记载可以被认为是对于每个移动用户的移动性度量,其捕捉每个移动用户在各种元数据标记的跨度期间的移动性。
[0048]在步骤224中,嵌入式分析126对步骤222的中间结果中的空间-时间盒子的记录(这些记录已经按照移动用户和元数据标签进行了分组)进行规范化,并且将结果作为新的中间结果存储在分析结果记录128中。嵌入式分析126可以通过例如用得到大致以零为中心的标准化值的统计处理对记录进行分析来对记录进行规范化。标准化值使得可以例如比较不同源上的记录。该规范化记载一一数个中间结果之后的最终结果一一可以被认为是关于每个移动用户的移动性简档。
[0049]在步骤226中,嵌入式分析126按照位置和元数据标签对步骤220的中间结果中的空间-时间盒子的记录进行分组,并且将结果作为新的中间结果存储在分析结果记录128中。嵌入式分析126可以通过例如执行如下数据库指令(例如,SQL语句等)来对记录进行分组,所述数据库指令包括对每个记录的地址、日时间跨度以及星期跨度进行操作的“group by”子句。因此,特别是,在作为分组因子移除了移动用户的情况下,步骤222的分组可以被认为是步骤220的分组的更窄分组。作为结果的新的中间结果对于每一个位置有效地记载了在各种元数据标记的跨度期间占据的每个位置的移动用户的数量。该记载一一数个中间结果之后的最终结果一一可以被认为是关于每个位置的聚集地简档,其捕捉每个位置在各种元数据标记的跨度期间的受欢迎程度。
[0050]现在参照图3,示出了根据本发明的实施例的流程图300,该流程图描绘了在基于存储在关系数据仓库系统120中的移动装置数据产生好友简档期间所采用的步骤。一般来讲,好友模型识别在一组空间-时间盒子内谁何时在其它人周围。好友
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1