获取移动终端标签信息的系统的制作方法

文档序号:17236911发布日期:2019-03-30 08:24阅读:256来源:国知局

本发明涉及处理移动终端信息领域,尤其涉及一种获取移动终端标签信息的系统。



背景技术:

用户画像(persona)的概念由alancooper提出:“personasareaconcreterepresentationoftargetusers”,字面翻译含义是指目标用户的具体代表。具体的,用户画像在商业上的内涵是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。随着终端(尤其是智能移动终端)的普及、海量用户数据的积累以及大数据相关技术的发展,从技术角度观察,用户画像实质上是对移动终端获取并上报给服务端的海量信息进行处理,从而建立与移动终端对应的易于被计算机系统进行自动化处理的特征信息的过程,特征信息可以包括多种类型,通常在可视化后能够以“标签”的方式直观的呈现给用户。因此,用户画像的技术实质是获取移动终端标签信息。

目前,该领域中存在两个特点:第一、整体观察,移动终端的独立设备数量已经达到十亿部的数量级,每天上报到服务端的信息达到百亿条的数量级,标签信息的数量达到百个到千个数量级,而且还在迅速的增加,这对系统的运算能力、存储能力等都带来了很大的挑战;第二、局部观察,单个独立移动终端在较短时间范围内上报的信息数量较少,在标签获取算法一定的情况下,仅根据上报信息获得标签的准确度不能得到有效保证。



技术实现要素:

为解决上述技术问题,本发明提供了一种获取移动终端标签信息的系统,包括处理装置、数据库和标签配置集;所述数据库中存储有时间周期t内的多条移动终端数据,每条移动终端数据包括移动终端tid和终端描述信息,其中tid为移动终端的唯一标识(例如imei);所述标签配置集包括多层标签配置,每层标签配置包括多个标签配置,每个标签配置包括与终端描述信息相关的配置参数,且相同层的多个标签配置具有相同的优先级,不同层的标签配置具有不同的优先级;所述处理装置根据优先级由高到低的顺序,获取标签配置集中的标签配置,并根据标签配置的配置参数和移动终端数据的终端描述信息获取移动终端tid的标签信息。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,将对本发明作进一步地详细描述。这种描述是通过示例而非限制的方式介绍了与本发明的原理相一致的具体实施方式,这些实施方式的描述是足够详细的,以使得本领域技术人员能够实践本发明,在不脱离本发明的范围和精神的情况下可以使用其他实施方式并且可以改变和/或替换各要素的结构。因此,不应当从限制性意义上来理解以下的详细描述。

本发明提供了一种获取移动终端标签信息的系统,包括处理装置、数据库和标签配置集。移动终端可以物理实现为智能手机、pad等能够安装应用程序(例如app)的设备,应用程序中可以集成sdk,本领域技术人员知晓,移动终端的型号、规格等参数并不影响本发明的保护范围。处理装置可以物理实现为一个服务器或处理器,也可以实现为包括多个服务器或处理器的服务器或处理器集群,本领域技术人员知晓,服务器或处理器的型号、规格等参数也不影响本发明的保护范围。数据库可以物理实现为本地数据库或者远程的云数据库,本领域技术人员知晓,数据库的型号、规格等参数也不影响本发明的保护范围。处理装置和数据库可物理集成在统一主机内部,也可以物理分布在不同的主机内部,相应的,处理装置和数据库可以总线连接或者通信连接,使得处理装置能够从数据库中读和/或写数据。

根据本发明,所述数据库中存储有时间周期t内的多条(例如m条)移动终端数据。移动终端数据来源于移动终端上安装的应用程序和/或集成到应用程序中的sdk上报的数据,例如是对上报的原始数据进行数据清洗、数据处理等操作后形成的数据。优选的,多条移动终端数据以json数据的格式存储到数据库中。进一步的,时间周期t一般为4周-24周,优选的t为12周,即约3个月的时间周期。

根据本发明,m条移动终端数据中的每条移动终端数据均包括移动终端tid和终端描述信息。其中,tid为移动终端的标识,优选的是移动终端的唯一标识。例如,tid可以实现为下列任一项或其组合:移动终端imei号、imsi号、mac地址等;或者tid可以实现为下列任一项或其组合:对移动终端imei号、imsi号、mac地址、号码等进行数据变换(例如md5)后形成的唯一标识。终端描述信息用于描述移动终端的特征,尤其是描述移动终端的线下特征;优选的,终端描述信息包括一个或多个终端位置,可选的,还包括终端位置对应的时间等信息。

根据本发明,可选的,终端位置可以实现为地理坐标和/或连接(或根据扫描强度确定)的wifi标识。此时,数据库中还存储有地址维度表,其中包括终端位置和对应的poi(pointofinterest)和/或woi(wifiofinterest)标签,对woi和相关概念的理解可以参见申请人之前的中国专利申请,公开号为cn106060856a。示例性的一个例子中,例如某个终端位置为地理坐标,其对应的poi为机场;示例性的另一个例子中,例如某个终端位置为wifi标识,其对应的woi为星巴克,即该wifi标识为星巴克的wifi。通过地址维度表,可以根据终端位置快捷的查询获取对应的poi和/或woi标签。另一种实施方式中,终端位置直接实现为poi和/或woi标签。

根据本发明,标签配置集包括多层(例如k层)标签配置,每层标签配置包括多个标签配置。例如,标签配置集包括l=(l1,l2,...,lk),其中,第i层标签配置li={ci1,ci2,...,cini},i的取值范围为1…k,ni为第i层标签配置中的标签配置数量。标签配置可以实现为可调用执行的命令,例如以图形化界面执行的命令和/或以命令行执行的命令;标签配置也可以实现为能够执行的文件,例如脚本文件、配置文件或者批处理文件等。根据本发明,每个标签配置被执行时,能够生成移动终端tid的一个标签,本领域技术人员知晓,本发明希望突出标签配置所实现的功能,而并不意图限制标签配置的具体实现方式,事实上,现有技术中任何实现标签配置功能的方式均落入本发明的保护范围。可选的,标签配置包括用户自定义配置和预设配置;预设配置为开发者预先存储在标签配置集中的标签配置;用户自定义配置为用户自行编写或生成的并被存储到标签配置集中的标签配置,或者用户自行编写或生成的临时使用的标签配置。

根据本发明,每个标签配置包括与终端描述信息相关的配置参数,且相同层的多个标签配置具有相同的优先级,不同层的标签配置具有不同的优先级。例如,前述实施例中,li层中的ni个标签配置{ci1,ci2,...,cini}均具有相同的优先级,而li层和lj层的标签配置具有不同的优先级。优选的,在l中根据优先级的顺序排列,即在优先级比较上,l1>l2>...>lk。

进一步的,处理装置根据优先级由高到低的顺序,获取标签配置集中的标签配置,并根据标签配置的配置参数和移动终端数据的终端描述信息获取移动终端tid的标签信息。根据本发明的一个方面,首先,根据高优先级的标签配置的配置参数和移动终端数据的终端描述信息,获得移动终端tid的高优先级标签信息;然后,根据低优先级的标签配置的配置参数、移动终端数据的终端描述信息和高优先级标签信息,获得移动终端tid的低优先级标签信息。

进一步的,根据本发明,高优先级的类型包括前置优先级和排斥优先级。当高优先级的类型为前置优先级时,所述低优先级的标签配置的配置参数中包括高优先级标签信息。一个实施例中,标签1为标签2的前置优先级,那么,生成标签2的标签配置的配置参数中会包括标签1的信息和优先级类型(即前置优先级)。当高优先级的类型为前置优先级时,获得移动终端tid的低优先级标签信息包括:在没有标记高优先级标签信息的移动终端数据中,根据低优先级的标签配置的配置参数和移动终端数据的终端描述信息,获得移动终端tid的低优先级标签信息。一个实施例中,例如标签a为标签b的排斥优先级,那么生成标签b的标签配置的配置参数中会包括标签a的信息和优先级类型(即排斥优先级),那么在执行标签b的标签配置时,过滤掉标记有标签a的移动终端数据。

进一步的,根据本发明,在li层中的ni个标签配置{ci1,ci2,...,cini}均具有相同的优先级的基础上,处理装置包括并行处理装置,用于并行处理相同层(即优先级相同)中的多个标签配置,即根据多个标签配置的配置参数和移动终端数据的终端描述信息并行获取移动终端tid的多个标签信息,从而提升标签信息的获取效率。

进一步的,根据本发明,标签配置的配置参数还包括不大于时间周期t的时间参数t0,该时间参数用于指示根据数据库中的最近时间t0内的移动终端数据生成移动终端tid的一个标签。例如,当t为12周,但t0为1周时,仅根据数据库中最近1周的移动终端数据生成相应的标签,而不会遍历12周的数据,从而提升执行效率。本领域技术人员知晓,时间参数t0可以包括显示性的时间参数,例如指定为1周;也可以包括默认的时间参数,例如当标签配置中没有显示时间参数时,默认时间参数为3周。

此外,根据公开的本发明的说明书,本发明的其他实现对于本领域的技术人员是明显的。实施方式和/或实施方式的各个方面可以单独或者以任何组合用于本发明的系统和方法中。说明书和其中的示例应该是仅仅看作示例性,本发明的实际范围和精神由所附权利要求书表示。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1