唯一地识别网络连接实体的制作方法_2

文档序号:9438919阅读:来源:国知局
识的显著优点。将将看出的,这允许调节用于跨设备实体标识的 签名信息。而且,该方法提供在使用情况下的显著优点,其中,期望使用用于将移动用户作 为目标的在线数据源,但是不存在已知数据属性(诸如,电话号码、电子邮件地址等),以链 接移动和在线标识符。
[0020] 优选地,系统将特征签名的特定子集作为输入,并且检验排序规则的集合,以找到 唯一标识符,优选实时地。还将看出,因为实体可以开始使用其特征集合和用法图案还未被 识别的新设备或者其他原因,因为特征集合可能改变,通常不是所有特征都可以容易实时 地链接至相同标识符。为此,并且根据本公开的另一方面,系统优选地具有常规地合并参考 相同身份的标识符的离线处理,并且从而更新数据库。
[0021] 在不意味限制的情况下,优选地,标识系统和功能驻留在服务器侧架构上或者与 服务器侧架构结合,服务器侧架构包括例如简单η层架构、web门户、联合系统、应用服务 器、基于云的架构等。这与实现在连接至网络的客户端设备内的功能相反。因此,当实体 利用诸如移动电话、平板电脑、膝上型计算机等的多个设备,通过异构通信网络访问服务器 时,相同标识符优选通过关联置信水平,可以链接至实体。如将描述的,对于移动设备,唯一 标识符被用于web浏览器以及不同应用。
[0022] 在一种(非限制)使用情况下,标识系统包括移动广告平台的组件。该类型的平 台包括计算资源(系统、子系统、机器、程序、处理、数据库、接口、API等),以连接销售人/ 广告商与出版社/应用开发者。平台可以被用于创建移动广告交易,该移动广告交易允许 广告商和出版社购买和出售移动广告印象,在每个印象之后都更加智能。当广告商对印象 投标时,平台使得能够给广告商提供关于用户、设备、上下文和位置的信息(并且特别是实 体身份),使得广告商可以作出更好的购买决定。移动广告平台创建用于购买和出售移动库 存的更有效的市场,同时增加用于广告商的投资报酬率(通过帮助他们仅购买执行库存), 以及增加用于出版社的eCPM(通过利用所包括的相关联听众信息,帮助他们出售他们的库 存)。出版社提供能够访问他们的库存的广告平台(以使得平台能够将其出售),并且平台 可以与出版社共享所得到的收入。广告平台还通过例如经由他们的拍卖处理购买印象,获 得对第三方交易库存的访问,并且平台通过使用实时竞价拍卖,以目标方式将它们的库存 出售给广告商和代理商,获得广告收入。移动广告平台还可以与第三方平台和服务集成,第 三方平台和服务包括但不限于为广告商工作以以目标方式放置它们的广告的需求方平台、 聚集将被用于以DSP为目标并且出售给DSP的听众数据的数据管理平台(DMP)、以及与出版 社合作以聚集库存并且经由试图获得用于每个印象的最佳价格的交易出售其的供应方平 台。
[0023] 关于本公开的实体表示功能,移动广告平台使用标识机制,以通常经由HTTP(或 SOAP或RESTful呼叫)接收(从呼叫应用)请求,并且作为响应,返回实体身份。优选地, 然后使用实体身份检索对应数据属性,诸如,人口统计信息、心理图案、行为数据、以及意向 数据。
[0024] 图1中示出标识系统的组件。这些组件被分离示出,仅用于说明和解释的目的。组 件可以或可能被分离地实现或者作为集成系统,并且一个或多个组件可以被共同定位或者 相互远离。通常,一个或多个组件在计算机硬件中执行的计算机软件中被实现,优选地,在 一个或多个机器、服务器、程序、处理、执行线程等中。机制还包括优选地由数据库管理系统 管理的数据库和关联数据结构。
[0025] 参考图1,标识系统100包括多个逻辑和/或功能子系统。第一子系统是将原始签 名数据翻译为在系统中使用以定位和提取标识符的特征集合编码的签名提取子系统102。 优选地,由唯一地识别实体的字符串属性ID和作为或者可以单独或一起使用以唯一地限 定ID的值的模型参数集合来识别每个实体。该模型参数集合对实体建模,并且一起包括实 体的唯一表不。该唯一表不在此被称为实体签名104。第二子系统是实时标识服务106及其 关联实体数据库108。实体数据库108是包含要求用于通常基于传入属性的不同子集检索 实体身份的模型参数的中心数据库。标识服务106通过使用被输入为询问参数集合的传入 特征属性搜索数据库,识别数据库中的实体(假设存在一个)。搜索处理应用规则集合(如 以下更详细描述的),并且计算匹配得分,导致从数据库108检索实体身份,或者创建(并且 在其中存储)新实体身份。系统100还包括用于实体数据库108的维护和更新的第三子系 统110。第四子系统112更新决定规则和功能。数据库108优选被连续地更新,例如,以添 加新实体身份,更新用于每个实体身份的动态特征属性,删除复制实体身份(即,参考相同 实体的身份),以及解析表示相同实体的一个或多个身份。
[0026] 标识服务根据规则操作。这些规则包括应用至确定性(关键字)数据的专家规则 103、以及应用至用法特征(动态)数据的概率规则105。规则优选地遵循(follow)规则定 义接口 107。
[0027] -个或多个客户端101通过作出对内容的请求,访问标识服务。对内容的请求通 常与同网络连接实体相关联的确定性数据和/或用法特征数据相关联。根据本公开,当对 内容的请求与诸如用法特征数据的非关键字数据(以下更详细地描述)相关联时,概率匹 配函数(在规则105之一中限定)被应用至用法特征数据和编码特征属性集合之间的亲密 度测量(例如,从距离度量得到),以确定与该请求相关联的实体身份是否已经存在于数据 库108中。如果是,则使用实体身份,以便于对所述对内容的请求的响应。所请求的内容可 以是任何一种类型,并且用法特征数据可以以任何方式与请求相关联。虽然客户端可以是 移动设备,但是这不是限制。客户端可以是任何机器、系统、应用、或者不管协议、传输或请 求语义如何,向系统作出请求的其他计算资源。如上所述,用于识别实体的方法开始于生成 用于实体的唯一实体身份。从对实体建模的特征数据集合生成实体身份。特征数据通常包 括与选自特征数据类型集合的特征数据"类型"相关联的数据,所述特征数据类型集合是以 下一个或多个:确定性数据、设备和系统专用特征数据、以及用法特征数据。确定性数据有 时被称为"关键字"数据,但是其他类型的数据有时被称为"非关键字"数据。
[0028] 确定性数据是由提供商分配给用户的数据(例如,cookie、设备标识符、MSISDN、 电话号码、电子邮件地址、用户标识符等)。设备和系统专用特征数据可以被彻底改变,并 且通常是以下之一:操作系统(OS)类型、OS版本、系统时钟值、执行速度、最后安装的时间、 最后引导的时间、系统默认语言、系统本地时间、时区偏移、定向、显示度量、全局唯一标识 符(GUID)、模型、商标、以及构造版本。用法特征数据也可以被彻底改变,并且通常是以下 之一:HTTP报头、用法代理信息、用户询问数据、应用发起时间、应用退出时间、网络类型、 页加载时间、页卸载时间、访问的日期和时间、星期几、时刻、引用页、插件数据、地理数据、 位置数据、URL查看数据、键入频率数据、以及手势数据。在该方法中,实体身份通过将选自 规则集合中的一个或多个规则应用至手势数据生成,一个或多个规则识别使用哪个特征数 据来生成实体身份,其中,一个或多个规则包括至少一个确定性规则、以及至少一个概率规 贝1J。周期性地,通过应用规则,唯一实体身份被合并到被找到的一个或多个实体身份中,以 表示相同实体。
[0029] 图2是图示如何引导并且更新实体数据库108的处理流程。
[0030] 例程开始于步骤200,记录收集。优选地,在会话级组织事务数据,并且检索特征属 性。通常通过预处理,识别关键字字段。在步骤202处,执行关键字到标识符处理。对于具 有关键字(诸如但不限于:设备id、cookie、电子邮件地址、MAC、ESN、域专用标识符,诸如, 出版社签约标识)的记录,使用key2id函数填充初始id字段。该函数可以使用诸如MD5、 SHA-I等的散列函数、数学变换等实现。关键字到标识符处理还通过用所生成的标识符填 充部分记录,更新数据库表。结果,数据库的一些部分包含具有统一标识符的记录,同时剩 余记录具有还未填充的ID字段。然后,包括统一标识符的记录被表示为LinkedSetl。在 步骤204处,对剩余记录应用概率匹配规则(ProbRule),并且使用来自非关键字字段的数 据。优选地,在步骤202之后,对剩余的记录运行规则,以创建LinkedSet2。LinkedSetl和 LinkedSet2的联合包括数据库中的所有记录的集合。在步骤206,执行跨设备链接。在该 步骤中,LinkedSetl的子集针对已知关键字(诸如,电子邮件地址、电话号码等)被交叉参 考,以优选地通过将所有生成的标识符设置为任何可应用记录中的第一个,同时删除其他, 结合来自不同设备的记录。然后,受影响的数据记录被合并并且表示为LinkedSet3。在步 骤208处,使用LinkedSet3创建用于跨设备链接的概率规则,作为具有标记实例的训练数 据,并且其余作为未标记实例。然后,规则被应用至LinkedSet3的补充,以结合来自属于相 同实体的不同设备的记录。
[0031] 优选地,数据库的属性值还周期性地被更新,以反映值随着时间的改变。对于数 值,与正常范围的偏差被计算用于即将到来的记录。当偏差超过特定阈值时,值被更新为新 值,其中给定速率为氏+1$_〇=0*1$_〇(1-0)*偏差,0是范围[0,1]内的可调节 参数。
[0032] 图3是图示由用于从数据库的标识符查找的运行时间处理采取的步骤、以及引导 和更新数据库时的更详细步骤的处理流程。该处理采用签名作为输入,并且执行一系列操 作。这些操作开始于步骤300,首先标准化签名。在步骤302处,优选地,使用用于一个或 多个特征中的每个的不同编码函数{H(F_i) :1 = 1,2, . . .,η},对签名编
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1