设备识别方法及装置、用于设备识别的权重计算方法及装置与流程

文档序号:13532563阅读:215来源:国知局
设备识别方法及装置、用于设备识别的权重计算方法及装置与流程
本发明涉及网络
技术领域
,尤其涉及一种设备识别方法及装置、用于设备识别的权重计算方法及装置。
背景技术
:近年来,淘宝、京东等网络购物平台飞速发展。在网购过程中,买家和卖家通过在网络购物平台注册的账户标识(id,identifier)完成交易过程。上述交易过程是完全线上的交流方式,避开了自然人的出现,因此需要额外的信息来保证交易的安全。除了用户的账户id、ip(internetprotocol,网络协议)地址等常用信息之外,用户设备标识(id)也是一种特别有效的信息。用户设备id是指根据用户所使用的电子设备(包括个人电脑(pc,personalcomputer)、ipad、ios类型移动手机、安卓(android)类型移动手机等)的属性信息(例如,包括pc机的mac(mediumaccesscontrol,媒体访问控制)地址、ip地址、操作系统版本等信息),使用合适的设备识别算法生成的全局唯一的id。因此,即使用户改变了购买信息(如帐户id、用户名、收货地址等),通过用户设备id仍然可以识别出对应的设备。例如,通过用户设备id,可以有效地鉴别通过同设备买卖炒作信用的行为。然而,目前在使用设备识别算法生成全局唯一的用户设备id的过程中,存在权重参数较难确定以及设置不合理的问题,导致对用户设备的漏判率(falsenegativerate)增加,导致在应用或网站的全局数据库中会出现同一设备的两个用户设备id的情况。技术实现要素:以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本申请实施例提供一种设备识别方法及装置、用于设备识别的权重计算方法及装置,能够合理设置设备识别过程中用于计算设备相似度的权重,进而提高设备识别的准确性。本申请实施例提供一种设备识别方法,用于确定用户通过一账户id访问一应用或网站所使用设备是否匹配该应用或网站保存的已识别设备,其中,根据该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,设置有所述账户id关联所述样本设备属性的值的权重,所述方法包括:确定所述账户id访问该应用或网站所使用设备的待识别设备属性的值与该应用或网站保存的已识别设备的样本设备属性的值的匹配值;根据所述匹配值以及所述账户id关联所述样本设备属性的值的权重,计算所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度;根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。可选地,所述关联信息包括以下至少一项:所述账户id通过所述样本设备属性的值访问该应用或网站的次数、所述账户id集合中每个账户id通过所述样本设备属性的值访问该应用或网站的时刻以及时长。可选地,通过以下方式设置所述账户id关联所述样本设备属性的值的权重:根据所述关联信息,确定以下至少一项:所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重;根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重中的至少一项,确定所述账户id关联所述样本设备属性的值的权重。可选地,所述根据所述关联信息,确定所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重包括:根据所述关联信息,获取所述账户id通过所述样本设备属性的值访问该应用或网站的次数;计算所述次数的常用对数,以及所述常用对数与1的和值;在所述和值以及0之间取较大值,将所述较大值作为所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重。可选地,所述根据所述关联信息,确定所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重包括:根据所述关联信息,获取所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻以及最大时长、所述账户id集合通过所述样本设备属性的值访问该应用或网站的最近时刻以及最大时长;计算第一最近时刻与第二最近时刻的差值,以及所述差值的常用对数,将所述常用对数与1的和值的倒数作为所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻的权重;其中,所述第一最近时刻指所述账户id集合通过所述样本设备属性的值访问该应用或网站的最近时刻,所述第二最近时刻指所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻;计算第一最大时长与第二最大时长的比值,将所述比值作为所述账户id通过所述样本设备属性的值访问该应用或网站的最大时长的权重;其中,所述第一最大时长指所述账户id通过所述样本设备属性的值访问该应用或网站的最大时长,所述第二最大时长指所述账户id集合通过所述样本设备属性的值访问该应用或网站的最大时长;计算上述最近时刻的权重以及上述最大时长的权重的乘积,将所述乘积作为所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重。可选地,所述根据所述关联信息,确定所述样本设备属性的值的反向关联权重包括:根据所述关联信息,获取通过所述样本设备属性的值访问该应用或网站的账户id数目;计算所述账户id集合中账户id的总数与通过所述样本设备属性的值访问该应用或网站的账户id数目的比值;计算所述比值的常用对数,将所述常用对数作为所述样本设备属性的值的反向关联权重。可选地,所述根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重中的至少一项,确定所述账户id关联所述样本设备属性的值的权重,包括:根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重的乘积,确定所述账户id关联所述样本设备属性的值的权重。可选地,通过以下方式设置所述账户id关联所述样本设备属性的值的权重:按照预定周期确定该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,根据所述关联信息,计算所述账户id关联所述样本设备属性的值的权重;和/或,确定预定时段内该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,根据所述关联信息,计算所述账户id关联所述样本设备属性的值的权重。可选地,所述确定所述账户id访问该应用或网站所使用设备的待识别设备属性的值与该应用或网站保存的已识别设备的样本设备属性的值的匹配值,包括:确定所述账户id访问该应用或网站所使用设备的每个待识别设备属性的值与该应用或网站保存的已识别设备的样本设备属性的值的匹配值,其中,若所述待识别设备属性的值与所述样本设备属性的值相等,则所述匹配值为1,若所述待识别设备属性的值与所述样本设备属性的值不相等,则所述匹配值为0;所述根据所述匹配值以及所述账户id关联所述样本设备属性的值的权重,计算所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度,包括:计算每个匹配值与所述账户id关联所述样本设备属性的值的权重的乘积,根据所述乘积的和值,确定所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度。可选地,所述根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备,包括:若所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度满足预设条件,则确定所述账户id所使用设备匹配该应用或网站保存的所述已识别设备;若所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度不满足预设条件,则确定所述账户id所使用设备不匹配该应用或网站保存的所述已识别设备。本申请实施例还提供一种用于设备识别的权重计算方法,包括:确定一应用或网站保存的已识别设备的样本设备属性与账户id集合之间的关联信息;根据所述关联信息,计算所述账户id集合中一个或多个账户id关联所述样本设备属性的值的权重,其中,所述账户id关联所述样本设备属性的值的权重用于计算用户通过所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度,以根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。可选地,所述关联信息包括以下至少一项:所述账户id通过所述样本设备属性的值访问该应用或网站的次数、所述账户id集合中每个账户id通过所述样本设备属性的值访问该应用或网站的时刻以及时长。可选地,所述根据所述关联信息,计算所述账户id集合中一个或多个账户id关联所述样本设备属性的值的权重,包括:针对所述账户id集合中的一个账户id,根据所述关联信息,确定以下至少一项:所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重;根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重中的至少一项,确定所述账户id关联所述样本设备属性的值的权重。可选地,所述根据所述关联信息,确定所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重包括:根据所述关联信息,获取所述账户id通过所述样本设备属性的值访问该应用或网站的次数;计算所述次数的常用对数,以及所述常用对数与1的和值;在所述和值以及0之间取较大值,将所述较大值作为所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重。可选地,所述根据所述关联信息,确定所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重包括:根据所述关联信息,获取所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻以及最大时长、所述账户id集合通过所述样本设备属性的值访问该应用或网站的最近时刻以及最大时长;计算第一最近时刻与第二最近时刻的差值,以及所述差值的常用对数,将所述常用对数与1的和值的倒数作为所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻的权重;其中,所述第一最近时刻指所述账户id集合通过所述样本设备属性的值访问该应用或网站的最近时刻,所述第二最近时刻指所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻;计算第一最大时长与第二最大时长的比值,将所述比值作为所述账户id通过所述样本设备属性的值访问该应用或网站的最大时长的权重;其中,所述第一最大时长指所述账户id通过所述样本设备属性的值访问该应用或网站的最大时长,所述第二最大时长指所述账户id集合通过所述样本设备属性的值访问该应用或网站的最大时长;计算上述最近时刻的权重以及上述最大时长的权重的乘积,将所述乘积作为所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重。可选地,所述根据所述关联信息,确定所述样本设备属性的值的反向关联权重包括:根据所述关联信息,获取通过所述样本设备属性的值访问该应用或网站的账户id数目;计算所述账户id集合中账户id的总数与通过所述样本设备属性的值访问该应用或网站的账户id数目的比值;计算所述比值的常用对数,将所述常用对数作为所述样本设备属性的值的反向关联权重。可选地,所述根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重中的至少一项,确定所述账户id关联所述样本设备属性的值的权重,包括:根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重的乘积,确定所述账户id关联所述样本设备属性的值的权重。可选地,所述确定一应用或网站保存的已识别设备的样本设备属性与账户id集合之间的关联信息,包括:按照预定周期确定该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息;和/或,确定预定时段内该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息。本申请实施例还提供一种设备识别装置,用于确定用户通过一账户id访问一应用或网站所使用设备是否匹配该应用或网站保存的已识别设备,所述设备识别装置包括:第一计算模块,用于根据该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,计算所述账户id关联所述样本设备属性的值的权重;第一确定模块,用于确定所述账户id访问该应用或网站所使用设备的待识别设备属性的值与该应用或网站保存的已识别设备的样本设备属性的值的匹配值;第二计算模块,用于根据所述匹配值以及所述账户id关联所述样本设备属性的值的权重,计算所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度;第二确定模块,用于根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。本申请实施例还提供一种用于设备识别的权重计算装置,包括:第三确定模块,用于确定一应用或网站保存的已识别设备的样本设备属性与账户id集合之间的关联信息;第三计算模块,用于根据所述关联信息,计算所述账户id集合中一个或多个账户id关联所述样本设备属性的值的权重,其中,所述账户id关联所述样本设备属性的值的权重用于计算用户通过所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度,以根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。本申请实施例还提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令被执行时实现上述设备识别方法。本申请实施例还提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令被执行时实现上述用于设备识别的权重计算方法。在本申请实施例中,确定一应用或网站保存的已识别设备的样本设备属性与账户id集合之间的关联信息;根据所述关联信息,计算所述账户id集合中一个或多个账户id关联所述样本设备属性的值的权重,其中,所述账户id关联所述样本设备属性的值的权重用于计算用户通过所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度,以根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。通过本申请实施例,实现了合理设置设备识别过程中用于设备相似度计算的权重,进而提高了设备识别的准确性。进一步地,在本申请实施例中,基于账户id集合与应用或网站保存的已识别设备的样本设备属性之间的关联信息,可以确定账户id通过样本设备属性的值访问该应用或网站的次数权重、账户id通过样本设备属性的值访问该应用或网站的时间权重以及样本设备属性的值的反向关联权重中的至少两项,进而确定账户id关联样本设备属性的值的权重。如此,提高了用于设备相似度计算的权重的合理性和有效性。当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。在阅读并理解了附图和详细描述后,可以明白其他方面。附图说明图1为本申请实施例一的设备识别方法的流程图;图2为本申请实施例一的设备识别装置的示意图;图3为本申请实施例二的用于设备识别的权重计算方法的流程图;图4为本申请实施例二中的二部图的示意图;图5为本申请实施例二的用于设备识别的权重计算装置的示意图。具体实施方式以下结合附图对本申请实施例进行详细说明,应当理解,以下所说明的实施例仅用于说明和解释本申请,并不用于限定本申请。需要说明的是,如果不冲突,本申请实施例以及实施例中的特征可以相互结合,均在本申请的保护范围之内。另外,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。术语定义:账户标识(id,identifier):是指自然人在应用或网站中注册过的身份标识。设备属性:是指每个设备拥有的特征,例如,个人电脑(personalcomputer)的mac地址、ip地址、操作系统版本等用于识别设备身份的信息。二部图:又称作二分图,是指顶点可以分成两个不相交的集,使得在同一个集内的顶点不相邻(没有共同边)的图。常用对数:是指以10为底的对数。实施例一图1为本申请实施例一提供的设备识别方法的流程图。本实施例提供一种设备识别方法,用于确定用户通过一账户id访问一应用或网站所使用设备是否匹配该应用或网站保存的已识别设备,其中,根据该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,设置有所述账户id关联所述样本设备属性的值的权重。其中,所述关联信息包括以下至少一项:所述账户id通过所述样本设备属性的值访问该应用或网站的次数、所述账户id集合中每个账户id通过所述样本设备属性的值访问该应用或网站的时刻以及时长。所述账户id集合可以包括在该应用或网站注册的所有账户id。本实施例提供的方法可以应用于服务端计算设备(例如,服务器)或者在服务端计算设备上运行的虚拟机。本申请对此并不限定。于本实施例中,当用户在设备(例如,手机或电脑等客户端计算设备)上通过账户id访问应用(例如,web应用)或网站时,该设备的设备属性(以安卓手机为例,所述设备属性例如包括mac地址、手机型号等)会被该应用或网站对应的服务器所获取,并被保存在数据库中。其中,服务器在获取用户访问该应用或网站所使用设备的设备属性后,生成一条设备记录信息,并保存所述设备记录信息,所述设备记录信息包括所述设备的设备属性的值。其中,所述账户id是用户在该应用或网站注册过的id。上述设备属性是生成用户设备id的重要参数。服务器给每个已识别出的设备分配一个用户设备id,从而区分不同的设备。于本实施例中,应用或网站的数据库中保存有已识别设备的用户设备id以及该已识别设备的设备属性以及具体的值。于本实施例中,将应用或网站的数据库保存的已识别设备的设备属性称为样本设备属性,将用户访问该应用或网站所使用的待识别设备的设备属性称为待识别设备属性。于本实施例中,所述账户id关联所述样本设备属性的值的权重可以预先设置,例如,按照预定周期确定该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,根据所述关联信息进行权重计算;或者,所述账户id关联所述样本设备属性的值的权重可以在进行设备识别时且在设备相似度计算步骤之前进行设置,例如,在进行设备识别时且在设备相似度计算步骤之前,确定预定时段内该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,根据所述关联信息,计算所述账户id关联所述样本设备属性的值的权重。然而,本申请对此并不限定。如图1所示,本实施例提供的设备识别方法,用于确定用户通过一账户id访问一应用或网站所使用设备是否匹配该应用或网站保存的已识别设备,上述方法包括以下步骤:步骤101:确定所述账户id访问该应用或网站所使用设备的待识别设备属性的值与该应用或网站保存的已识别设备的样本设备属性的值的匹配值;步骤102:根据所述匹配值以及所述账户id关联所述样本设备属性的值的权重,计算所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度;步骤103:根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。于本实施例中,步骤101包括:针对该应用或网站保存的一个已识别设备,确定所述账户id访问该应用或网站所使用设备的每个待识别设备属性的值与该应用或网站保存的该已识别设备的每个样本设备属性的值的匹配值,其中,若所述待识别设备属性的值与所述样本设备属性的值相等,则所述匹配值为1,若所述待识别设备属性的值与所述样本设备属性的值不相等,则所述匹配值为0。于本实施例中,步骤102包括:计算步骤101确定的每个匹配值与所述账户id关联对应的所述样本设备属性的值的权重的乘积,根据所述乘积的和值,确定所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度。于本实施例中,步骤103包括:若所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度满足预设条件,则确定所述账户id所使用设备匹配该应用或网站保存的所述已识别设备;若所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度不满足预设条件,则确定所述账户id所使用设备不匹配该应用或网站保存的所述已识别设备。于本实施例中,针对账户id访问该应用或网站所使用设备,该应用或网站会记录每次访问的设备记录信息,该设备记录信息包括账户id当前访问所使用设备的设备属性以及具体的值。针对该应用或网站保存的已识别设备,该应用或网站保存的设备记录信息包括:该已识别设备的用户设备id、该已识别设备的设备属性及具体的值。下面以确定用户当前访问应用或网站所使用设备的设备记录信息(例如,设备记录信息r)和该应用或网站保存的已识别设备的设备记录信息(例如,设备记录信息r′)是否匹配为例进行说明。根据以下公式计算上述两条设备记录信息r,r′之间的相似性:simr(r,r′)=σa∈aw(r.a,r′.a)×sima(r.a,r′.a);其中,a表示当前相似度计算涉及的所有设备属性,a表示一个设备属性的一个值;w(r.a,r′.a)表示设备记录信息r的账户id关联一个设备属性的值的权重(即,账户id关联样本设备属性的值的权重),sima(r.a,r′.a)表示上述两条设备记录信息的设备属性的值是否相等(即,设备记录信息r中的待识别设备属性的值与设备记录信息r′中的样本设备属性的值是否相等),若两者相同则值为1,若两者不相同则值为0。上述公式的含义是根据设备属性的值是否相同以及账户id关联样本设备属性的值的权重计算两条设备记录信息之间的相似度。举例而言,用户通过账户id访问应用或网站所使用设备的设备记录信息r包括以下待识别设备属性:设备属性p(值为p1)、设备属性q(值为q1)以及设备属性k(值为k1),该应用或网站保存的一个已识别设备的设备记录信息r′包括以下样本设备属性:设备属性p(值为p1)、设备属性q(值为q2)以及设备属性k(值为k1),且该账户id关联样本设备属性p的值p1的权重为w1,关联样本设备属性k的值k1的权重为w2,则根据上述相似度公式可知,用户通过该账户id访问该应用或网络所使用设备的设备记录信息r与该已识别设备的设备记录信息r′之间的相似度如下:simr(r,r′)=1×w1+1×w2。于本实施例中,在根据上述相似度公式确定两条设备记录信息之间的相似度后,若所述相似度满足预设条件,则确定所述两条设备记录信息匹配,即所述两条设备记录信息对应的设备匹配,反之,则确定所述两条设备记录信息不匹配,即所述两条设备记录信息对应的设备不匹配。其中,所述预设条件可以为计算得到的相似度大于预设阈值,或者,计算得到的相似度在预设区间内。然而,本申请对此并不限定。于实际应用中,可以根据实际需要设置所述预设条件。于本实施例中,若待识别设备(例如用户当前访问应用或网站所使用设备)的设备记录信息与应用或网站保存的所有已识别设备的设备记录信息均不匹配,则该应用或网站会为该待识别设备创建一个新的用户设备id,并保存该新的用户设备id以及该待识别设备的设备属性的值至数据库;若待识别设备的设备记录信息与该应用或网站保存的已识别设备的设备记录信息中的一条匹配,则可以识别所述两条设备记录信息对应的设备为同一设备,即可以识别该待识别设备为曾经访问过该应用或网站的设备。由上可知,在识别用户设备的过程中,设备属性的值的权重是十分重要的。如果权重设置不合理,很有可能给当前的待识别设备记录创建一个新的用户设备id,导致漏判率(falsenegativerate)增加,而全局数据库中会出现同一设备的两个用户设备id。于本实施例中,通过以下方式设置所述账户id关联所述样本设备属性的值的权重:根据所述关联信息,确定以下至少一项:所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重;根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重中的至少一项,确定所述账户id关联所述样本设备属性的值的权重。于本实施例中,在用户通过账户id访问应用或网站时,该应用或网站会记录每个账户id对该应用或网站的访问情况。针对一个账户id通过一设备对该应用或网站进行的一次访问情况,生成一条包括设备记录信息的访问记录数据。每条访问记录数据描述了一个账户id在对该应用或网站进行的一次访问中涉及的设备属性的信息以及访问时间等信息。例如,每条访问记录数据可以包括以下信息:账户id、此次应用或网站访问中该账户id所使用设备的设备属性以及每个设备属性的值、此次访问该应用或网站的时长、此次访问该应用或网站的时刻等信息。该应用或网站的数据库中存储有针对该应用或网站的多条访问记录数据,该些访问记录数据例如以日志方式进行保存。于本实施例中,所述根据所述关联信息,确定所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重包括:根据所述关联信息,获取所述账户id通过所述样本设备属性的值访问该应用或网站的次数;计算所述次数的常用对数,以及所述常用对数与1的和值;在所述和值以及0之间取较大值,将所述较大值作为所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重。于本实施例中,所述根据所述关联信息,确定所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重包括:根据所述关联信息,获取所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻以及最大时长、所述账户id集合通过所述样本设备属性的值访问该应用或网站的最近时刻以及最大时长;计算第一最近时刻与第二最近时刻的差值,以及所述差值的常用对数,将所述常用对数与1的和值的倒数作为所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻的权重;其中,所述第一最近时刻指所述账户id集合通过所述样本设备属性的值访问该应用或网站的最近时刻,所述第二最近时刻指所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻;计算第一最大时长与第二最大时长的比值,将所述比值作为所述账户id通过所述样本设备属性的值访问该应用或网站的最大时长的权重;其中,所述第一最大时长指所述账户id通过所述样本设备属性的值访问该应用或网站的最大时长,所述第二最大时长指所述账户id集合通过所述样本设备属性的值访问该应用或网站的最大时长;计算上述最近时刻的权重以及上述最大时长的权重的乘积,将所述乘积作为所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重。于本实施例中,所述根据所述关联信息,确定所述样本设备属性的值的反向关联权重包括:根据所述关联信息,获取通过所述样本设备属性的值访问该应用或网站的账户id数目;计算所述账户id集合中账户id的总数与通过所述样本设备属性的值访问该应用或网站的账户id数目的比值;计算所述比值的常用对数,将所述常用对数作为所述样本设备属性的值的反向关联权重。于本实施例中,根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重的乘积,确定所述账户id关联所述样本设备属性的值的权重。然而,本申请对此并不限定。于其他实施例中,还可以根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重的和值,确定所述账户id关联所述样本设备属性的值的权重。或者,还可以根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重中任意两项的乘积或和值,确定所述账户id关联所述样本设备属性的值的权重。图2为本申请实施例提供的设备识别装置的示意图。本实施例提供的设备识别装置,用于确定用户通过一账户id访问一应用或网站所使用设备是否匹配该应用或网站保存的已识别设备,如图2所示,所述设备识别装置包括:第一计算模块201,用于根据该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,计算所述账户id关联所述样本设备属性的值的权重;第一确定模块202,用于确定所述账户id访问该应用或网站所使用设备的待识别设备属性的值与该应用或网站保存的已识别设备的样本设备属性的值的匹配值;第二计算模块203,用于根据所述匹配值以及所述账户id关联所述样本设备属性的值的权重,计算所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度;第二确定模块204,用于根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。其中,所述关联信息包括以下至少一项:所述账户id通过所述样本设备属性的值访问该应用或网站的次数、所述账户id集合中每个账户id通过所述样本设备属性的值访问该应用或网站的时刻以及时长。于本实施例中,所述第一计算模块201,用于通过以下方式计算所述账户id关联所述样本设备属性的值的权重:根据所述关联信息,确定以下至少一项:所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重;根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重中的至少一项,确定所述账户id关联所述样本设备属性的值的权重。于本实施例中,所述第一计算模块201用于通过以下方式根据所述关联信息,确定所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重:根据所述关联信息,获取所述账户id通过所述样本设备属性的值访问该应用或网站的次数;计算所述次数的常用对数,以及所述常用对数与1的和值;在所述和值以及0之间取较大值,将所述较大值作为所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重。于本实施例中,所述第一计算模块201用于通过以下方式根据所述关联信息,确定所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重:根据所述关联信息,获取所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻以及最大时长、所述账户id集合通过所述样本设备属性的值访问该应用或网站的最近时刻以及最大时长;计算第一最近时刻与第二最近时刻的差值,以及所述差值的常用对数,将所述常用对数与1的和值的倒数作为所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻的权重;其中,所述第一最近时刻指所述账户id集合通过所述样本设备属性的值访问该应用或网站的最近时刻,所述第二最近时刻指所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻;计算第一最大时长与第二最大时长的比值,将所述比值作为所述账户id通过所述样本设备属性的值访问该应用或网站的最大时长的权重;其中,所述第一最大时长指所述账户id通过所述样本设备属性的值访问该应用或网站的最大时长,所述第二最大时长指所述账户id集合通过所述样本设备属性的值访问该应用或网站的最大时长;计算上述最近时刻的权重以及上述最大时长的权重的乘积,将所述乘积作为所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重。于本实施例中,所述第一计算模块201用于通过以下方式根据所述关联信息,确定所述样本设备属性的值的反向关联权重:根据所述关联信息,获取通过所述样本设备属性的值访问该应用或网站的账户id数目;计算所述账户id集合中账户id的总数与通过所述样本设备属性的值访问该应用或网站的账户id数目的比值;计算所述比值的常用对数,将所述常用对数作为所述样本设备属性的值的反向关联权重。在一些实现方式中,所述第一计算模块201用于根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重的乘积,确定所述账户id关联所述样本设备属性的值的权重。在一些实现方式中,所述第一计算模块201用于通过以下方式计算所述账户id关联所述样本设备属性的值的权重:按照预定周期确定该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,根据所述关联信息,计算所述账户id关联所述样本设备属性的值的权重;和/或,确定预定时段内该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,根据所述关联信息,计算所述账户id关联所述样本设备属性的值的权重。于本实施例中,所述第一确定模块202用于确定所述账户id访问该应用或网站所使用设备的每个待识别设备属性的值与该应用或网站保存的一个已识别设备的样本设备属性的值的匹配值,其中,若所述待识别设备属性的值与所述样本设备属性的值相等,则所述匹配值为1,若所述待识别设备属性的值与所述样本设备属性的值不相等,则所述匹配值为0;所述第二计算模块203用于计算第一确定模块202确定的每个匹配值与第一计算模块201得到的所述账户id关联所述样本设备属性的值的权重的乘积,根据所述乘积的和值,确定所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度;所述第二确定模块204用于通过以下方式根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备:若所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度满足预设条件,则确定所述账户id所使用设备匹配该应用或网站保存的所述已识别设备;若所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度不满足预设条件,则确定所述账户id所使用设备不匹配该应用或网站保存的所述已识别设备。关于上述装置的处理流程同图1所示的方法所述,故于此不再赘述。实施例二如图3所示,本实施例提供一种用于设备识别的权重计算方法,所述方法包括以下步骤:步骤301:确定一应用或网站保存的已识别设备的样本设备属性与账户id集合之间的关联信息;步骤302:根据所述关联信息,计算所述账户id集合中一个或多个账户id关联所述样本设备属性的值的权重;其中,所述账户id关联所述样本设备属性的值的权重用于计算用户通过所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度,以根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。于本实施例中,可以根据实际需要计算所述账户id集合中一个或多个账户id关联所述样本设备属性的值的权重。其中,所述关联信息包括以下至少一项:所述账户id通过所述样本设备属性的值访问该应用或网站的次数、所述账户id集合中每个账户id通过所述样本设备属性的值访问该应用或网站的时刻以及时长。所述账户id集合可以包括在该应用或网站注册的所有账户id。本实施例提供的方法可以应用于服务端计算设备(例如,服务器)或者在服务端计算设备上运行的虚拟机。然而,本申请对此并不限定。本实施例提供的方法可以应用于用户通过一设备访问应用或网站,该应用或网站对该设备进行设备识别的过程中,例如,该应用或网站对应的服务器在接收到用户通过账户id在一设备发出对该应用的访问请求时,所述服务器执行本实施例提供的方法;或者,本实施例提供的方法也可以由该应用或网站对应的服务器根据预设时长周期性执行,其中,最新确定的权重数据可以用于预设时长内发生的设备识别过程;或者,本实施例提供的方法也可以根据应用或网站管理员的指令触发服务器执行。然而,本实施例对此并不限定。于本实施例中,在用户通过账户id访问应用或网站时,该应用或网站会记录每个账户id对该应用或网站的访问情况。针对一个账户id通过一设备对该应用或网站进行的一次访问情况,生成一条包括访问设备的设备属性信息的访问记录数据。每条访问记录数据描述了一个账户id在对该应用或网站进行的一次访问中涉及的设备属性的信息以及访问时间等信息。例如,每条访问记录数据可以包括以下信息:账户id、此次访问应用或网站时该账户id所使用设备的设备属性以及每个设备属性的值、此次访问该应用或网站的时长、此次访问该应用或网站的时刻等信息。该应用或网站的数据库中存储有针对该应用或网站的多条访问记录数据,该些访问记录数据例如以日志方式进行保存。于本实施例中,将应用或网站的数据库保存的已识别设备的设备属性称为样本设备属性,将用户访问该应用或网站所使用的待识别设备的设备属性称为待识别设备属性。在一些实现方式中,步骤301包括:按照预定周期确定该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息;和/或,确定预定时段内该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息。于本实施例中,可以根据当前用户访问应用或网站所使用设备(以下称为待识别设备)的待识别设备属性的值确定从应用或网站保存的访问记录数据中获取哪些样本设备属性的哪些值。例如,若待识别设备的设备属性包括设备属性a(设备属性a的属性值为a1)和设备属性b(设备属性b的属性值为b1),则可以从该应用或网站的数据库中获取包括设备属性a的属性值a1的所有访问记录数据以及包括设备属性b的属性值b1的所有访问记录数据。或者,可以根据预设策略确定从该应用或网站保存的访问记录数据中获取哪些样本设备属性的哪些值。例如,所述预设策略包括获取设备属性a的所有值(例如,值a1~a3)以及设备属性b的所有值(例如,值b1~b4),则可以根据所述预设策略从该应用或网站的数据库保存的访问记录数据中获取包括设备属性a的值a1、a2或a3的访问记录数据以及包括设备属性b的值b1、b2、b3或b4的访问记录数据。其中,步骤301和步骤302可以周期性执行,从而实现动态的权重计算,得到动态的权重;在步骤301中,可以基于应用或网站保存的所有访问记录数据进行数据筛选,得到权重计算所需的基础数据,也可以基于预定时间段内的访问记录数据进行数据筛选,得到权重计算所需的基础数据。其中,预定周期以及预定时间段均可以按照实际需要进行设置。本申请对此并不限定。于本实施例中,将账户id集合和设备属性的值的集合分别看成两个抽象的节点集合,将用户的访问行为看成节点之间的连边,由此形成一个账户id集合和设备属性的值的集合之间具有多条连边的二部图。在二部图中,账户id和设备属性的值均作为顶点,假定一应用系统中共注册有m个账户id,表示为u={u1,u2,…,um};n个设备属性的值,表示为d={d1,d2,…,dn}。如果账户id通过设备属性的值访问了该应用,则从顶点u到顶点d有一条边。在这里,可以忽略边的方向,如此便可以得到一个二部图g=(u∪d,e),其中e是边的集合。如图4所示,左边圆形节点表示账户id集合(以三个账户id为例),右边矩形节点表示设备属性的值的集合(以五个值为例)。其中,设备属性的值的集合中包括的值可以是一个设备属性的部分取值或所有取值,也可以是多个设备属性的部分取值或所有取值。本申请对此并不限定。下面基于应用或网站保存的已识别设备的样本设备属性的值的集合与在该应用或网站注册的账户id集合构成的二部图,对本实施例提供的权重计算方法进行详细说明。于本实施例中,账户idui关联样本设备属性的值dj的权重的计算公式如下:w(ui,dj)=f(ui,dj)×g(ui,dj)×h(dj);其中,ui表示账户id集合中第i个账户id,dj表示样本设备属性的值的集合中第j个值,f(ui,dj)为账户idui通过样本设备属性的值dj访问一应用或网站的次数权重,g(ui,dj)为账户idui通过样本设备属性的值dj访问该应用或网站的时间权重,h(dj)为样本设备属性的值dj的反向关联权重,其中,i和j均为正整数。需要说明的是,本实施例计算得到的权重w(ui,dj)可以应用于实施例一中的相似度公式中,即实施例一的相似度公式中w(r.a,r′.a)的取值采用本实施例计算得到的权重。于本实施例中,根据应用或网站的数据库中保存的访问记录数据可以得到账户id与该应用或网站的已识别设备的样本设备属性之间的以下关联信息:当账户idui通过样本设备属性的值dj访问该应用或网站时,账户idui通过该样本设备属性的值dj的访问次数d(ui,dj)、访问时间长度集合t(ui,dj)以及最近访问时刻t(ui,dj),以及账户id集合通过样本设备属性的值dj的最近访问时刻t(dj),其中,t(dj)≥t(ui,dj)。于本实施例中,针对账户id集合中的一个账户id,可以根据上述关联信息,通过以下公式确定所述账户id通过样本设备属性的值访问该应用或网站的次数权重:其中,ui表示账户id集合中第i个账户id,dj表示样本设备属性的值的集合中第j个值,d(ui,dj)表示账户idui通过样本设备属性的值dj访问该应用或网站的次数,其中,i和j均为正整数。一般来说,账户idui通过设备属性的值dj访问应用或网站的次数越多,那么该账户id与该设备属性的值之间的联系就越强,因此,访问次数的权重f(ui,dj)可以定义为:f(ui,dj)=d(ui,dj);但是有时账户id在某一时间段内密集访问,会造成访问次数d(ui,dj)异常大,为了防止这一问题的出现,本申请实施例将访问次数的权重取对数,定义如下:于本实施例中,针对账户id集合中的一个账户id,可以根据上述关联信息,通过以下公式确定账户id通过样本设备属性的值访问该应用或网站的时间权重:g(ui,dj)=p(ui,dj)×q(ui,dj);其中,其中,ui表示账户id集合中第i个账户id,dj表示样本设备属性的值的集合中第j个值,p(ui,dj)为账户idui通过样本设备属性的值dj访问该应用或网站的最近时刻的权重,q(ui,dj)为账户idui通过样本设备属性的值dj访问该应用或网站的最大时长的权重,t(dj)为账户id集合通过样本设备属性的值dj访问该应用或网站的最近时刻,t(ui,dj)为账户idui通过样本设备属性的值dj访问该应用或网站的最近时刻,maxt(ui,dj)为账户idui通过样本设备属性的值dj访问该应用或网站的最大时长,maxk∈[1,m]t(uk,dj)为账户id集合通过样本设备属性的值dj访问该应用或网站的最大时长,其中,i和j均为正整数。时间因素对计算账户id与设备属性的值之间联系强弱的重要性不言而喻,但是由于时间信息难以捕捉和量化,目前已有的方法并没有将时间因素考虑在内,因此,相关技术中的权重很难反应账户id和设备属性的值之间关系的动态特性。本实施例采用最近时刻和最大时长描述账户id和设备属性的值之间的关系。其中,p(ui,dj)反映了账户id最近的访问,近期访问的价值大于很久以前的访问,因此,距离当前时间越远,p(ui,dj)越小。而q(ui,dj)反映了账户idui通过样本设备属性的值dj的访问时长的影响,时间长度越长,说明账户idui与样本设备属性的值dj的联系强度越强。于本实施例中,可以根据上述关联信息,通过以下公式确定样本设备属性的值的反向关联权重:其中,dj表示样本设备属性的值的集合中第j个值,m表示上述二部图的账户id集合中账户id的总数,k(dj)为样本设备属性的值dj关联的账户id数目(即,通过样本设备属性的值dj访问该应用或网站的账户id数目),其中,j为正整数。一般地,关联多个账户id的设备属性的值的节点连边的权重应该比关联某个特定账户id的设备属性的值的节点连边的权重要低,这是因为关联账户id越少的设备属性的值,它与账户id的关系更加黏合。为此,对于关联多个账户id的设备属性的值应该增加这个设备属性的值的模糊性和不确定性。利用信息熵理论,设备属性的值的熵定义为:e(dj)=-∑ui∈up(ui|dj)log10p(ui|dj);其中,p(ui|dj)为账户idui关联设备属性的值dj的概率,根据等概率事件,k(dj)为设备属性的值dj关联的账户id数目,那么设备属性的值的最大熵为:e(dj)=log10k(dj)。于此,为了简化计算,本实施例将最大熵近似看成设备属性的值的熵。设备属性的值与账户id的联系强度应该与设备属性的值的熵成反比,因此关联账户id越多的设备属性的值,它与账户id的联系强度越弱。因此,本实施例给出的设备属性的值的反向关联权重定义如下:其中,m为二部图中账户id集合中账户id的总数。综上可知,本实施例基于账户id所有的样本设备属性的值,综合计算账户id关联样本设备属性的值的权重;基于账户id通过样本设备属性的值的访问次数调整计算权重;基于账户id通过样本设备属性的值的访问时间调整计算权重;基于样本设备属性的值关联账户id的个数调整计算权重;从而实现合理设置设备识别过程中用于设备相似度计算的权重。下面通过一实例对本实施例进行说明。于本实例中,在一应用保存的访问记录数据中,以android类型移动设备为例,获取的设备属性为:androidid(简称为aid)。其中,androidid是一串64位的编码(十六进制的字符串),如果采用恢复出厂值等手段会使这个值改变。于本实例中,仅以一个设备属性的多个取值为例,然而,本申请对此并不限定。下面给出应用保存的访问记录列表,如表1所示。表1历史访问记录列表表2aid值列表aidd19774d56d682e549cd23dcc3d9765e7f1dbd323d65e76338f743ad4637fe67c812e3febd572d64ef819a62c5e于本实例中,根据aid值与账户id之间的关联关系构建的二部图如图4所示,其中,账户id的总数目为3(即,m=3),设备属性的值的总数目为5(即,n=5)。如图4所示,u1与d1和d3之间存在关联关系,u2与d1、d2、d4及d5之间存在关联关系,u3与d2和d5之间存在关联关系。于本实例中,账户id通过aid值访问该应用的次数权重的计算参照表3。需要说明的是,于本实例中的计算结果的取值均四舍五入,保留小数点后两位。表3账户idaid访问次数d(ui,dj)f(ui,dj)u19774d56d682e549c102.00u123d65e76338f743a1003.00u29774d56d682e549c202.30u23dcc3d9765e7f1db302.48u2637fe67c812e3feb51.70u272d64ef819a62c5e51.70u33dcc3d9765e7f1db202.30u372d64ef819a62c5e102.0于本实例中,aid值的时间权重的计算参照表4和表5。于本实例中,时间权重计算过程中以小时为单位,然而,本申请对此并不限定,也可以采用其他时间单位,只要采用统一的单位即可。表4表5于本实例中,aid值的反向关联权重的计算参照表6。表6androidid(aid)k(dj)h(dj)d19774d56d682e549c20.18d23dcc3d9765e7f1db20.18d323d65e76338f743a10.48d4637fe67c812e3feb10.48d572d64ef819a62c5e20.18于本实例中,每个账户id关联aid值的最终权重值结果参照表7所示。表7账户idaidf(ui,dj)g(ui,dj)h(dj)w(ui,dj)u19774d56d682e549c20.260.180.09u123d65e76338f743a310.481.44u29774d56d682e549c2.310.180.41u23dcc3d9765e7f1db2.480.20.180.09u2637fe67c812e3feb1.710.480.82u272d64ef819a62c5e1.70.310.180.09u33dcc3d9765e7f1db2.310.180.41u372d64ef819a62c5e210.180.36其中,表7中的w(ui,dj)列即为最终计算得到的权重值。于本实例中,账户idu1关联aid值(9774d56d682e549c)的权重为0.09,关联aid值(23d65e76338f743a)的权重为1.44。后续在进行设备识别时,若账户idu1的一条新的设备记录信息中包括aid值(例如为23d65e76338f743a)时,则账户idu1关联该aid值的权重即可采用1.44。图5为本申请实施例的用于设备识别的权重计算装置的示意图。如图5所示,本实施例的装置包括:第三确定模块501,用于确定一应用或网站保存的已识别设备的样本设备属性与账户id集合之间的关联信息;第三计算模块502,用于根据所述关联信息,计算所述账户id集合中一个或多个账户id关联所述样本设备属性的值的权重;其中,所述账户id关联所述样本设备属性的值的权重用于计算用户通过所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度,以根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。在本实施例中,所述第三计算模块502通过以下方式根据所述关联信息,计算所述账户id集合中一个或多个账户id关联所述样本设备属性的值的权重,包括:针对所述账户id集合中的一个账户id,根据所述关联信息,确定以下至少一项:所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重;根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重中的至少一项,确定所述账户id关联所述样本设备属性的值的权重。在本实施例中,所述第三计算模块502通过以下方式根据所述关联信息,确定所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重包括:根据所述关联信息,获取所述账户id通过所述样本设备属性的值访问该应用或网站的次数;计算所述次数的常用对数,以及所述常用对数与1的和值;在所述和值以及0之间取较大值,将所述较大值作为所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重。在本实施例中,所述第三计算模块502通过以下方式根据所述关联信息,确定所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重包括:根据所述关联信息,获取所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻以及最大时长、所述账户id集合通过所述样本设备属性的值访问该应用或网站的最近时刻以及最大时长;计算第一最近时刻与第二最近时刻的差值,以及所述差值的常用对数,将所述常用对数与1的和值的倒数作为所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻的权重;其中,所述第一最近时刻指所述账户id集合通过所述样本设备属性的值访问该应用或网站的最近时刻,所述第二最近时刻指所述账户id通过所述样本设备属性的值访问该应用或网站的最近时刻;计算第一最大时长与第二最大时长的比值,将所述比值作为所述账户id通过所述样本设备属性的值访问该应用或网站的最大时长的权重;其中,所述第一最大时长指所述账户id通过所述样本设备属性的值访问该应用或网站的最大时长,所述第二最大时长指所述账户id集合通过所述样本设备属性的值访问该应用或网站的最大时长;计算上述最近时刻的权重以及上述最大时长的权重的乘积,将所述乘积作为所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重。在本实施例中,所述第三计算模块502通过以下方式根据所述关联信息,确定所述样本设备属性的值的反向关联权重:根据所述关联信息,获取通过所述样本设备属性的值访问该应用或网站的账户id数目;计算所述账户id集合中账户id的总数与通过所述样本设备属性的值访问该应用或网站的账户id数目的比值;计算所述比值的常用对数,将所述常用对数作为所述样本设备属性的值的反向关联权重。在一些实现方式中,所述第三计算模块502根据所述账户id通过所述样本设备属性的值访问该应用或网站的次数权重、所述账户id通过所述样本设备属性的值访问该应用或网站的时间权重以及所述样本设备属性的值的反向关联权重的乘积,确定所述账户id关联所述样本设备属性的值的权重。在一些实现方式中,所述第三确定模块501通过以下方式确定一应用或网站保存的已识别设备的样本设备属性与账户id集合之间的关联信息:按照预定周期确定该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息;和/或,确定预定时段内该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息。此外,关于上述装置的处理过程同图3所示方法所述,故于此不再赘述。实施例三本申请实施例还提供一种数据处理电子设备,用于确定用户通过一账户id访问一应用或网站所使用设备是否匹配该应用或网站保存的已识别设备,其中,根据该应用或网站保存的已识别设备的样本设备属性与包括所述账户id的账户id集合之间的关联信息,设置有所述账户id关联所述样本设备属性的值的权重,所述数据处理电子设备包括存储器以及处理器,所述存储器用于存储用于设备识别的程序,所述用于设备识别的程序用于确定用户通过一账户id访问一应用或网站所使用设备是否匹配该应用或网站保存的已识别设备,所述用于设备识别的程序在被所述处理器读取执行时,执行如下操作:确定所述账户id访问该应用或网站所使用设备的待识别设备属性的值与该应用或网站保存的已识别设备的样本设备属性的值的匹配值;根据所述匹配值以及所述账户id关联所述样本设备属性的值的权重,计算所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度;根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。本实施例还提供一种用于设备识别的权重计算的数据处理电子设备,包括:存储器以及处理器,所述存储器用于存储用于设备识别的权重计算的程序,所述用于设备识别的权重计算的程序在被所述处理器读取执行时,执行如下操作:确定一应用或网站保存的已识别设备的样本设备属性与账户id集合之间的关联信息;根据所述关联信息,计算所述账户id集合中一个或多个账户id关联所述样本设备属性的值的权重;其中,所述账户id关联所述样本设备属性的值的权重用于计算用户通过所述账户id访问该应用或网站所使用设备与该应用或网站保存的已识别设备之间的相似度,以根据所述相似度,确定所述账户id访问该应用或网站所使用设备是否匹配该应用或网站保存的已识别设备。此外,本发明实施例还提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现上述设备识别方法。此外,本发明实施例还提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令被处理器执行时实现上述用于设备识别的权重计算方法。本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,例如通过集成电路来实现其相应功能,也可以采用软件功能模块的形式实现,例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本申请不限制于任何特定形式的硬件和软件的结合。以上显示和描述了本申请的基本原理和主要特征和本申请的优点。本申请不受上述实施例的限制,上述实施例和说明书中描述的只是说明本申请的原理,在不脱离本申请精神和范围的前提下,本申请还会有各种变化和改进,这些变化和改进都落入要求保护的本申请范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1