识别智能设备用户的方法和装置的制造方法

文档序号:9810527阅读:377来源:国知局
识别智能设备用户的方法和装置的制造方法
【技术领域】
[0001]本申请涉及数据处理技术领域,尤其涉及一种识别智能设备用户的方法和装置。
【背景技术】
[0002]用户可以通过客户端设备进行网络通信,客户端设备可以包括非智能设备和智能设备,非智能设备例如个人电脑(Personal Computer, PC),智能设备例如智能手机或者平板电脑等。由于业务需要,一些情况下需要识别用户是智能设备用户还是非智能设备用户,以便进行相应的业务引导,例如,对于智能设备用户,可以引导用户进行话费充值或者进行短信营销等。
[0003]相关技术中,识别智能设备用户的方式主要是基于已有的包含智能设备型号的用户访问日志,根据用户访问日志中记录的智能设备型号识别出智能设备用户。
[0004]但是,当智能设备用户没有采用智能设备进行网络访问时,在用户访问日志中不会记录智能设备信息,此时采用上述的方式不能识别出智能设备用户,导致上述方式的识别效果不理想。

【发明内容】

[0005]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本申请的一个目的在于提出一种识别智能设备用户的方法,该方法能够提高智能设备用户的识别效果。
[0007]本申请的另一个目的在于提出一种识别智能设备用户装置。
[0008]为达到上述目的,本申请第一方面实施例提出的识别智能设备用户的方法,包括:对用户的网络行为数据进行提取,确定所述网络行为数据中的特征变量;获取第一变量值和第二变量值,所述第一变量值包括待检测的设备用户的所述特征变量的变量值,所述第二变量值包括预先确定的正样本的所述特征变量的变量值;计算所述第一变量值与所述第二变量值之间的距离信息;根据所述距离信息,识别智能设备用户。
[0009]本申请第一方面实施例提出的识别智能设备用户的方法,通过对用户的网络行为数据进行提取,确定网络行为数据中的特征变量,计算待检测的设备用户的特征变量的变量值,与预先确定的正样本的特征变量的变量值之间的距离信息,根据该距离信息,识别智能设备用户,可以实现基于用户的网络行为数据的智能设备用户识别,由于本实施例不依赖用户访问日志中的智能设备信息,因此,当用户访问日志中没有智能设备信息时,依然可以识别出智能设备用户,从而提高识别效果。
[0010]为达到上述目的,本申请第二方面实施例提出的识别智能设备用户的装置,包括:确定模块,用于对用户的网络行为数据进行提取,确定所述网络行为数据中的特征变量;获取模块,用于获取第一变量值和第二变量值,所述第一变量值包括待检测的设备用户的所述特征变量的变量值,所述第二变量值包括预先确定的正样本的所述特征变量的变量值;计算模块,用于计算所述第一变量值与所述第二变量值之间的距离信息;识别模块,用于根据所述距离信息,识别智能设备用户。
[0011]本申请第二方面实施例提出的识别智能设备用户的装置,通过对用户的网络行为数据进行提取,确定网络行为数据中的特征变量,计算待检测的设备用户的特征变量的变量值,与预先确定的正样本的特征变量的变量值之间的距离信息,根据该距离信息,识别智能设备用户,可以实现基于用户的网络行为数据的智能设备用户识别,由于本实施例不依赖用户访问日志中的智能设备信息,因此,当用户访问日志中没有智能设备信息时,依然可以识别出智能设备用户,从而提高识别效果。
[0012]本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
【附图说明】
[0013]本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0014]图1是本申请一实施例提出的识别智能设备用户的方法的流程示意图;
[0015]图2是本申请另一实施例提出的识别智能设备用户的方法的流程示意图;
[0016]图3是本申请另一实施例提出的识别智能设备用户的装置的结构示意图;
[0017]图4是本申请另一实施例提出的识别智能设备用户的装置的结构示意图。
【具体实施方式】
[0018]下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0019]图1是本申请一实施例提出的识别智能设备用户的方法的流程示意图,该方法包括:
[0020]Sll:对用户的网络行为数据进行提取,确定所述网络行为数据中的特征变量。
[0021]其中,用户的网络行为数据包括:网站登录时的数据,例如,登录时间,登录地点等;访问记录数据,例如,用户浏览的商品信息等;充值数据;支付行为数据;交易数据;提现数据;注册手机号、购物行为数据等中的一项或者多项。
[0022]特征变量是从用户的网络行为数据中提取出的预设个数的变量,是正样本和负样本差异较大的变量。
[0023]具体的,所述对用户的网络行为数据进行提取,确定所述网络行为数据中的特征变量,包括:
[0024]选取所述正样本和负样本,并获取所述正样本的网络行为数据和所述负样本的网络行为数据,所述正样本是已知的智能设备用户,所述负样本是已知的非智能设备用户;
[0025]对所述正样本的网络行为数据和所述负样本的网络行为数据进行差异化计算,获取所述网络行为数据中每个变量的差异化得分;
[0026]根据所述差异化得分,确定特征变量。
[0027]其中,特征变量是正样本和负样本具有较大差异的变量,例如,可以按照差异化得分从大到小的顺序对变量进行排序,在排序后变量中依次选择预设个数的变量作为特征变量。
[0028]S12:获取第一变量值和第二变量值,所述第一变量值包括待检测的设备用户的所述特征变量的变量值,所述第二变量值包括预先确定的正样本的所述特征变量的变量值。
[0029]其中,从待检测的设备用户的用户访问日志中可以获取第一变量值;
[0030]从正样本的用户访问日志中可以获取第二变量值。
[0031]具体的,对于正样本,第二变量值可以是从确定正样本时采用的用户访问日志中获取的,例如,根据2012年初至2013年底确定出正样本,之后可以根据正样本在2012年初至2013年底的用户访问日志中获取第二变量值,例如获取登录时间的登录值等。当然,可以理解的是,由于智能设备或非智能设备在不同的时间段会具有一致的访问行为,因此也可以根据其他时间段的用户访问日志获取,例如,也可以从已经存在的2014年的用户访问日志中获取,例如,智能手机在2012年初至2013年底的登录时间通常是早上,那么该智能手机在2014年的登录时间依然通常会是在早上。
[0032]预先确定的正样本是指从已知的智能设备用户中选取的预设个数的智能设备用户,已知的智能设备用户可以是预设时间段内的智能设备用户,选取时可以随机选择。具体的,可以根据服务端预先获取的历史数据,确定智能设备用户和非智能设备用户,从所述智能设备用户中随机选取预设个数的用户确定为正样本,从所述非智能设备用户中随机选择所述预设个数的用户确定为负样本。
[0033]以智能设备是智能手机为例,例如,根据用户访问日志,可以筛选出2012年初至2013年底有过智能手机访问记录的用户,这些用户是已知的智能设备用户,之后可以从这些已知的智能设备用户中随机挑取50万个用户作为正样本。
[0034]根据用户访问日志,可以筛选出2013年底之前没有过智能手机访问记录的用户,而2013年底之后有过智能手机访问记录的用户,这些用户在2013年底之间可以看作非智能设备用户,之后可以从这些非智能设备用户中随机选取50万个用户作为负样本。
[0035]S1
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1