用户识别方法和装置的制造方法_4

文档序号:9551336阅读:来源:国知局
。驱动器510也根据需要连接至I/O接口 505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
[0080]特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
[0081]特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0082]描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、提取模块和识别模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,获取模块还可以被描述为“用于获取多组用户行为数据的模块”。
[0083]作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:获取多组用户行为数据;将任意两组所述用户行为数据共同作为样本集合中的一个训练样本;使用所述样本集合进行模型训练,并通过训练后的模型确定两组待识别的用户行为数据是否对应于同一用户。
[0084]以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
【主权项】
1.一种用户识别方法,其特征在于,所述方法包括: 获取多组用户行为数据; 将任意两组所述用户行为数据共同作为样本集合中的一个训练样本; 使用所述样本集合进行模型训练,并通过训练后的模型确定两组待识别的用户行为数据是否对应于同一用户。2.根据权利要求1所述的用户识别方法,其特征在于,所述将任意两组所述用户行为数据共同作为样本集合中的一个训练样本,包括: 将任意两组所述用户行为数据中相应特征之间的相似度值,作为所述训练样本的特征值。3.根据权利要求2所述的用户识别方法,其特征在于,一组所述用户行为数据包括以下至少一个特征: 用户地址、访问时间、访问地址、搜索词和终端标识。4.根据权利要求3所述的用户识别方法,其特征在于,还包括: 判断所述任意两组所述用户行为数据是否具有相同的终端标识; 若是,将所述训练样本确定为正例训练样本,否则,将所述训练样本确定为负例训练样本。5.根据权利要求3所述的用户识别方法,其特征在于,所述任意两组所述用户行为数据包括: 具有相同用户地址的两组所述用户行为数据。6.根据权利要求2所述的用户识别方法,其特征在于,还包括: 确定每组所述用户行为数据对应的用户标识; 判断所述任意两组所述用户行为数据是否对应同一所述用户标识; 若是,将所述训练样本确定为正例训练样本,否则,将所述训练样本确定为负例训练样本。7.根据权利要求1至6任一项所述的用户识别方法,其特征在于,还包括: 若通过所述训练后的模型确定出所述两组待识别的用户行为数据对应于同一用户,则将所述两组待识别的用户行为数据对应的两个用户标识均确定为该用户的用户标识。8.一种用户识别装置,其特征在于,所述装置包括: 获取模块,用于获取多组用户行为数据; 提取模块,用于将任意两组所述用户行为数据共同作为样本集合中的一个训练样本;识别模块,用于使用所述样本集合进行模型训练,并通过训练后的模型确定两组待识别的用户行为数据是否对应于同一用户。9.根据权利要求8所述的用户识别装置,其特征在于,所述提取模块进一步用于: 将任意两组所述用户行为数据中相应特征之间的相似度值,作为所述训练样本的特征值。10.根据权利要求9所述的用户识别装置,其特征在于,一组所述用户行为数据包括以下至少一个特征: 用户地址、访问时间、访问地址、搜索词和终端标识。11.根据权利要求10所述的用户识别装置,其特征在于,还包括: 第一判断模块,用于判断所述任意两组所述用户行为数据是否具有相同的终端标识;所述提取模块进一步用于:若是,将所述训练样本确定为正例训练样本,否则,将所述训练样本确定为负例训练样本。12.根据权利要求10所述的用户识别装置,其特征在于,所述任意两组所述用户行为数据包括: 具有相同用户地址的两组所述用户行为数据。13.根据权利要求9所述的用户识别装置,其特征在于,还包括: 确定模块,用于确定每组所述用户行为数据对应的用户标识; 第二判断模块,用于判断所述任意两组所述用户行为数据是否对应同一所述用户标识; 所述提取模块进一步用于:若是,将所述训练样本作为正例训练样本,否则,将所述训练样本作为负例训练样本。14.根据权利要求8至13任一项所述的用户识别装置,其特征在于,还包括: 标识确定模块,用于若通过所述训练后的模型确定出所述两组待识别的用户行为数据对应于同一用户,则将所述两组待识别的用户行为数据对应的两个用户标识均确定为该用户的用户标识。
【专利摘要】本申请公开了用户识别方法和装置。所述方法的一【具体实施方式】包括:获取多组用户行为数据;将任意两组用户行为数据共同作为样本集合中的一个训练样本;使用样本集合进行模型训练,并通过训练后的模型确定两组待识别的用户行为数据是否对应于同一用户。该实施方式实现了准确的用户识别。
【IPC分类】H04L29/06
【公开号】CN105306495
【申请号】CN201510857389
【发明人】黄跃峰, 顾立瑞
【申请人】百度在线网络技术(北京)有限公司
【公开日】2016年2月3日
【申请日】2015年11月30日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1