用户行为相似性计算方法及装置的制造方法

文档序号:9506223阅读:590来源:国知局
用户行为相似性计算方法及装置的制造方法
【技术领域】
[0001]本发明实施例涉及计算机技术领域,尤其涉及一种用户行为相似性计算方法及装置。
【背景技术】
[0002]随着计算机技术的发展,用户通过个人PC或移动终端连接互联网并浏览网络信息。
[0003]用户浏览网络信息时通常会点击其感兴趣的信息,例如,用户通过个人PC浏览网页,该网页包括很多条信息,用户在浏览过程中,先看到每条信息的标题,若其对该标题感兴趣,将点击该标题,详细浏览该标题对应的内容。现有技术可以采集到大量用户的行为特征,例如浏览网页操作、点击网页操作、浏览或点击的网页信息、点击的内容信息、点击网页信息的次数、点击的时间等。
[0004]但是,现有技术中缺乏利用大量用户的行为特征分析不同用户行为的相似性的方法,导致对采集到的大量用户的行为特征的利用率较低。

【发明内容】

[0005]本发明实施例提供一种用户行为相似性计算方法及装置,以提高对采集到的大量用户的行为特征的利用率。
[0006]本发明实施例的一个方面是提供一种用户行为相似性计算方法,包括:
[0007]采集第一类用户的多个行为特征中每个行为特征对应的行为特征值,以及第二类用户的所述多个行为特征中每个行为特征对应的行为特征值;
[0008]依据所述第一类用户对应的多个行为特征值和所述第二类用户对应的多个行为特征值对所述多个行为特征进行筛选获得目标行为特征集合;
[0009]依据所述目标行为特征集合建立第一广义线性模型,利用最优化方法计算所述第一广义线性模型的第一极大似然估计值,并获得所述第一极大似然估计值对应的估计参数;
[0010]利用所述估计参数和待测用户对应的所述目标行为特征集合中每个行为特征对应的行为特征值计算所述待测用户与所述第一类用户的行为相似度。
[0011]本发明实施例的另一个方面是提供一种用户行为相似性计算装置,包括:
[0012]采集模块,用于采集第一类用户的多个行为特征中每个行为特征对应的行为特征值,以及第二类用户的所述多个行为特征中每个行为特征对应的行为特征值;
[0013]筛选模块,用于依据所述第一类用户对应的多个行为特征值和所述第二类用户对应的多个行为特征值对所述多个行为特征进行筛选获得目标行为特征集合;
[0014]建模模块,用于依据所述目标行为特征集合建立第一广义线性模型,利用最优化方法计算所述第一广义线性模型的第一极大似然估计值,并获得所述第一极大似然估计值对应的估计参数;
[0015]计算模块,用于利用所述估计参数和待测用户对应的所述目标行为特征集合中每个行为特征对应的行为特征值计算所述待测用户与所述第一类用户的行为相似度。
[0016]本发明实施例提供的用户行为相似性计算方法及装置,通过不同类型用户分别对应的多个行为特征中每个行为特征对应的行为特征值对多个行为特征进行筛选获得目标行为特征集合,依据该目标行为特征集合建立广义线性模型,利用最优化方法计算广义线性模型的极大似然估计值,并获得该极大似然估计值对应的估计参数,通过该估计参数和待测用户的行为特征值计算待测用户与特定类型用户的行为相似度,充分利用大量用户的行为特征分析不同用户行为的相似性,提高了对采集到的大量用户的行为特征的利用率。
【附图说明】
[0017]图1为本发明实施例提供的用户行为相似性计算方法流程图;
[0018]图2为本发明实施例提供的用户行为相似性计算装置的结构图;
[0019]图3为本发明另一实施例提供的用户行为相似性计算装置的结构图。
【具体实施方式】
[0020]图1为本发明实施例提供的用户行为相似性计算方法流程图。本发明实施例针对现有技术中缺乏利用大量用户的行为特征分析不同用户行为的相似性的方法,导致对采集到的大量用户的行为特征的利用率较低,提供了用户行为相似性计算方法,该方法具体步骤如下:
[0021]步骤S101、采集第一类用户的多个行为特征中每个行为特征对应的行为特征值,以及第二类用户的所述多个行为特征中每个行为特征对应的行为特征值;
[0022]本发明实施例依据预先设定的多个行为特征在用户浏览点击网页信息的过程中采集用户的行为特征,例如,多个行为特征具体包括:是否浏览某网页、是否点击某网页中的标题、用户浏览某网页的时间、点击某标题的时间、点击的标题内容、一天内点击某标题的次数等,本发明实施例并不限定预先设定的多个行为特征的个数为6个,可以是任意多个。另外,本发明实施例预先对多个行为特征中的每一个行为特征进行数字标识,例如用户浏览了某网页记为1,用户没有浏览某网页记为0 ;用户点击了某网页中的标题记为1,用户没有点击某网页中的标题记为0 ;用户浏览某网页的时间在早上记为1,中午记为2,下午记为3,晚上记为4 ;点击某标题的时间在早上记为1,中午记为2,下午记为3,晚上记为4 ;点击的标题内容属于健康饮食记为1,休闲娱乐记为2,金融投资记为3,科技信息记为4等;一天内点击某标题的次数可根据实际点击的某标题内容的次数定义。例如,用户浏览了某网页,点击了某网页中的标题,用户浏览某网页的时间在早上,点击某标题的时间在中午,点击的标题内容属于健康饮食,一天内点击某标题的次数为3,则用户端的浏览器采集该用户的多个行为特征中每个行为特征对应的行为特征值分别为1、1、1、2、1、3,该用户的多个行为特征中每个行为特征对应的行为特征值可构成一个行为特征向量[1、1、1、2、1、3]。
[0023]所述第一类用户为符合第一目标行为特征的用户,所述第二类用户为符合第二目标行为特征的用户,所述第一目标行为特征和所述第二目标行为特征具有部分相同的行为特征。
[0024]本发明实施例分别采集第一类用户和第二类用户的多个行为特征中每个行为特征对应的行为特征值,第一类用户具体为种子用户,第二类用户具体为对照用户,种子用户和对照用户的部分行为特征相同,部分行为特征不同,例如,种子用户为浏览了某品牌牛奶广告并点击了该广告的用户,对照用户为浏览了某品牌牛奶广告但没有点击该广告的用户,且第一类用户的标识号为1,第二类用户的标识号为0。例如,本发明实施例采集100个第一类用户和100个第二类用户分别对应的多个行为特征中每个行为特征对应的行为特征值,即100个第一类用户对应有100个行为特征向量,100个第二类用户对应有100个行为特征向量。
[0025]步骤S102、依据所述第一类用户对应的多个行为特征值和所述第二类用户对应的多个行为特征值对所述多个行为特征进行筛选获得目标行为特征集合;
[0026]由于预先设定的多个行为特征的个数可以是任意多个,但是在该多个行为特征中某些行为特征对于本发明实施例提供的用户行为相似性计算方法而言是冗余的,所以需要对多个行为特征进行筛选获得目标行为特征集合。
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1