一种Cookie标识关联方法及装置的制造方法

文档序号:9687609阅读:264来源:国知局
一种Cookie标识关联方法及装置的制造方法
【技术领域】
[0001] 本发明设及互联网领域,尤其设及一种Cookie标识关联方法及装置。
【背景技术】
[0002] 在互联网上用户行为定向应用中,最核屯、的技术就是对访客进行标记。目前常用 的标记方法是用Js Cookie。当用户再次访问网站时,网站可W通过Cookie中存储的信息对 用户进行标定和识别。
[0003] 但是,有时对应于同一用户的Cookie会W几个文件的形式保存,导致基于Cookie 的用户行为分析不够准确,故需要在对应同一用户的Cookie之间建立准确度较高关联关 系。

【发明内容】

[0004] 本发明解决的技术问题是在对应同一用户的Cookie之间建立准确度较高的关联 关系。
[0005] 为解决上述技术问题,本发明实施例提供一种Cookie标识关联方法,包括:
[0006] 基于上网行为数据确定候选Cookie标识组;所述上网行为数据包括:Cookie标识、 网络行为信息W及时间戳;
[0007] 生成所述候选Cookie标识组的特征信息;所述特征信息表征所述候选Cookie标识 组中Cooki e标识的关联程度;
[000引参照分类模型,在所述候选Cookie标识组中选取目标Cookie标识组;所述分类模 型包括:正确关联的Cookie标识组样本和错误关联的Cookie标识组样本;所述正确关联的 Cookie标识组样本和错误关联的Cookie标识组样本均包括所述特征信息;
[0009] 记录所述目标Cookie标识组的关联关系,W关联对应的Cookie。
[0010] 可选的,所述的Cookie标识关联方法还包括:对所述上网行为数据进行标准化处 理,W统一所述上网行为数据的格式。
[0011] 可选的,所述网络行为信息包括网络识别标识,所述确定候选Cookie标识组包括: 在对应于同一网络识别标识的Cooki e标识中选取候选Cooki e标识组。
[0012] 可选的,所述确定候选Cookie标识组还包括:确定所述对应于同一网络识别标识 的Cookie标识的数目小于阔值。
[0013] 可选的,所述生成所述候选Cookie标识组的特征信息包括生成W下至少一种:用 户识别标识信息、相同网站浏览信息、网站相似度信息、网络行为时间信息;其中:
[0014] 生成所述用户识别标识信息包括:获取所述Cookie标识组中每个Cookie标识分别 对应的用户识别标识;判断所述每个Cookie标识分别对应的用户识别标识中是否包含同样 的用户识别标识;基于所述判断结果确定所述用户识别标识信息的特征数值;
[0015] 生成所述相同网站浏览信息包括:计算所述Cookie标识组中的各Cookie标识与相 同网站间具有对应关系的概率;生成所述相同网站浏览信息的特征数值;
[0016] 生成所述浏览网站相似度信息包括:对与所述Cookie标识组中的各Cookie标识建 立过对应关系的网站进行类型相似度计算;生成所述浏览网站相似度信息的特征数值;
[0017] 生成所述网络行为时间信息包括:计算所述Cooki e标识组中Cooki e标识对应的网 络行为出现在同一时间段内的次数和频率;生成所述网络行为事件信息的特征数值。
[0018] 可选的,所述正确关联的Cookie标识组样本通过如下方式生成:
[0019] 选取对应于同一用户的第一 Cookie标识;
[0020] 改变所述第一 Cookie标识为第二Cookie标识;
[0021] 所述第一 Cookie标识和所述第二Cookie标识组成的Cookie标识组作为正确关联 的Cookie标识组;
[0022] 参照所述第一 Cookie标识对应的上网行为数据和所述第二Cookie标识对应的上 网行为数据,生成所述正确关联的Cookie标识组的特征信息;
[0023] 所述正确关联的Cookie标识组样本包括所述正确关联的Cookie标识组的特征信 息和所述正确关联的标识值。
[0024] 可选的,所述错误关联的Cookie标识组样本通过如下方式生成:
[0025] 选取对应于不同用户的第^Cookie标识和第四Cookie标识;
[00%] 所述第SCookie标识和所述第四Cookie标识组成的Cookie标识组作为错误关联 的Cookie标识组;
[0027] 参照所述第SCookie标识对应的上网行为数据和所述第四Cookie标识对应的上 网行为数据,生成作所述错误关联的Cookie标识组的特征信息;
[00%]所述错误关联的Cookie标识组样本包括所述错误关联的Cookie标识组的特征信 息和所述错误关联的标识值。
[00巧]可选的,所述参照分类模型,在所述候选Cookie标识组中选取目标Cookie标识组 包括:
[0030] 参照所述正确关联的Cookie标识组样本和错误关联的Cookie标识组样本,分别计 算对应所述正确关联的Cookie标识组样本和错误关联的Cookie标识组样本中包含的各个 特征信息的权重值;
[0031] 参照所述各个特征信息的权重值和所述候选Cookie标识组的特征信息,构造预测 函数;
[0032] 参照所述预测函数的函数值,在所述候选Cooki e标识组中选取目标Cooki e标识 组。
[0033] 本发明实施例还提供一种Cookie标识关联装置,包括:候选Cookie标识组选取单 元、特征信息生成单元、目标Cookie标识组确定单元W及关联单元;
[0034] 所述候选Cookie标识组选取单元,适于基于上网行为数据确定候选Cookie标识 组;所述上网行为数据包括:Cookie标识、网络行为信息W及时间戳;
[0035] 所述特征信息生成单元,适于生成所述候选Cookie标识组的特征信息;所述特征 信息表征所述候选Cooki e标识组中Cooki e标识的关联程度;
[0036] 所述目标Cookie标识组确定单元,适于参照分类模型,在所述候选Cookie标识组 中选取目标Cookie标识组;所述分类模型包括:正确关联的Cookie标识组样本和错误关联 的Cookie标识组样本;所述正确关联的Cookie标识组样本和错误关联的Cookie标识组样本 均包括所述特征信息;
[0037] 所述关联单元,适于记录所述目标Cookie标识组的关联关系,W关联对应的 Cookie。
[0038] 可选的,所述的Cookie标识关联装置还包括:标准化处理单元,适于对所述上网行 为数据进行标准化处理,W统一所述上网行为数据的格式。
[0039] 可选的,所述网络行为信息包括网络识别标识,所述确定候选Cookie标识组包括: 在对应于同一网络识别标识的Cooki e标识中选取候选Cooki e标识组。
[0040] 可选的,所述的Cookie标识关联装置还包括:数目判断单元,适于确定所述对应于 同一网络识别标识的Cookie标识的数目小于阔值。
[0041 ] 可选的,所述特征信息生成单元,适于生成W下至少一种Cookie标识组的特征信 息:用户识别标识信息、相同网站浏览信息、网站相似度信息、网络行为时间信息;其中:
[0042] 生成所述用户识别标识信息包括:获取所述Cookie标识组中每个Cookie标识分别 对应的用户识别标识;判断所述每个Cookie标识分别对应的用户识别标识中是否包含同样 的用户识别标识;基于所述判断结果确定所述用户识别标识信息的特征数值;
[0043] 生成所述相同网站浏览信息包括:计算所述Cookie标识组中的各Cookie标识与相 同网站间具有对应关系的概率;生成所述相同网站浏览信息的特征数值;
[0044] 生成所述浏览网站相似度信息包括:对与所述Cookie标识组中的各Cookie标识建 立过对应关系的网站进行类型相似度计算;生成所述浏览网站相似度信息的特征数值;
[0045] 生成所述网络行为时间信息包括:计算所述Cookie标识组中的各Cookie标识对应 的网络行为出现在同一时间段内的次数和频率;生成所述网络行为事件信息的特征数值。
[0046] 可选的,所述正确关联的Cookie标识组样本通过如下方式生成:
[0047] 选取对应于同一用户的第一Cookie标识;
[004引改变所述第一 Cookie标识为第二Cookie标识;
[0049] 所述第一 Cookie标识和所述第二Cookie标识组成的Cookie标识组作为正确关联 的Cookie标识组;
[0050] 参照所述第一 Cookie标识对应的上网行为数据和所述第二Cookie标识对应的上 网行为数据,生成所述正确关联的Cookie标识组的特征信息;
[0化1] 所述正确关联的Cookie标识组样本包括所述正确关联的Cookie标识组的特征信 息和所述正确关联的标识值。
[0052] 可选的,所述错误关联的Cookie标识组样本通过如下方式生成:
[0053] 选取对应于不同用户的第^Cookie标识和第四Cookie标识;
[0化4] 所述第SCookie标识和所述第四Cookie标识组成的Cookie标识组作为错误关联 的Cookie标识组;
[0055] 参照所述第SCookie标识对应的上网行为数
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1