目标用户定向方法及装置的制造方法

文档序号:9688190阅读:254来源:国知局
目标用户定向方法及装置的制造方法
【技术领域】
[0001]本发明涉及信息技术领域,尤其涉及一种目标用户定向方法及装置。
【背景技术】
[0002]随着信息技术的发展,在信息推送领域确定出信息推送的目标用户以提升信息推送的效率是现有技术中一直致力解决的问题。所述信息推送包括广告推送,向用户推荐的视频、音频以及图文信息等。这个时候为了减少用户对信息推送的反感,提升用户使用满意度及推送信息的传达和转换效率,通常需要选择可能对推送信息感兴趣的用户,就出现了定位目标用户。在现有技术中提供了以下几种定位目标用户的方法:
[0003]第一种:将一段时间内转化用户作为种子用户,作为正样本用户;将未转化的用户作为负样本用户;然后对用户查询行为,网页浏览行为及社交数据等用户特征进行抽取,根据抽取的用户行为得到转化模型;利用该转换模型对所有用户进行预估,确定是否为该广告的受众。
[0004]第二种:利用发生过转换行为的用户作为正样本用户,其他用户作为负样本用户得到一个初选模型;该模型主要关注用户方位过广告的网页的这一特征。还会利用精选模型来定位目标用户,在精选模型中不仅会关注用户是否访问过对应的网站,还会关注用户更多的属性标签。这里的属性标签可包括分类标签,包括用户关注的与广告网站关联的特征等。结合初选模型和精选模型来定位目标用户。
[0005]第三种:首先利用用户注册、行为、社交等数据抽取用户特征,并建立倒排索引,索引项是特征,索引值是用户,定期更新;然后广告主给定种子用户号码包之后,在抽取的用户特征基础上,基于互信息等特征选择方法筛选出相关性较高的特征子集;最后使用相关性高的特征子集构造检索查询相似用户,类似搜索引擎检索相似文档的过程。广告主根据扩展的相似用户做画像分析,决定是否使用该功能。除了提供在线检索扩展相似用户之外,还提供了离线挖掘模型,同样的,在给定种子用户号码包高相关性特征基础上,对用户做局部敏感哈希聚类,通过计算海明距离挖掘相似用户。
[0006]虽然上述方法实现了目标用户的定位,但是目标用户定位的精确度依然很低,采用上述方法定位目标用户之后存在将非目标用户错误的认定为了目标用户或遗漏真正的目标用户。

【发明内容】

[0007]有鉴于此,本发明实施例期望提供一种目标用户定位方法及装置,至少部分解决目标用户定位不够精确的问题。
[0008]为达到上述目的,本发明的技术方案是这样实现的:
[0009]本发明实施例第一方面提供一种目标用户定向方法,所述方法包括:
[0010]基于种子用户的用户特征,生成虚拟用户;
[0011 ]将所述种子用户和所述虚拟用户共同作为正样本用户;
[0012]确定负样本用户;
[0013]分别抽取所述正样本用户和所述负样本用户的用户特征;
[0014]基于所述正样本用户和所述负样本用户的用户特征进行训练,确定出定向参数;
[0015]基于所述定向参数,定位出与所述种子用户满足预定相似度条件的目标用户。
[0016]基于上述方案,所述基于种子用户的用户特征,生成虚拟用户,包括:
[0017]确定所述种子用户在特征空间的第一位置;
[0018]基于至少两个所述第一位置确定第二位置;
[0019]基于所述第二位置确定所述虚拟用户的用户特征并生成虚拟用户。
[0020]基于上述方案,所述基于种子用户的用户特征,生成虚拟用户,包括:
[0021]提取所述种子用户的用户特征中的数值用户特征;
[0022]基于所述数值用户特征,确定数值用户特征的可选范围;
[0023]从所述可选范围选出一个数值作为所述虚拟用户的数值用户特征;
[0024]提取所述种子用户的用户特征中的非数值用户特征,并对所述非数值用户特征赋予概率值;
[0025]基于所述概率值确定所述虚拟用户的非数值用户特征。
[0026]基于上述方案,所述确定负样本用户,包括:
[0027]基于所述种子用户的用户特征,计算备选样本用户与所述种子用户的相似度;
[0028]基于所述相似度,确定满足负样本用户条件的所述备选样本用户,作为所述样本用户中的负样本用户。
[0029]基于上述方案,所述基于所述正样本用户和所述负样本用户的用户特征进行训练,确定出定向参数,包括:
[0030]利用所述正样本用户和所述负样本用户的用户特征进行模型训练,确定出选择目标用户的分类模型。
[0031]基于上述方案,所述利用所述样本用户的用户特征进行模型训练,确定出选择目标用户的训练模型,包括:
[0032]将所述正样本用户和负样本用户均分为训练集、验证集和测试集;
[0033]利用所述训练集,采用不同的训练算法进行模型训练;
[0034]利用所述验证集验证对所述模型训练是否需要继续;
[0035]在停止所述模型训练后,利用所述测试集对各所述训练算法得到的备选模型进行效果评估;
[0036]基于所述效果评估,选择出一个所述备选模型作为所述分类模型。
[0037]本发明实施例第二方面提供一种目标用户定向装置,所述装置包括:
[0038]生成单元,用于基于种子用户的用户特征,生成虚拟用户;
[0039]第一确定单元,用于将所述种子用户和所述虚拟用户共同作为正样本用户;
[0040]第二确定单元,用于确定负样本用户;
[0041]训练单元,用于分别抽取所述正样本用户和所述负样本用户的用户特征;
[0042]定位单元,用于基于所述定向参数,定位出与所述种子用户满足预定相似度条件的目标用户。
[0043]基于上述方案,所述生成单元,用于确定所述种子用户在特征空间的第一位置;基于至少两个所述第一位置确定第二位置;基于所述第二位置确定所述虚拟用户的用户特征并生成虚拟用户。
[0044]基于上述方案,所述生成单元,具体用于提取所述种子用户的用户特征中的数值用户特征;基于所述数值用户特征,确定数值用户特征的可选范围;从所述可选范围选出一个数值作为所述虚拟用户的数值用户特征;提取所述种子用户的用户特征中的非数值用户特征,并对所述非数值用户特征赋予概率值;基于所述概率值确定所述虚拟用户的非数值用户特征。
[0045]基于上述方案,所述第二确定单元,具体用于基于所述种子用户的用户特征,计算备选样本用户与所述种子用户的相似度;基于所述相似度,确定满足负样本用户条件的所述备选样本用户,作为所述样本用户中的负样本用户。
[0046]基于上述方案,所述训练单元,具体用于利用所述正样本用户和所述负样本用户的用户特征进行模型训练,确定出选择目标用户的分类模型。
[0047]基于上述方案,所述训练单元,具体用于将所述正样本用户和负样本用户均分为训练集、验证集和测试集;利用所述训练集,采用不同的训练算法进行模型训练;利用所述验证集验证对所述模型训练是否需要继续;在停止所述模型训练后,利用所述测试集对各所述训练算法得到的备选模型进行效果评估;基于所述效果评估,选择出一个所述备选模型作为所述分类模型。
[0048]本发明实施例所述目标用户定位方法及装置,首先将基于种子用户的用户特征生成虚拟用户,将种子用户和虚拟用户共同作为正样本用户,显然增加正样本用户的数量,显然可以缓解因正样本用户数量少而负样本数量多,导致的训练数据不平衡为题,进而可以缓解因数据不平衡导致训练得到的定向参数的鉴别能够不够强,及目标用户定位精确度低的现象。
【附图说明】
[0049]图1为本发明实施例提供的第一种目标用户定向方法的流程示意图;
[0050]图2为本发明实施例提供的确定正样本用户的流程示意图;
[0051 ]图3为本发明实施例提供的第一种虚拟用户的生成示意图;
[0052]图4为本发明实施例提供的第二种虚拟用户的生成示意图;
[0053]图5A为本发明实施例提供的第一种确定负样本用户的流程示意图;
[0054]图5B为本发明实施例提供的第二种确定负样本用户的流程示意图;
[0055]图6为本发明实施例提供的定向参数的确定方法流程示意图;
[0056]图7为本发明实施例提供的第二种目标用户定向方法的流程示意图;
[0057]图8为本发明实施例提供的一种目标用户定向装置的结构示意图;
[0058]图9为本发明实施例提供的另一种目标用户定向装置的结构示意图。
【具体实施方式】
[0059]以下结合说明书附图及具体实施例对本发明的技术方案做进一步的详细阐述。
[0060]实施例一:
[0061]如图1所示,本实施例提供一种目标用户定向方法,所述方法包括:
[0062]步骤S110:基于种子用户的用户特征,生成虚拟用户;
[0063]步骤S120:将所述种子用户和所述虚拟用户共同作为正样本用户;
[0064]步骤S130:确定负样本用户;
[0065]步骤S140:分别抽取所述正样本用户和所述负样本用户的用户特征;
[0066]步骤S150:基于所述定向参数,定位出与所述种子用户满足预定相
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1