目标用户定向方法及装置与流程

文档序号：12916271阅读：372来源：国知局

本发明涉及信息技术领域，尤其涉及一种目标用户定向方法及装置。

背景技术：

广告等待投放信息在投放时，为了实现精准投放，可能需要进行用户定向，找出会观看该投放信息或基于该投放信息执行某一操作的用户；一方面能够实现精准投放，另一方面能够减少对该投放信息不感兴趣的用户的信息骚扰。

在现有技术中进行用户定向时，通常采用的方式是：根据种子用户的属性特征得到一个分类模型。在进行用户定向，利用该分类模型计算备选用户与种子用户之间的相似性，选择出与种子用户相似性高的用户，作为所述待投放信息的投放对象，进而实现了用户定向。但是，具体实践时发现，利用这种目标用户定向方法确定的投放对象，依然不能有效的实现用户转换，定向的精确度依然没有达到预期的效果。

技术实现要素：

有鉴于此，本发明实施例期望提供的目标用户定向方法及装置，能够提升待投放信息的目标用户的精确度。

为达到上述目的，本发明的技术方案是这样实现的：

本发明实施例第一方面提供一种目标用户定向方法，包括：

利用相似模型，确定备选用户与种子用户之间的相似度；

利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

基于上述方案，所述根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户，包括：

利用所述相似度、所述概率及预设函数关系、计算所述备选用户的定向评分；

选择出所述定向评分满足预设定向条件的所述备选用户，作为所述目标用户。

基于上述方案，所述利用所述相似度、所述概率及预设函数关系、计算所述备选用户的定向评分，包括：

确定所述相似度的第一权值及所述概率对应的第二权值；

利用所述相似度、所述第一权值、所述概率、所述第二权值及所述预设函数关系，计算所述定向评分。

基于上述方案，在确定所述相似度之前，所述方法还包括：

提取作为第一正例用户的所述种子用户的用户特征，作为训练所述相似模型的正例特征；

提取第一负例用户的用户特征，作为训练所述相似模型的负例特征；

利用所述正例特征和所述负例特征进行模型训练，得到所述相似模型。

基于上述方案，在确定所述概率之前，所述方法还包括：

根据已投放信息的投放数据，提取对所述已投放信息执行了所述转化操作的用户作为第二正例用户；

从已投放信息的投放数据，提取所述已投放信息未执行所述转化操作的用户作为第二负例用户；

利用所述已投放信息的信息特征、所述第二正例用户和所述第二负例用户的用户特征作进行模型训练，得到所述转化预测模型。

基于上述方案，所述方法还包括：

利用所述相似模型输出确定所述相似度的核心特征；其中，所述核心特征为所述种子用户之间的相同特征或相似特征。

基于上述方案，所述利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率，包括：

提取所述待投放信息的信息特征；

提取所述备选用户的用户特征；

将所述待投放信息的信息特征和所述备选用户的用户特征，输入所述转化预测模型，预测得到所述概率。

本发明实施例第二方面提供一种目标用户定向装置，包括：

确定单元，用于利用相似模型，确定备选用户与种子用户之间的相似度；

预测单元，用于利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

选择单元，用于根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

基于上述方案，所述选择单元，具体用于利用所述相似度、所述概率及预设函数关系、计算所述备选用户的定向评分；选择出所述定向评分满足预设定向条件的所述备选用户，作为所述目标用户。

基于上述方案，所述选择单元，具体用于确定所述相似度的第一权值及所述概率对应的第二权值；利用所述相似度、所述第一权值、所述概率、所述第二权值及所述预设函数关系，计算所述定向评分。

基于上述方案，所述装置还包括：

第一训练单元，用于在确定所述相似度之前，

提取作为第一正例用户的所述种子用户的用户特征，作为训练所述相似模型的正例特征；提取第一负例用户的用户特征，作为训练所述相似模型的负例特征；利用所述正例特征和所述负例特征进行模型训练，得到所述相似模型。

基于上述方案，所述装置还包括：

第二训练单元，用于在确定所述概率之前，根据已投放信息的投放数据，提取对所述已投放信息执行了所述转化操作的用户作为第二正例用户；从已投放信息的投放数据，提取所述已投放信息未执行所述转化操作的用户作为第二负例用户；利用所述已投放信息的信息特征、所述第二正例用户和所述第二负例用户的用户特征作进行模型训练，得到所述转化预测模型。

基于上述方案，所述装置还包括：

输出单元，用于利用所述相似模型输出确定所述相似度的核心特征；其中，所述核心特征为所述种子用户之间的相同特征或相似特征。

基于上述方案，所述预测单元，具体用于提取所述待投放信息的信息特征；提取所述备选用户的用户特征；将所述待投放信息的信息特征和所述备选用户的用户特征，输入所述转化预测模型，预测得到所述概率。

本发明实施例提供的目标用户定向方法及装置，在为待投放信息确定目标用户时，会结合备选用户与种子用户的相似度和利用转化预测模型预测出备选用户对所述待投放信息执行预定转化操作的概率，至少从这两维度从众多的备选用户中选择出作为所述待投放信息的投放对象的目标用户，相对于仅仅选择出与种子用户相似的用户作为目标用户，因为引入了转化预测模型估算的概率，提升了目标用户的精确度，此外信息投放后的被执行所述预定转化操作的概率提升，提升了投放效果。

附图说明

图1为本发明实施例提供的一种目标用户定向方法的流程示意图；

图2为本发明实施例提供的一种目标用户定向装置的结构示意图；

图3为本发明实施例提供的一种广告发布系统架构的结构示意图；

图4为本发明实施例提供相似模型的训练流程示意图；

图5为本发明实施例提供的点击预测模型的训练流程示意图；

图6为本发明实施例提供的定向评分的计算流程示意图；

图7为本发明实施例提供的一种目标定向装置。

具体实施方式

以下结合说明书附图及具体实施例对本发明的技术方案做进一步的详细阐述。

实施例一：

如图1所示，本实施例提供一种目标用户定向方法，包括：

步骤s110：利用相似模型，确定备选用户与种子用户之间的相似度；

步骤s120：利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

步骤s130：根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

本实施例中所述步骤s110利用相似模型，确定备选用户与种子用户之间的相似度，这里的相似度可以用0到1的取值来表示，或用百分比来表示。在本实施例中所述种子用户可为所述待投放信息提供的对所述待投放信息的信息标的物感兴趣的用户，或已经使用该标的物的用户。例如，所述待投放信息为某品牌手机的广告，所述种子用户可为购买了该品牌手机的用户。该品牌的手机即为所述广告的信息标的物，广告的信息标的物，又可称为广告标的物。例如，所述待投放信息第一次投放，待投放信息中的信息标的物也没有上市，则此时，所述种子用户可为与所述待投放信息满足预设相似度的已投放信息的种子用户。再以手机为例，待投放信息的信息标的物为手机a，手机a的特性与已投放信息的信息标的物手机b非常相似，这个时候显然已投放信息的种子用户可能大部分也将是待投放信息的种子用户。当然，种子用户的定义和提供方式有多种，不局限于上述方式。

在步骤s120中将会利用转化预测模型，预测备选用户执行转化操作的概率。在本实施例中所述转化预测模型，可为能够用于预测某一个用户执行对应的转化操作的模型。

所述转化操作可包括点击操作，关注操作、购买操作等转化行为对应的操作。例如，所述待投放信息为一个广告，将该广告推送到用户的社交应用界面之后，用户是可以看到该广告，其中有一部分用户可能对该广告感兴趣，可能会通过点击该广告，进入该广告的详细页面。该广告的详细页面可包括该广告的广告标的物的详细接收。例如，所述广告为汽车广告，若客户端检测到点击汽车广告的操作之后，会显示该汽车广告的详细页面，该详细页面内可能包括该汽车的性能参数、价格以及购买渠道等购买参数等。本实施例中点击汽车广告的点击操作即为本实施例所述的转换操作的一种。在步骤s120中可以利用点击预测模型，来预测备选用户对所述待投放信息执行所述转换操作的概率。

在步骤s130中将会结合相似度和概率，至少这两个维度的信息，从备选用户中选择出所述待投放信息的目标用户，完成对所述待投放信息的投放对象的定位。

在本实施例中所述待投放信息可为各种待曝光或待公布的各种信息，可包括广告、公告以及通知等信息。例如，有些公告并非需要针对所有人，可能仅需针对一部分人，在公布所述公告时，可以重点向部分人推荐。例如，“取消小学生学分”这一公告，在向所有人公布的同时，为了重点告知小学生的父母，可以通过向小学生父母的通信账号，再次进行重点展示，以防止部分父母不知道的情况下依然忍受对学校的乱收费现象。显然该公告也可以利用步骤s110可寻找出与小学生父母年龄相仿的人群，再通过点击率预测，可结合两者，选择出有孩子的人群。

总之，本实施例提供的目标用户定位方法，将结合种子用户的用户特征的相似度计算和转化预测模型的概率预测这两个维度筛选出所述待投放信息的目标用户，具有定位精确度高的特点，能够显著提升已投放信息的概率。

本实施例所述的用户特征可包括人口属性特征、设备属性特征和兴趣属性特征。所述人口属性特征通常可包括用户的性别、年龄、所在地以及职业等用户属性特征。所述设备属性特征可包括用户使用的设备类型、设备品牌以及通信运营商等属性。所述兴趣属性特征可包括：用户兴趣标签、用户行为偏向、网页和/或应用浏览行为特征、游戏偏好特征等能够表征用户兴趣或偏好的特征。

实施例二：

如图1所示，本实施例提供一种目标用户定向方法，包括：

步骤s110：利用相似模型，确定备选用户与种子用户之间的相似度；

步骤s120：利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

步骤s130：根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

所述步骤s130可包括：

利用所述相似度、所述概率及预设函数关系、计算所述备选用户的定向评分；

选择出所述定向评分满足预设定向条件的所述备选用户，作为所述目标用户。

在本实施例中所述相似度可为取值为0到1之间的数值，所述概率也为取值0到1之间的数值，将所述相似度和所述概率作为所述预设函数关系式的因变量进行计算，得到的函数值极为所述定向评分。

例如，直接将所述相似度和所述概率进行加权运算，则得到了所述定向评分。最后根据所述定向评分，可以选择出定向评分大于预设值的备选用户作为所述目标用户。或者，选取所述定向评分最大的前m位备选用户作为所述目标用户。

显然利用这种方法选择出的目标用户，一方面使得目标用户与种子用户足够相似，故仔细阅读所述待投放信息或执行对应转化操作的概率大，另一方面，通过转化预测模型预测得到执行对应转化操作的概率，再次保证了选择出的目标用户有较高的概率是对所述待投放信息执行所述转化操作；显然实现了目标用户精准定向，同时能够提升待投放信息向用户投放的概率。

实施例三：

如图1所示，本实施例提供一种目标用户定向方法，包括：

步骤s110：利用相似模型，确定备选用户与种子用户之间的相似度；

步骤s120：利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

步骤s130：根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

所述步骤s130可包括：

利用所述相似度、所述概率及预设函数关系、计算所述备选用户的定向评分；

选择出所述定向评分满足预设定向条件的所述备选用户，作为所述目标用户。

所述利用所述相似度、所述概率及预设函数关系、计算所述备选用户的定向评分，包括：

确定所述相似度的第一权值及所述概率对应的第二权值；

利用所述相似度、所述第一权值、所述概率、所述第二权值及所述预设函数关系，计算所述定向评分。

在本实施例中在进行所述定向评分的确定时，分别确定出相似度和概率对应的权值。在本发明实施例中所述相似度对应的权值为第一权值；所述概率对应的权值为第二权值。

在进行所述第一权值和所述第二权值确定时，可以根据所述待投放信息得到属性信息来确定。例如，根据所述待投放信息的目标属性来确定所述第一权值和所述第二权值；例如，所述待投放信息为提升品牌指明度的广告，则目标属性对转发率或点评率，对点击率要求没有那么高，若此时所述转化预测模型，则计算所述定向评分时，点击概率的权值可以相对较小。若所述转化预测模型为转发预测模型或点评预测模型，得到的转发概率和点评概率，可以将所述转发概率和点评概率对应的第二权值设置的较大。

值得注意的在本发明实施例中所述转化预测模型可包括多个预测不同转化操作的概率的独立模型，所述转化预测模型可为一个，该转化预测模型可为能够同时对一个或一个以上的转化操作的概率的联合模型。

在计算所述定向评分，可以综合上述转化预测模型得到的一个或多个概率进行计算。

在确定所述第一权值和所述第二权值时，可以根据待投放信息的信息属性，所述信息属性可包括待投放信息的类型、所述待投放信息的投放目标等属性信息来确定。在具体的实现过程中，也可以直接基于所述待投放信息的信息提供者或发布者提供的用户指示，确定所述第一权值和所述第二权值。总之，确定所述第一权值和所述第二权值的方法有多种，不局限于上述任意一种。

例如，在步骤s130中可以根据如下函数关系计算所述定向评分：

p＝p1*a+p2*b

所述p为定向评分；所述p1为备选用户与种子用户的相似度；所述a为所述第一权值；所述p2为所述概率；所述b为所述第二权值。

以上仅是一个所述预设函数关系求解所述定向评分的一个示例，具体实现时不局限于上述函数关系。

在步骤s130中可以将所述p进行排序，选择排序靠前的若干个备选用户确定所述待投放信息投放的目标用户。

在本实施例中在前述实施例的基础上，引入了第一权值和第二权值，可以灵活的调整所述函数关系式，这样可以灵活的调整筛选出的目标用户在相似度和执行转化操作的概率上的偏向性，以满足不同的待投放信息的投放特点。

实施例四：

如图1所示，本实施例提供一种目标用户定向方法，包括：

步骤s110：利用相似模型，确定备选用户与种子用户之间的相似度；

步骤s120：利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

步骤s130：根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

在确定所述相似度之前，所述方法还包括：

提取作为第一正例用户的所述种子用户的用户特征，作为训练所述相似模型的正例特征；

提取第一负例用户的用户特征，作为训练所述相似模型的负例特征；

利用所述正例特征和所述负例特征进行模型训练，得到所述相似模型。

在本实施例中所述种子用户作为训练所述相似模型第一正例用户；提取种子用户的用户特征；同时还将提取第一负例用户的用户特征，作为所述负例特征。所述第一负例用户可为除所述种子用户以外的其他任何用户；当然也可以是筛选出来的与所述种子用户差异较大的用户。

利用所述正例特征和所述负例特征训练神经网络或学习机等各种待训练模型，得到所述相似模型。所述相似模型可以用于选择出与所述种子用户相似度该的备选用户。在本实施例中所述相似模型可用于输出备选用户与种子用户的相似度。

在本实施例中所述种子用户可为所述待投放信息的信息提供者提供的用户，也可以是为存储在数据库中已经观看了所述待投放信息满足预设相似度的信息的种子用户。这样训练出的相似模型，可以用于选择出与种子用户很相似的备选用户作为待投放信息的目标用户，这些用户与种子用户的相似性，会较大的概率阅读待投放信息或执行对应的转化操作。

实施例五：

如图1所示，本实施例提供一种目标用户定向方法，包括：

步骤s110：利用相似模型，确定备选用户与种子用户之间的相似度；

步骤s120：利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

步骤s130：根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

在确定所述概率之前，所述方法还包括：

根据已投放信息的投放数据，提取对所述已投放信息执行了所述转化操作的用户作为第二正例用户；

从已投放信息的投放数据，提取所述已投放信息未执行所述转化操作的用户作为第二负例用户；

利用所述已投放信息的信息特征、所述第二正例用户和所述第二负例用户的用户特征作进行模型训练，得到所述转化预测模型。

在本实施例中利用对已投放信息执行了所述转化操作的用户作为第二正例用户，将对已投放信息未执行所述转化操作的用户作为第二负例用户。在进行转化预测模型，提取所述第二正例用户的用户特征作为正例特征；提取第二负例用户的用户特征作为负例特征；并结合已投放信息的信息特征，能够训练出确定每一个备选用户对待投放信息的执行对应的转换操作的概率。

具体地如，所述根据已投放信息的投放数据，提取对所述已投放信息执行了所述转化操作的用户作为第二正例用户，包括：根据所述已投放信息的投放数据，提取接受所述已投放信息的显示且对所述已投放信息执行了预定操作的用户作为所述第二正例用户；所述从已投放信息的投放数据，提取所述已投放信息未执行所述转化操作的用户作为第二负例用户，包括：提取接受所述已投放信息的显示且未对所述已投放信息执行了预定操作的用户作为所述第二负例用户。

例如在微信等社交账号中推送所述待投放信息，例如，在用户b和用户c的微信朋友微信圈显示了该信息b的摘要信息或简要信息，若用户点击了信息b的摘要信息或简要信息，进入了信息b的详细信息页，则可将用户b作为所述第二正例用户。若用户c没有点击所述信息b的摘要信息或简要信息，进入到信息b的详细信息页，则可将所述用户c视为第二负例用户。总之，本实施例提供了一种训练所述转化预测模型的方法，具有实现简单及预测精度高的特点。

实施例六：

如图1所示，本实施例提供一种目标用户定向方法，包括：

步骤s110：利用相似模型，确定备选用户与种子用户之间的相似度；

步骤s120：利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

步骤s130：根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

所述方法还包括：

利用所述相似模型输出确定所述相似度的核心特征；其中，所述核心特征为所述种子用户之间的相同特征或相似特征。

在本实施例中所述相似模型将会输出确定所述相似度的核心特征。所述核心特征通常可能是种子用户之间的相同特征或相似特征。例如，种子用户的年龄都在23至27岁之间，年龄为23至27岁这一特征即为所述核心特征。

例如，通常种子用户会有部分用户特征的相似度很高，例如，地域都在上海或上海周边区域等，这些用户特征可能是区分备选用户是否为该待投放信息的目标用户的主要特征，在本实施例中可以通过各个用户特征的信息增益率的计算，确定出所述强区分度特征，方便待投放信息的信息提供者或发布者查看。

以下可为所述增益信息率igr的计算公式：

其中，所述h(c|xi)表示第x用户的用户特征c取值为xi的信息熵；所述h(xi)表示所有用户的用户特征为xi的信息熵的信息上；所述h(c)表示所有用户的用户特征c的信息熵。根据igr可选择出所述强区分度特征。具体地如，选择igr大于指定阈值的用户特征作为所述强区分特征输出，或选择igr排序在前n位的用户特征作为强区分度的核心特征输出。

采用本实施例所述的方法，能够方便用户和工作人员，确定简便的知道当前计算相似度，以区分与种子用户是否满足预定相似度的备选用户的高区分度特征。

实施例七：

如图1所示，本实施例提供一种目标用户定向方法，包括：

步骤s110：利用相似模型，确定备选用户与种子用户之间的相似度；

步骤s120：利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

步骤s130：根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

所述步骤s120可包括：

提取所述待投放信息的信息特征；

提取所述备选用户的用户特征；

将所述待投放信息的信息特征和所述备选用户的用户特征，输入所述转化预测模型，预测得到所述概率。

本实施例为在前述任意一个实施例基础上的进一步改进，在不冲突的情况下可以与前述实施例中任意提供的技术方案结合使用，形成新的技术方案。例如在本实施例中所述定向评分的确定可以参见实施例二或实施例三；所述相似模型和转化预测模型的确定可以参见实施例四或实施例五等；再比如所述核心特征的输出可以参见实施例六。

在本实施例的步骤s120将待投放信息的信息特征和备选用户的用户特征输入到所述转化预测模型中，则可以估算出每一个备选用户对所述待投放信息执行对应的转化操作的概率。例如，所述信息a为待投放信息，用户a和用户b均为所述被选用用户。在进行所述概率的预测时，提取所述信息a的信息特征及所述用户a和所述用户b的用户特征作为转化预测模型的输入，所述转化预测模型经过信息处理之后，可以输出用户a和用户b对所述信息a执行点击等转化操作的概率。

显然，这样可以简便的预测出每一个备选用户对所述待投放信息执行所述预定转化操作的概率。这样在步骤s130中结合相似度和概率确定的目标用户，至少从两个维度上确保了目标用户有非常大的概率对所述待投放信息执行所述预定转化操作。

实施例八：

如图2所示，本实施例提供一种目标用户定向装置，包括：

确定单元110，用于利用相似模型，确定备选用户与种子用户之间的相似度；

预测单元120，用于利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

选择单元130，用于根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

本实施例提供的所述目标用户定向装置可为应用于各种电子设备中的装置，例如应用于各种待投放信息目标用户确定的服务器或服务平台中。

所述确定单元110、预测单元120及选择单元130都可对应于处理器或处理电路。所述处理器可包括中央处理器、微处理器、数字信号处理器或可编程阵列等。所述处理电路可包括专用集成电路等。

所述处理器或处理电路可与存储介质通过iis等设备内部的通信接口连接，可通过读取存储在所述存储介质上的可执行代码或通过电路自身的信号的处理，实现上述确定单元110、预测单元120及所述选择单元130的功能。

本实施例提供的目标用户定向装置，能够从相似度和执行预定转化操作的概率，这两个维度来从备选用户中选择出待投放信息投放的目标用户，这样确定的目标用户，具有目标用户定位精确度高及信息投放后具有预定转换操作的转化概率高的特点。

实施例九：

如图2所示，本实施例提供一种目标用户定向装置，包括：

确定单元110，用于利用相似模型，确定备选用户与种子用户之间的相似度；

预测单元120，用于利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

选择单元130，用于根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

所述选择单元130，具体用于利用所述相似度、所述概率及预设函数关系、计算所述备选用户的定向评分；选择出所述定向评分满足预设定向条件的所述备选用户，作为所述目标用户。

在本实施中所述定向评分的确定是基于预设函数关系计算得到的。所述概率和所述相似度分别作为所述预设函数关系的因变量输入，利用函数关系的计算得到所述定向评分。再选择出定向评分满足预设条件的别选用户作为所述目标用户。在本实施例中所述选择单元130的具体结构可包括计算器或计算功能的处理器。所述选择单元130还可对应于比较器或具有比较排序功能的处理器等，通过比较排序等，选择出定向评分满足所述预设定向条件的备选用户，作为目标用户。例如，若定向评分越高表明该用户与种子用户的相似度越高，对待投放信息执行所述预定转化操作的概率越高，则可以通过排序选择出排序靠前的备选用户作为所述目标用户，或将定向评分大于预设阈值的备选用户作为所述目标用户。

本实施例所述的目标用户定向装置，是在前一实施例的基础上，具体限定了确定目标用户的选择单元130的结构，具有选择出的目标用户精确度高及信息投放后的预定转化操作概率高的特点。

实施例十：

如图2所示，本实施例提供一种目标用户定向装置，包括：

确定单元110，用于利用相似模型，确定备选用户与种子用户之间的相似度；

预测单元120，用于利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

选择单元130，用于根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

所述选择单元130，具体用于确定所述相似度的第一权值及所述概率对应的第二权值；利用所述相似度、所述第一权值、所述概率、所述第二权值及所述预设函数关系，计算所述定向评分。

在本实施例中为了能够灵活的调整相似度和执行预定转化操作的概率对定向评分的影响度，在本实施例中引入了第一权值和第二权值；通常第一权值比第二权值大，则相似度比概率对定向评分的影响度越大，若第二权值比第一权值大，则概率比相似度对定向评分的影响度大。在确定所述第一权值和所述第二权值时可以根据所述待投放信息的信息属性来确定，也可以直接根据用户指示来确定。总之在本实施例中通过所述第一权值和所述第二权值的引入，能够灵活的调整所述相似度和所述概率这两个维度对定向评分的影响度，从而简便的选择出所述待投放信息最适合的目标用户。

实施例十一：

如图2所示，本实施例提供一种目标用户定向装置，包括：

确定单元110，用于利用相似模型，确定备选用户与种子用户之间的相似度；

预测单元120，用于利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

选择单元130，用于根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

所述装置还包括：

第一训练单元，用于在确定所述相似度之前，提取作为第一正例用户的所述种子用户的用户特征，作为训练所述相似模型的正例特征；提取第一负例用户的用户特征，作为训练所述相似模型的负例特征；利用所述正例特征和所述负例特征进行模型训练，得到所述相似模型。

在本实施例中第一训练单元可对应于处理器或处理电路，能够训练神经网络或学习机，获得所述相似模型。在本实施例中会提取种子用户的用户特征作为正例特征，可将第一种子用户以外的其他用户视为负例用户，提取负例特征。

在本实施例中所述第一训练单元这样训练得到的相似模型，能够精确的确定出备选用户与种子用户的相似度。

实施例十二：

如图2所示，本实施例提供一种目标用户定向装置，包括：

确定单元110，用于利用相似模型，确定备选用户与种子用户之间的相似度；

预测单元120，用于利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

选择单元130，用于根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

所述装置还包括：

在本实施例中第二训练单元同样可对应于处理器或处理电路；所述处理器或处理电路的相关描述可以参见前述实施例，在此就不重复了。但是本实施例与所述第二训练单元对应的处理器或处理电路是用于训练所述转化预测模型。采用所述第二训练单元得到的转化预测模型，能够精确的预测出备选用户对所述待投放信息执行所述预定转化操作的概率。

实施例十三：

如图2所示，本实施例提供一种目标用户定向装置，包括：

确定单元110，用于利用相似模型，确定备选用户与种子用户之间的相似度；

预测单元120，用于利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

选择单元130，用于根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

所述装置还包括：

输出单元，用于利用所述相似模型输出确定所述相似度的核心特征；其中，所述核心特征为所述种子用户之间的相同特征或相似特征。

本实施例所述的输出单元可对应于各种输出结构，例如可对应于各种类型的显示屏。所述显示屏可包括液晶显示屏、投影显示屏、电子墨水显示屏或有机发光二极管oled显示屏等。所述输出单元采用显示输出所述核心特征，便于待投放信息的提供者或发布者确定哪些用户特征是区分备选用户中目标用户和非目标用户的强区分度特征。

实施例十四：

如图2所示，本实施例提供一种目标用户定向装置，包括：

确定单元110，用于利用相似模型，确定备选用户与种子用户之间的相似度；

预测单元120，用于利用转化预测模型，预测所述备选用户对待投放信息执行预定转化操作的概率；

选择单元130，用于根据所述相似度和所述概率，从所述被选用户中选择出所述待投放信息的目标用户。

所述预测单元120，具体用于提取所述待投放信息的信息特征；提取所述备选用户的用户特征；将所述待投放信息的信息特征和所述备选用户的用户特征，输入所述转化预测模型，预测得到所述概率。

在本实施例中所述预测单元120将提取待投放信息的信息特征及备选用户的用户特征，作为转化预测模型的输入参数，所述输入参数经过所述转化预测模型的处理，将输出各个备选用户对所述待投放信息执行所述预定转化操作的概率，具有实现简便的特点。

以下结合上述任意实施例提供几个具体示例：

示例一：

如图3所示，本示例提供一种广告发布系统架构，包括数据输入、数据处理及数据应用三部分。在图3所示的系统中以腾讯的广告发布系统为例进行说明。

在数据输出部分，将网络媒体事业群(onlinemediagroup，omg)的数据、广告专区、其他系统数据及公司外部数据进行标准化转换/整理，将转换/整理或的数据存储到数据存储平台。例如所述omg数据和广告专区数据均为系统a的数据，所述其他系统数据即为所述系统a以外的其他系统的数据。若所述系统a为腾讯系统，则所述其他系统数据为腾讯系统以外的其他系统产生的数据。

在数据处理阶段，首先进行多来源数据整合，其次利用标签库中的标签进行标签数据挖掘，例如，给不同年级的用户贴上与年级相关的标签。将标签化的数据输出到用户管理平台。数据管理平台对标签化的数据，进行再次的数据分析，获得分析报告。

在数据应用阶段，用户管理平台对存储的数据进行聚合/抽取，得到包括多个用户的用户特征的用户包。为了确保数据的真实性，可以将用户包中的数据输入到第三方调研验证。所述用户包还可用于进行相似人群扩散。在本示例中进行相似用户扩散，可包括选择出与种子用户相似的相似用户。这里的相似用户即为前述目标用户。

利用所述用户包进行千次曝光成本(costperthousandimpressions，cpm)售卖，提供数据管理平台(datamanagementplatform，dmp)的数据服务。

cpm投放引擎向利用相似人群扩散得到的用户包内的用户投放数据。

广告交易平台(advertisementexchangeplatform，adx)提供基于所述用户包进行广告交易。

用于为第三方dsp/dmp提供用户包，所述dsp对应的中文为需求方平台，为demandserverplatform的缩写。

用于外部广告投放提供用户包。

dmp的核心在于中间的用户管理平台上。对于品牌广告，广告主会在用户管理平台上进行人群的提取、画像分析，用户库存的计算和询量以及用户的相似扩散。这里的用户的相似扩散即可为上述目标用户的定向。

本示例中目标用户的定向主要由三部分组成：

第一步：相似模型的训练；

第二步：点击预测模型的训练；

第三步：利用相似模型和点击预测模型筛选出目标用户，实现在种子用户基础上的相似用户的扩散。

用户在dmp平台上上传种子用户后，确定对种子用户进行扩散并接收用户输入的扩散规模以及将要投放的广告，训练得到相似模型，并利用相似模型和点击预测模型，对每一个备选用户进行定向评分。最后按照定向评分的分数的高低给出符合用户指定规模的人群；同时也会输出种子用户的核心特征进行可视化展示。

在本示例中将要投放的广告即为即为前述的待投放信息。所述扩散规模可包括需要选择的目标用户的数量。所述点击预测模型即为前述转化预测模型的一种。

示例二：

如图4所示，本示例在前一示例的基础上提供一个相似模型训练方法，包括：

大盘用户属性生成：这里的大盘用户即为上述第二负例用户；所述大盘用户属性生成包括获取包括多个数据源用户提供的用户的各种用户数据。

大盘用户属性数据：在大盘用户属性生成之后，即获得所述用户数据之后提取大盘用户属性数据，例如，表征一个用户人口属性、设备属性和兴趣属性的各种数据。

数据标注：将种子用户和大盘用户属性数据，分别进行数据标注。这里的数据标注，形成属性日志。例如，将某些大盘用户为负例用户，将种子用户标注为正例用户。此处的种子用户为前述实施例中的第一正例用户，所述大盘用户可为所述第一负例用户。

特征抽取：包括分别抽取正例用户和负例用户的用户特征，形成训练样本。

模型训练：利用训练样本进行模型训练得到所述相似模型。

具体地如，图4中，将种子用户和大盘属性数据进行联合后，将种子用户标注为正例用户，然后对不在种子用户中的潜在用户进行抽样后得到负例用户。完成正例用户和负例用户的标注后，再进行特征抽取和模型训练。模型的特征输入包括正哦里用户的人口属性(性别，年龄，地域，职业等)，设备属性(使用的设备机型，品牌，运营商等)和兴趣属性(各个媒体上的浏览行为特征，游戏的偏好等等)。模型的训练主要是在spark训练上搭建的逻辑回归训练算法框架进行，训练得到的相似模型作为文件保存下来用于后面进行相似度的计算，训练算法能自动的过滤掉比较弱的特征，很好的规避了不重要的特征带来的预测的准确性。

示例三：

如图5所示，本示例在前一示例的基础上提供一个点击预测模型训练方法，包括：

训练数据准备阶段：获取广告曝光数据、广告点击数据、用户需求方平台(demand-sideplatform，dsp)数据及广告订单数据。这里的广告订单数据可包括前述已投放数据的信息特征。这里的广告曝光数据可包括所述已投放广告的显示数据。所述广告点击数据可包括已投放广告的被点击的次数、频次及点击者等各种数据。

特征提取：提取用户特征和信息特征。

模型训练：利用提取的用户特征和信息特征进行模型训练得到所述点击预测模型。

示例四：

如图6所示，本示例在前一示例的基础上提供一个计算定向评分的方法，包括：

备选用户特征及广告特征：将这些特征输入到训练模型和点击预测模型中；具体如，将备选用户特征输入到相似模型，将备选用户特征及广告特征输入到点击预测模型。

计算相似度：利用相似模型计算备选用户与种子用户的相似度p(mu，u)。

计算点击率：利用点击预测模型预估各备选用户点击该广告特征对应广告的点击率p(mu，u，a)。这里的点击率即为前述执行预定转化操作的概率的一种。

计算定向评分：基于p(mu，u)及p(mu，u，a)确定p(u)。

示例五：

本示例基于示例一提供的系统架构，提供一种目标用户定向的结果输出方法，包括：

目标用户的输出包括两个部分：模型透明化信息和用户的定向评分。

模型透明化信息包括揭示种子人群的具有较高区分度的核心特征。核心特征的确定方法主要是计算相似性扩散模型的训练数据的各个用户属性的信息增益率igr。假设分类用户特征为c，用户特征向量为x，h为信息熵。

用户定向评分的输入为相似模型输出的相似度mu，点击预测模型输出的概率mc，预测的输入包括大盘用户u和将要投放的广告a。大盘每个用户ui的计算公式如下：p(ui)＝α*p(u,ui)+β*p(mc,ui,a)

其中,α和β分别代表相似度和点击率的权重，可以根据业务场景进行响应调整；所述i为用户特征x的第i个特征值。p(u,ui)和p(mc,ui,a)都是0至1之间的实数，分别代表用户是相似度和点击广告的概率。例如，用户特征x为年龄特征。所述第i个特征值可对应于年龄为20至30岁这一特征值。

示例六：

如图7所示，本示例提供一种目标用户定向装置，包括：处理器220、存储介质240以及至少一个外部通信接口210；所述处理器220、存储介质240以及外部通信接口210均通过总线230连接。所述处理器220可为微处理器、中央处理器、数字信号处理器、应用处理器或可编程逻辑阵列等具有处理功能的电子元器件。所述存储介质240上存储有计算机可执行指令；所述处理器220执行所述存储介质240中存储的所述计算机可执行指令可实现前述实施例一至实施例七任意技术方案提供的所述目标用户定西方法，例如，如图1所示的方法。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元，即可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理模块中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于一计算机可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄浩;黄东波;陈戈
技术所有人：腾讯科技（北京）有限公司
我是此专利的发明人

上一篇：一种平稳安全的高速冲床的制作方法与工艺
上一篇：一种封闭式高速冲床的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。