人群定向方法、装置、服务器及存储介质与流程

文档序号:19157138发布日期:2019-11-16 00:58阅读:258来源:国知局
人群定向方法、装置、服务器及存储介质与流程

本发明涉及互联网技术领域,具体涉及广告投放技术领域,尤其涉及一种人群定向方法、一种人群定向装置、一种服务器及一种计算机存储介质。



背景技术:

广告,顾名思义就是广而告之,即向社会广大公众告知某件事物;狭义的广告是指广告主以付费方式通过广告媒体平台向消费者或用户传播商品或服务信息的手段。目前,在投放目标广告的过程中,通常会先对目标广告进行人群定向处理以确定出该目标广告的定向人群,该定向人群中包括与目标广告相关的潜在受众;然后在该定向人群中投放目标广告。由此可见,人群定向是广告投放过程中的一个非常重要的环节,定向人群的准确性与广告投放效果息息相关;因此,如何更好地进行人群定向以提高定向人群的准确性逐渐成为了研究热点。



技术实现要素:

本发明实施例提供了一种人群定向方法、装置、服务器及计算机存储介质,可以更好地进行人群定向,提高定向人群数据的准确性。

一方面,本发明实施例提供了一种人群定向方法,该人群定向方法包括:

获取目标广告的参考用户集和候选用户集;所述参考用户集包括多个参考用户的属性数据,所述参考用户是指能够对所述目标广告产生正向反馈的用户;所述候选用户集包括多个候选用户的属性数据,所述候选用户是待定向的用户;

采用所述参考用户集和所述候选用户集对预估模型进行训练优化,得到优化的预估模型;

调用所述优化的预估模型根据所述候选用户集中各候选用户的属性数据对所述各候选用户进行广告定向预估,得到所述各候选用户的定向概率,所述定向概率是指候选用户对所述目标广告产生正向反馈的概率;

根据所述各候选用户的定向概率从所述候选用户集中筛选出定向用户的属性数据,并将所述定向用户的属性数据添加至所述目标广告的定向人群数据中。

另一方面,本发明实施例提供了一种人群定向装置,该人群定向装置包括:

获取单元,用于获取目标广告的参考用户集和候选用户集;所述参考用户集包括多个参考用户的属性数据,所述参考用户是指能够对所述目标广告产生正向反馈的用户;所述候选用户集包括多个候选用户的属性数据,所述候选用户是待定向的用户;

优化单元,用于采用所述参考用户集和所述候选用户集对预估模型进行训练优化,得到优化的预估模型;

处理单元,用于调用所述优化的预估模型根据所述候选用户集中各候选用户的属性数据对所述各候选用户进行广告定向预估,得到所述各候选用户的定向概率,所述定向概率是指候选用户对所述目标广告产生正向反馈的概率;

所述处理单元,用于根据所述各候选用户的定向概率从所述候选用户集中筛选出定向用户的属性数据,并将所述定向用户的属性数据添加至所述目标广告的定向人群数据中。

再一方面,本发明实施例提供了一种服务器,所述服务器包括通信接口,所述服务器还包括:

处理器,适于实现一条或多条指令;以及,

计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由所述处理器加载并执行如下步骤:

获取目标广告的参考用户集和候选用户集;所述参考用户集包括多个参考用户的属性数据,所述参考用户是指能够对所述目标广告产生正向反馈的用户;所述候选用户集包括多个候选用户的属性数据,所述候选用户是待定向的用户;

采用所述参考用户集和所述候选用户集对预估模型进行训练优化,得到优化的预估模型;

调用所述优化的预估模型根据所述候选用户集中各候选用户的属性数据对所述各候选用户进行广告定向预估,得到所述各候选用户的定向概率,所述定向概率是指候选用户对所述目标广告产生正向反馈的概率;

根据所述各候选用户的定向概率从所述候选用户集中筛选出定向用户的属性数据,并将所述定向用户的属性数据添加至所述目标广告的定向人群数据中。

再一方面,本发明实施例提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条指令,所述一条或多条指令适于由处理器加载并执行如下步骤:

获取目标广告的参考用户集和候选用户集;所述参考用户集包括多个参考用户的属性数据,所述参考用户是指能够对所述目标广告产生正向反馈的用户;所述候选用户集包括多个候选用户的属性数据,所述候选用户是待定向的用户;

采用所述参考用户集和所述候选用户集对预估模型进行训练优化,得到优化的预估模型;

调用所述优化的预估模型根据所述候选用户集中各候选用户的属性数据对所述各候选用户进行广告定向预估,得到所述各候选用户的定向概率,所述定向概率是指候选用户对所述目标广告产生正向反馈的概率;

根据所述各候选用户的定向概率从所述候选用户集中筛选出定向用户的属性数据,并将所述定向用户的属性数据添加至所述目标广告的定向人群数据中。

本发明实施例在人群定向的过程中,可先获取目标广告的参考用户集和候选用户集;其中,参考用户集包括多个参考用户的属性数据,候选用户集包括多个候选用户的属性数据。由于参考用户是指能够对目标用户产生正向反馈的用户,而候选用户是待定向的用户;因此可先采用参考用户集和候选用户集对预估模型进行训练优化,然后调用优化的预估模型根据各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率;这样可使得预估模型的训练空间和预测空间是一致的,从而提高各候选用户的定向概率的准确性。由于定向概率是指候选用户对目标广告产生正向反馈概率,因此可根据各候选用户的定向概率从候选用户集中筛选并添加定向用户的属性数据至目标广告的定向人群数据中;通过提高定向概率的准确性,可从而提高定向人群数据的准确性。

附图说明

为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1a是本发明实施例提供的一种广告投放的系统架构图;

图1b是本发明实施例提供的一种人群定向方案的示意图;

图2是本发明实施例提供的一种人群定向方法的流程示意图;

图3是本发明实施例提供的一种空间偏移现象的示意图;

图4是本发明另一实施例提供的一种人群定向方法的流程示意图;

图5a是本发明实施例提供的一种广告投放的应用场景图;

图5b是本发明实施例提供的另一种广告投放的应用场景图;

图5c是本发明实施例提供的另一种人群定向方法的流程示意图;

图5d是本发明实施例提供的另一种广告投放的应用场景图;

图5e是本发明实施例提供的另一种广告投放的应用场景图;

图6是本发明实施例提供的一种人群定向装置的结构示意图;

图7是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。

人群定向是指筛选出与目标广告最相关的潜在受众的过程。其中,潜在受众又可称为定向用户,具体是指有较大概率接收到目标广告的潜在接收者。研究表明,在投放目标广告的过程中,人群定向的准确性通常与目标广告的触达率成正比;即人群定向的准确性越高,目标广告的触达率也越高。所谓的触达率也可称为曝光率,是指定向人群中实际曝光用户数与定向人群的总用户数的比值,此处的实际曝光用户数是指在预设时间段内对目标广告存在广告曝光行为(看见目标广告的行为)的用户的数量;触达率可用于衡量定向人群中实际会有多少比例的用户得到实际的广告投放,即触达率可用于衡量定向人群中实际看见目标广告的用户比例。例如,定向人群的总用户数为500人,若在预设时间段内对目标广告存在广告曝光行为的用户的数量为450人,那么触达率(曝光率)就等于450/500=90%;若在预设时间段内对目标广告存在广告曝光行为的用户的数量为200人,那么触达率(曝光率)就等于200/500=40%。此处的预设时间段可以根据实际业务需求设置。

由此可见,人群定向是广告投放过程中的一个非常重要的环节;无论是从广告主(即有广告投放需求的用户)的角度还是从流量方(如广告系统)的角度,都离不开人群定向这一过程。例如,对于广告主而言,低曝光率意味着广告投放的预算得不到有效的消耗,无法触达足够规模的用户群体;而对于流量方而言,低曝光率会影响其收益(尤其是按照曝光扣费的广告)。因此,为了更好地进行人群定向以提高后续的广告投放效果,本发明实施例提出了一种人群定向方案;该人群定向方案可应用于广告系统中,此处的广告系统是指能够提供广告媒体平台、以收费方式为广告主在广告媒体平台上投放广告的系统,如腾讯公司的spami系统。

在一种实施方式中,该广告系统可以是一个基于网页进行人机交互的广告系统,其大致可包括前端和后台两部分;其中,前端是指广告系统的前台部分,运行于终端的浏览器中且展示给广告主浏览的网页;后台是指用于对前端进行一系列的数据管理操作以实现为广告主提供广告服务的后台服务器。再一种实施方式中,该广告系统还可以是一个基于客户端进行人机交互的广告系统,其大致可包括客户端和服务端两部分;其中,客户端是指安装且运行于终端中,且为广告主提供广告服务的应用程序(app);服务端是指与客户端相对应,用于支撑客户端提供广告服务的后台服务器。为便于阐述,除非特别说明,后续实施例中所提及的广告系统均以基于网页进行人机交互的广告系统为例进行说明。上述所提及的终端可包括但不限于:智能手机、膝上计算机、平板电脑等移动设备,以及台式计算机,等等;目标广告可以包括但不限于:电视广告、电影广告、网络广告、视频广告等类型的广告;广告媒体平台可包括但不限于:电视、电影、网页、视频播放客户端(如腾讯视频客户端)以及即时通讯客户端(如腾讯qq客户端、微信客户端)等多媒体平台。

广告主想要确定目标广告的定向人群时,可以通过广告系统的前端向后台服务器(以下简称服务器)发送人群定向请求,如图1a所示。服务器在接收到该人群定向请求之后,可以响应于该人群定向请求,执行上述的人群定向方案以确定出目标广告的定向人群数据,如图1b所示;该定向人群数据中包括多个定向用户的属性数据,多个定向用户构成目标广告的定向人群。在具体实施过程中,服务器可以先获取目标广告的种子人群数据集和大盘用户数据集;其中,种子人群数据集中可以包括多个种子用户的属性数据,所谓的种子用户是指能够对目标广告产生正向反馈的用户;大盘用户数据集中可以包括多个大盘用户的属性数据,所谓的大盘用户是指待定向的用户。其次,可以从种子人群数据集和大盘用户数据集中确定出用于对预估模型进行训练的训练集,此处的预估模型是指可对用户(如种子用户、大盘用户等)进行广告定向预估,以得到用户对目标广告产生正向反馈的概率的模型。然后,可以采用训练集对预估模型进行训练优化,并采用优化的预估模型对大盘用户进行广告定向预估,得到各个大盘用户对目标广告生成正向反馈的概率。最后可以基于该概率对各个大盘用户进行排序以确定出定向用户,并将定向用户的属性数据添加至定向人群数据中。

由此可见,在上述的人群定向方案中,优化的预估模型是对预估模型实时进行训练优化得到的。通过先从种子人群数据集和大盘用户数据集中确定训练集,并用训练集对预估模型进行训练优化;然后又调用优化的预估模型再次对各个大盘用户进行广告定向预估的方式,可使得预估模型的训练空间和预测空间是一致的,从而可使得预估得到的各个大盘用户对目标广告生成正向反馈的概率的准确性较高,进而可提高定向人群数据的准确性。后续在基于该较高准确性的定向人群数据投放目标广告的过程中,可以提高目标广告的触达率,从而提高目标广告的投放效果。

基于上述的描述,本发明实施例提出一种人群定向方法,该人群定向方法可以由上述所提及的服务器执行。请参见图2,该人群定向方法可包括以下步骤s201-s204:

s201,获取目标广告的参考用户集和候选用户集。

广告主想要对目标广告进行人群定向以确定目标广告的定向人群时,可通过广告系统的前端向服务器发送目标广告的人群定向请求。相应的,服务器在接收到该人群定向请求之后,可以响应于该人群定向请求,获取目标广告的参考用户集和候选用户集。其中,候选用户集可以包括多个候选用户的属性数据,所谓的候选用户是待定向的用户(即前述所提及的大盘用户)。参考用户集可以包括多个参考用户的属性数据,所谓的参考用户是指能够对目标广告产生正向反馈的用户,此处的正向反馈是指在被投放目标广告的过程中,看见目标广告或点击目标广告的反馈;相应的,在被投放目标广告的过程中,未看见目标广告的反馈可称为负反馈。例如,在7.20号这一天对用户a投放了目标广告,换句话说,用户a在7.20号这一天被投放了目标广告;若用户a在7.20号这一天看见了该目标广告或点击了该目标广告,则表明用户a对目标广告产生了正向反馈,此情况下的用户a可为参考用户;若用户a在7.20号这一天并未看见该目标广告,则表明用户a对目标广告产生了负向反馈,此情况下的用户a不是参考用户。

其中,上述所提及的属性数据可至少包括用户的用户标识和用户画像,即参考用户的属性数据包括参考用户的用户标识和用户画像,候选用户的属性数据包括候选用户的用户标识和用户画像。此处的用户标识是指可用于唯一标识用户身份的号码,其可包括以下至少一项:社交账号(如qq号码、微信账号)、设备识别码(如安卓系统设备的imei(internationalmobileequipmentidentity,国际移动设备识别码)、ios系统设备的ifa(一种设备识别码))、电话号码、身份证号码,等等。用户画像包括用于将用户形象具体化的标签,其可包括以下至少一项:性别、年龄、性格、兴趣(爱好),等等。

s202,采用参考用户集和候选用户集对预估模型进行训练优化,得到优化的预估模型。

为了更好地对预估模型进行训练优化,使得优化的预估模型的性能较好;本发明实施例先采用了目标广告的历史投放数据对预估模型进行了训练优化,历史投放数据中包括多个历史用户的属性数据;并还对优化的预估模型进行了性能测试。但是,实践发现采用历史投放数据对预估模型进行训练优化所得到的优化的预估模型的性能较差,采用该优化的预估模型进行广告投放会出现目标广告的触达率(即曝光率)较低的问题。本发明实施例对此进行了分析,发现出现低曝光率问题的主要原因如下:

在采用历史投放数据对预估模型进行训练优化时,选择了存在广告曝光行为且存在广告点击行为(点击广告的行为)的历史用户的属性数据作为正样本,选择了存在广告曝光行为且不存在广告点击行为的历史用户的属性数据作为负样本,以此来对预估模型进行训练优化。由此可见,此训练优化方式所采用的训练集包含的全是历史已被投放过目标广告的历史用户的属性数据,即正负样本均是已经曝光的;而预测集是各个候选用户(即大盘用户),但候选用户不一定存在广告曝光行为。用这样的训练集对预估模型进行训练优化,相当于是假设了预测集里的所有候选用户都是一定会曝光的,即假设了预测集里的所有候选用户针对目标广告都是一定会存在的广告曝光行为的;而由于实际上并无法保证各个候选用户一定会存在广告曝光行为,因此这种假设在人群定向中是不成立。换句话说,这种采用历史投放数据训练预估模型的训练方式,其训练空间包含的是存在广告曝光行为的用户群体(里面包含了存在广告曝光行为且存在广告点击行为的历史用户、以及存在广告曝光行为且不存在广告点击行为的历史用户),而预测空间是整个候选用户集所对应的全部候选用户,相当于训练空间和预测空间之间发生了空间偏移(sampleselectionbias),如图3所示。

研究表明,上述所提及的训练空间和预测空间之间的空间偏移现象是导致低曝光率的问题的主要原因;并且,低曝光率问题还会导致低点击率问题,此处的点击率(ctr)是指定向人群中实际点击用户数和实际曝光用户数的比值,此处的实际点击用户数是指在预设时间段内看见目标广告后对目标广告存在广告点击行为的用户的数量;例如,定向人群的总用户数为500人,若在预设时间段内对目标广告存在广告曝光行为的用户的数量为400人,那么定向人群的实际曝光用户数便为400人;若在预设时间段内这400人中有200人点击了目标广告,即有200人对目标广告存在广告点击行为,则定向人群的实际点击用户数为200人,那么点击率就等于200/400=50%。点击率可用于衡量目标广告在定向人群中进行曝光后的点击效果;点击率越大,则表明目标广告在定向人群中进行曝光后的点击效果越好;点击率越小,则表明目标广告在定向人群中进行曝光后的点击效果越差。因此,本发明实施例为了避免训练空间和预测空间发生偏移的现象,选择采用参考用户集和候选用户集对预估模型进行训练优化,使得预估模型的训练空间和预测空间是一致的,从而保证训练优化得到的优化的预估模型具有良好的性能,以使得后续采用该优化的预估模型进行广告投放时可提高目标广告的曝光率或点击率。

s203,调用优化的预估模型根据候选用户集中各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率。

在得到优化的预估模型之后,可先调用该优化的预估模型根据候选用户集中各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率,此处的定向概率是指候选用户对目标广告产生正向反馈的概率。由前述可知,正向反馈是指在被投放目标广告的过程中,看见目标广告或点击目标广告的反馈;可见,若候选用户的定向概率越大,则表明目标广告被该候选用户看见或点击的概率越大,该候选用户成为目标广告的定向用户的概率也就越大。因此,在得到各候选用户的定向概率之后,可以根据各候选用户的定向概率从候选用户集中筛选出定向用户的属性数据,并将定向用户的属性数据添加至目标广告的定向人群数据中,即执行步骤s204。需要说明的是,当正向反馈是指在被投放目标广告的过程中,看见目标广告的反馈时,定向概率则为曝光概率;当正向反馈是指在被投放目标广告的过程中,点击目标广告的反馈时,定向概率则为点击概率。

s204,根据各候选用户的定向概率从候选用户集中筛选出定向用户的属性数据,并将定向用户的属性数据添加至目标广告的定向人群数据中。

为了进一步提高目标广告的曝光率或点击率,服务器在执行步骤s204时可选择将定向概率较大的候选用户作为定向用户,并从候选用户集中获取该定向用户的属性数据添加至定向人群数据中。在具体实施过程中,人群定向请求可携带定向人群数量;那么,服务器可先按照定向概率从大到小的顺序,对候选用户集中各候选用户的属性数据进行排序,得到排序集合;然后,可根据定向人群数量依次从排序集合中选取相应的候选用户的属性数据作为定向用户的属性数据。

在实际应用中,广告主还可选择是否将参考用户集中的各个参考用户作为定向用户。若广告主选择将参考用户集中的各个参考用户作为定向用户,则人群定向请求中还会携带将目标广告定向至各参考用户的指示信息;那么在此情况下,服务器在根据定向人群数量依次从排序集合中选取相应的候选用户的属性数据作为定向用户的属性数据时,可求取定向人群数量和参考用户的数量之间的差值,得到筛选数量;并根据筛选数量依次从排序集合中依次选取相应的候选用户的属性数据作为定向用户的属性数据。并且,服务器还可将参考用户集中的各参考用户的属性数据添加至目标广告的定向人群数据中。若广告主选择不将参考用户集中的各个参考用户作为定向用户,则人群定向请求中便不会携带该指示信息;那么在此情况下,服务器便可直接根据定向人群数量依次从排序集合中选取相应的候选用户的属性数据作为定向用户的属性数据。

举例来说,设人群定向请求所携带的定向人群数量为50个,参考用户集中包括10个参考用户的属性数据,候选用户集中包括60个候选用户的属性数据,且按照定向概率从大到小的顺序,对各候选用户的属性数据进行排序,得到排序集合依次包括:候选用户1的属性数据、候选用户2的属性数据、候选用户3的属性数据…候选用户60的属性数据。若人群定向请求中携带将目标广告定向至各参考用户的指示信息,则可计算得到筛选数量为50-10=40个,那么可从排序集合中依次选取40个候选用户的属性数据添加至定向人群数据中,以及将10个参考用户的属性数据也添加至定向人群数据中;即此情况下的定向人群数据包括10个参考用户的属性数据以及候选用户1的属性数据、候选用户2的属性数据、候选用户3的属性数据…候选用户40的属性数据。若人群定向请求中未携带将目标广告定向至各参考用户的指示信息,则可直接从排序集合中依次选取50个候选用户的属性数据添加至定向人群数据中;即此情况下的定向人群数据包括候选用户1的属性数据、候选用户2的属性数据、候选用户3的属性数据…候选用户50的属性数据。

本发明实施例在人群定向的过程中,可先获取目标广告的参考用户集和候选用户集;其中,参考用户集包括多个参考用户的属性数据,候选用户集包括多个候选用户的属性数据。由于参考用户是指能够对目标用户产生正向反馈的用户,而候选用户是待定向的用户;因此可先采用参考用户集和候选用户集对预估模型进行训练优化,然后调用优化的预估模型根据各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率;这样可使得预估模型的训练空间和预测空间是一致的,从而提高各候选用户的定向概率的准确性。由于定向概率是指候选用户对目标广告产生正向反馈概率,因此可根据各候选用户的定向概率从候选用户集中筛选并添加定向用户的属性数据至目标广告的定向人群数据中;通过提高定向概率的准确性,可从而提高定向人群数据的准确性。

请参见图4,是本发明实施例提供的另一种人群定向方法的流程示意图。该人群定向方法可以由上述所提及的服务器执行。请参见图4,该人群定向方法可包括以下步骤s401-s406:

s401,获取目标广告的参考用户集和候选用户集。

服务器可在接收到人群定向请求后,获取目标广告的参考用户集和候选用户集;该人群定向请求可至少携带目标广告的人群定向目标以及平台标识,此处的平台标识包括:投放目标广告的广告媒体平台的平台标识或者广告系统的平台标识。具体的,若广告主未指定投放目标广告的广告媒体平台,则人群定向请求所携带的平台标识为广告系统的平台标识;若广告主指定了投放目标广告的广告媒体平台,则人群定向请求所携带的平台标识为广告主所指定的广告媒体平台的平台标识。

相应的,服务器在获取目标广告的候选用户集时,若平台标识包括投放目标广告的广告媒体平台的平台标识,则可先确定平台标识所对应的广告媒体平台;然后将广告媒体平台中的所有注册用户作为候选用户,并获取所有注册用户的属性数据作为候选用户的属性数据添加至候选用户集中。或者,将广告媒体平台中近期活跃的注册用户作为候选用户,并获取近期活跃的注册用户的属性数据作为候选用户的属性数据添加至候选用户集中;其中,近期活跃的注册用户是指基于当前系统时间往前推算的预设时间段内,登陆广告媒体平台的次数大于预设次数的注册用户。若平台标识包括广告系统的平台标识,则可将广告系统中所存储的广告用户名单中的所有广告用户(如被投放过任一广告的历史用户、投放过任一广告的广告主)作为候选用户,并获取所有广告用户的属性数据作为候选用户的属性数据添加至候选用户集中。或者,将广告系统中所存储的广告用户名单中的近期活跃的广告用户作为候选用户,并获取近期活跃的广告用户的属性数据作为候选用户的属性数据添加至候选用户集中。

目标广告的参考用户集可以是广告主自己上传的,即参考用户是广告主指定的用户;或者目标广告的参考用户集可以是第三客户端主动上报的,即参考用户是线下线上已转化用户。其中,第三方客户端是指能够对目标广告对应的广告对象进行业务处理的客户端,广告对象是指通过目标广告所传播的对象,其可以是商品、应用程序(app)、网站等,线下线上已转化用户是指通过目标广告而对目标对象进行业务操作的历史用户;例如,目标广告是关于a商品的广告,则广告对象则是a商品,那么第三方客户端是指能够购买a商品的客户端(如购物客户端),线下线上已转化用户是指通过目标广告而购买过a类商品的历史用户;又如,目标广告是关于社交app的广告,则广告对象则是该社交app,那么第三方客户端是指能够下载该社交app的客户端(如应用商店客户端),线下线上已转化用户是指通过目标广告而下载过社交app的历史用户,等等。相应的,获取目标广告的参考用户集的具体实施方式可以是:接收目标广告的人群定向请求,该人群定向请求携带种子用户名单;此处的种子用户名单中包括多个种子用户的属性数据,用户名单是由广告主上传的或者是由第三方客户端上报的。将种子用户名单中各种子用户的属性数据作为参考用户的属性数据添加至目标广告的参考用户集中。

另一种实施方式中,目标广告的参考用户集还可以是服务器根据目标广告的历史投放情况自动收集的。相应的,获取目标广告的参考用户集的具体实施方式可以是:首先,可接收目标广告的人群定向请求,该人群定向请求携带目标广告的人群定向目标。其次,可获取目标广告的历史投放流水表,历史投放流水表中至少包括历史用户的属性数据和行为数据,历史用户的行为数据用于指示历史用户针对目标广告是否存在广告曝光行为和广告点击行为;然后,可按照人群定向目标从历史投放流水表中获取参考用户的属性数据,并将参考用户的属性数据添加至目标广告的参考用户集中。

其中,在按照人群定向目标从历史投放流水表中获取参考用户的属性数据时,若人群定向目标为以曝光率为基准进行人群定向,则将历史投放流水表中存在广告曝光行为的历史用户的属性数据作为参考用户的属性数据;若人群定向目标为以点击率为基准进行人群定向,或者为联合曝光率和点击率进行人群定向且曝光率的权重等于或小于点击率的权重,则将历史投放流水表中存在广告点击行为的历史用户的属性数据作为参考用户的属性数据;若人群定向目标为联合曝光率和点击率进行人群定向且曝光率的权重大于点击率的权重,则将对历史投放流水表中存在广告曝光行为的历史用户的属性数据进行抽样得到的属性数据作为参考用户的属性数据,及将历史投放流水表中存在广告点击行为的历史用户的属性数据作为参考用户的属性数据。

需要说明的是,历史投放流水表中还可包括历史用户的行为数据的时间标签,该时间标签可用于标识产生行为数据的时间,即标识历史用户存在广告曝光行为或广告点击行为的时间;相应的,服务器在按照人群定向目标从历史投放流水表中获取参考用户的属性数据时,还可结合该时间标签以及人群定向目标,从历史投放流水表中获取参考用户的属性数据。例如,若人群定向目标为以曝光率为基准进行人群定向,则可以将历史投放流水表中近期(基于当前系统时间往前推算预设时间段内)存在广告曝光行为的历史用户的属性数据作为参考用户的属性数据。

再一种实施方式中,目标广告的参考用户集还可以包括以下至少两种方式获取到的参考用户的属性数据:广告主自己上传的、第三客户端主动上报的以及服务器根据目标广告的历史投放情况自动收集的。例如,参考用户集需要50个参考用户的属性数据,而广告主上传的种子用户名单中只包括了30个种子用户的属性数据;那么服务器除了将广告主上传的种子用户名单中的30个种子用户的属性数据作为参考用户的属性数据添加至参考用户集中,还可从第三方客户端主动上报的种子用户名单中获取20个种子用户的属性数据作为参考用户的属性数据添加至参考用户集中;又或者,服务器还可按照人群定向目标从历史投放流水表中获取20个历史用户的属性数据作为参考用户的属性数据添加至参考用户集中。又如,参考用户集需要100个参考用户的属性数据,而广告主上传的种子用户名单中只包括了30个种子用户的属性数据、第三方客户端上报的种子用户名单中只包括了20个种子用户的属性数据;那么服务器除了将广告主上传的种子用户名单中的30个种子用户的属性数据以及第三方客户端上报的种子用户名单中的20个种子用户作为参考用户的属性数据添加至参考用户集中,还可按照人群定向目标从历史投放流水表中获取50个参考用户的属性数据添加至参考用户集中,等等。

需要说明的是,在具体实施过程中,可预先根据实际业务需求为上述三种方式(通过广告主上传的种子用户名单获取、通过第三客户端上报的种子用户名单获取、以及根据目标广告的历史投放情况自动收集)设置优先级,以便于后续可按照优先级顺序依次单独采用或者结合采用上述三种方式来获取参考用户的属性数据。

s402,采用参考用户集和候选用户集对预估模型进行训练优化,得到优化的预估模型。

在本发明实施例中,预估模型是一个可对用户进行广告定向预估,以得到用户对目标广告产生正向反馈的概率的模型。为了提高预估模型的性能,本发明实施例采用了人工智能(artificialintelligence,ai)领域中的机器学习(machinelearning,ml)技术对预估模型进行训练优化,以使得优化的预估模型可以更好地对用户进行广告定向预估,提高准确性。此处的人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统;人工智能领域中的机器学习是人工智能的核心,其具体可以理解为是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。在采用机器学习技术对预估模型进行训练优化的过程中,预估模型可通过研究计算机如何模拟或实现人类的学习行为来获取新的知识或技能,然后重新组织已有的知识结构使之不断改善自身的性能。在具体实施过程中,步骤s402可包括以下步骤s11-s13:

s11,将参考用户集中各参考用户的属性数据作为正样本。

由于参考用户是指能够对目标广告产生正向反馈的用户,因此可以将参考用户的属性数据作为正样本;具体的,可以对参考用户的属性数据进行特征拼接,从而得到正样本。正样本的数量和参考用户的数量相同;在其他实施例中,若参考用户的数量较多,则也可以根据实际需求对参考用户集进行随机抽样得到正样本,此情况下的正样本的数量小于参考用户的数量。

s12,根据目标广告的人群定向目标,对参考用户集及候选用户集进行抽样得到多个负样本。

候选用户集还可包括各候选用户的行为数据,该候选用户的行为数据用于指示候选用户针对目标广告是否存在广告曝光行为和广告点击行为。在实际应用场景中,负样本可以只包括从参考用户集中抽样得到的参考用户的属性数据,也可以只包括从候选用户集中抽样得到的候选用户的属性数据。具体的,若人群定向目标只看重曝光率,则为了避免训练空间和预测空间产生空间偏移现象,可从候选用户集中不存在广告曝光行为的候选用户的属性数据中抽样得到负样本;也就是说,若人群定向目标为以曝光率为基准进行人群定向,则可对候选用户集中不存在广告曝光行为的候选用户的属性数据进行随机抽样,得到负样本。若人群定向目标只看重点击率,则可直接从参考用户集中存在广告曝光行为且不存在广告点击行为的参考用户的属性数据中抽样得到负样本;也就是说,若人群定向目标为以点击率为基准进行人群定向,则可对参考用户集中存在广告曝光行为且不存在广告点击行为的参考用户的属性数据进行随机抽样,得到负样本。

由于在人群定向目标只看重点击率的情况下,若直接从参考用户集中抽样得到负样本,则可能会导致训练空间和预测空间之间产生空间偏移现象,导致目标广告的点击率较低。而由前述可知,引起此问题的主要原因是由于预测空间中包括的是候选用户,而候选用户不能保证都会曝光;因此,为了解决此问题,本发明实施例在人群定向的过程中,在考虑候选用户对目标广告是否存在广告点击行为之前,还进一步考虑了候选用户对目标广告是否存在广告曝光行为。基于此,本发明实施例在人群定向目标为以点击率为基准进行人群定向的情况下,进一步提出了联合点击率和曝光率为基准进行人群定向的人群定向目标;在此人群定向目标下,在对候选用户进行点击预估时,需要先预估候选用户对目标广告存在广告曝光行为的曝光概率,再预测其曝光后对目标广告存在广告点击行为的点击概率,即对候选用户进行广告定向预估(此处为点击预估)得到的定向概率=曝光概率*点击概率。

为了进一步证明当人群定向目标为联合曝光率和点击率进行人群定向时,候选用户的定向概率等于曝光概率和点击概率的乘积这一关系,本发明实施例对此进行了数学推导:假设x代表候选用户,y是存在广告曝光行为(y=1表示曝光),z是存在点击行为(z=1表示点击);那么,候选用户x的曝光概率和点击概率如下:

候选用户x的曝光概率为:

候选用户x的点击概率为:

计算曝光概率和点击概率的乘积:由此可见,对于候选用户x而言,最终发生广告点击行为的定向概率就是曝光概率和点击概率这二者的乘积。

因此,当人群定向目标为以点击率为基准进行人群定向时,本发明实施例还可进一步将人群定向目标转化成为联合曝光率和点击率进行人群定向;基于该人群定向目标,还提出了采用触达率(曝光率)和点击率联合训练优化的方法对预估模型进行训练优化。具体的,使用存在广告曝光行为且存在广告点击行为的参考用户的属性数据作为正样本,对候选用户集中进行随机抽样得到负样本,然后采用此方式下的正样本和负样本对预估模型进行训练优化。采用此训练集进行训练优化所得到的优化的预估模型,对候选用户进行广告定向预估的定向概率的期望值如下:

由于抽样的候选用户是对候选用户集进行随机抽样得到的,因此可以在一定程度上表示所有候选用户。因此,期望值可进一步表示为:

其中,曝光点击用户数量是指存在广告曝光行为且存在广告点击行为的参考用户的数量,抽样的候选用户数量是指对候选用户集进行随机抽样所得到的候选用户的数量。由此可见,采用对候选用户集进行随机抽样得到负样本的这种方式可以预估任一个候选用户,最终会对目标广告产生广告点击行为的概率。在这种训练方式(即采用触达率(曝光率)和点击率联合训练的方式)下,预估模型的训练空间和预测空间是一致的,可有效解决低曝光率和低点击率的问题。在调用此训练方式下所得到的优化的预估模型确定出的定向人群数据较为准确,使得后续在投放目标广告的过程中,目标广告的整体曝光率和点击率均得到了有效提升,尤其是曝光率整体提升了60%。

基于上述的描述,当人群定向目标为联合点击率和曝光率进行人群定向时,负样本可以只包括从候选用户集中进行抽样得到的候选用户的属性数据,也可以是存在广告曝光行为且不存在广告点击行为的参考用户的属性数据和对候选用户集进行抽样得到的候选用户的属性数据的混合,混合中哪一部分的占比更大可取决于点击率和曝光率的相对重要程度。具体实现中,如果点击率和曝光率同等重要或者人群定向目标更加偏向曝光率,则可以直接从候选用户集中抽样得到负样本;也就是说,若人群定向目标为联合曝光率和点击率进行人群定向且曝光率的权重等于或大于点击率的权重,则可以对候选用户集进行随机抽样,得到负样本。如果人群定向目标更加偏向点击率,则可以在对候选用户集进行随机抽样的基础上,加入一些存在广告曝光行为且不存在广告点击行为的参考用户的属性数据;也就是说,若人群定向目标为联合曝光率和点击率进行人群定向且曝光率的权重小于点击率的权重,则将对候选用户集进行随机抽样得到的候选用户的属性数据作为负样本,且将参考用户集中存在广告曝光行为且不存在广告点击行为的参考用户的属性数据进行随机抽样得到的属性数据作为负样本。

需要说明的是,在一种实施方式中,当候选用户的数量远大于参考用户的数量(正样本的数量)时;为了均衡正负样本的数量比例,从而可更好地进行后续的训练优化;本发明实施例在根据目标广告的人群定向目标,对参考用户集及候选用户集进行抽样得到多个负样本时,还可结合正样本的数量和目标广告的人群定向目标,对参考用户集及候选用户集进行抽样得到多个负样本,以使得负样本和正样本之间的数量比例满足预设比值;该预设比值可根据实际的业务需求或者经验值设置,例如设置预设比值为1、1.5等。

再一种实施方式中,由于有的候选用户可能已对目标广告存在广告曝光行为且存在广告点击行为,因此为了避免在对候选用户集进行抽样时,抽样到此类候选用户的属性数据作为负样本,导致预估模型在训练优化时错误学习到负样本的数据特征,从而影响预估模型的训练优化效果;本发明实施例在根据目标广告的人群定向目标,对参考用户集及候选用户集进行抽样得到多个负样本时,还可先去除候选用户集中对目标广告存在广告曝光行为且存在广告点击行为的候选用户的属性数据,得到剩余用户集;然后按照目标广告的人群定向目标对剩余用户集和参考用户集进行抽样,得到多个负样本,或者结合正样本的数量和目标广告的人群定向目标,对剩余用户集和参考用户集进行抽样得到多个负样本。

由步骤s401-s402所记载的相关内容可见,本发明实施例可根据人群定向目标的不同,选择不同的正负样本;在不同的人群定向目标下,正负样本的选择方式可如表1所示:

表1

其中,曝光数据是指广告投放流水表中存在广告曝光行为的历史用户的属性数据,点击数据是指广告投放流水表中存在广告点击行为的历史用户的属性数据,抽样曝光数据是指对历史投放流水表中存在广告曝光行为的历史用户的属性数据进行抽样所得到的属性数据,未曝光数据是指候选用户集中不存在广告曝光行为的候选用户的属性数据,曝光未点击数据是指广告投放流水表中存在广告曝光行为且不存在广告点击行为的历史用户的属性数据,抽样数据是指对候选用户集进行抽样所得到的属性数据。

s13,采用多个正样本和多个负样本对预估模型进行训练优化,得到优化的预估模型。

在具体实施过程中,在得到多个正样本和多个负样本之后,可以直接基于模型训练算法,采用多个正样本和多个负样本对预估模型进行训练优化,得到优化的预估模型。其中,模型训练算法可包括但不限于:xgboost算法(极端梯度上升算法)、gbdt算法(gradientboostingdecisiontree,梯度提升决策树算法),等等。其中,xgboost算法是一种使用梯度增强框架并基于决策树的集成机器学习算法,其具体可由多个决策树组成,此处的决策树是分类与回归树(classificationandregressiontree,cart),cart决策是是一个二叉树,内部结点特征的取值为“是”和“否”,可将每个结点的取值为“是”的分支作为该结点的左分支,将取值为“否”的分支作为该结点的右分支;xgboost算法的基本思想为:根据样本的特征逐渐构建多个决策树,每构建一个决策树时,均要使得模型的整体效果有所提升,如使得损失函数的函数值有所下降,且当前构建的决策树拟合前一个构建的决策树所导致的残差。gbdt算法是一种迭代的决策树算法,该算法由多棵决策树组成,算法所输出的最终结果由所有决策树的结论累加得到。

在一种实施方式中,由于负样本中可能存在与正样本相似的负样本,而此类与正样本相似的负样本实际上并不属于真正的负样本;因此为了避免在采用正样本和负样本对预估模型进行训练优化的过程中,预估模型误将此类与正样本相似的负样本作为真正的负样本进行学习,导致预估模型无法准确区分正负样本之间的区别,影响预估模型的训练优化效果;本发明实施例在采用多个正样本和多个负样本对预估模型进行训练优化,得到优化的预估模型的具体实现过程中,,还可先根据多个正样本对多个负样本进行样本清洗处理,此处的样本清洗处理是指去除多个负样本中与正样本相似的负样本的处理;然后采用多个正样本和样本清洗处理后的负样本对预估模型进行训练优化,得到优化的预估模型。

其中,根据多个正样本对多个负样本进行样本清洗处理的一种实施方式可以是:首先,可将多个正样本任意划分为第一正样本集合以及第二正样本集合,并为第一正样本集合添加第一标签(第一标签的取值为1);采用第二正样本集合中的正样本和多个负样本构建负样本集合,并为负样本集合添加第二标签(第二标签的取值为-1)。其次,采用第一正样本集合和第一标签、以及负样本集合和第二标签训练分类模型;采用训练后的分类模型对各个负样本进行样本类别预测,得到各个负样本为正样本的预测概率。由于预测概率越大,表示负样本与正样本的相似度越大;预测概率越小,表示负样本与正样本的相似度越小;因此,在得到各个负样本为正样本的预测概率后,可将预测概率小于概率阈值的负样本作为样本清洗后的负样本。

或者,根据多个正样本对多个负样本进行样本清洗处理的另一种实施方式可以是:首先,采用多个正样本构建正样本集合,并为正样本集合添加第一标签(第一标签的取值为1);采用多个负样本构建负样本集合,并为负样本集合添加第二标签(第二标签的取值为-1)。其次,采用正样本集合和第一标签、以及负样本集合和第二标签训练分类模型;采用训练后的分类模型对各个负样本进行样本类别预测,得到各个负样本为正样本的预测概率。然后,可将预测概率小于概率阈值的负样本作为样本清洗后的负样本。

或者,根据多个正样本对多个负样本进行样本清洗处理的一种实施方式可以是:采用1-dnf算法(一种样本清洗算法),根据多个正样本对多个负样本进行样本清洗处理。

s403,调用优化的预估模型根据候选用户集中各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率。

在得到优化的预估模型之后,可直接调用优化的预估模型根据候选用户集中各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率。

需要说明的是,针对上述步骤s402-s403:在其它实施例中,当人群定向目标为联合曝光率和点击率进行人群定向时,预估模型可分别包括曝光预估模型和点击预估模型等两个模型。此情况下,在步骤s402中,可采用参考用户集和候选用户集分别对曝光预估模型和点击预估模型进行训练优化,得到优化的曝光预估模型和优化的点击预估模型。在具体实施过程中,针对曝光预估模型:可以从历史投放流水表中选取存在广告曝光行为的历史用户的属性数据作为曝光正样本,以及对候选用户集中不存在广告曝光行为的候选用户的属性数据进行随机抽样得到曝光负样本;采用曝光正样本和曝光负样本对曝光预估模型进行训练优化,得到优化的曝光预估模型。针对点击预估模型:可以从历史投放流水表中选取存在广告点击行为的历史用户的属性数据作为点击正样本,以及对参考用户集中存在广告曝光行为且不存在广告点击行为的参考用户的属性数据进行随机抽样得到点击负样本;采用点击正样本和点击负样本对点击预估模型进行训练优化,得到优化的点击预估模型。

相应的,在步骤s403中,针对任一候选用户,可调用优化的曝光预估模型根据该候选用户的属性数据对候选用户进行曝光预估,得到该候选用户的曝光率;以及调用优化的点击预估模型根据该候选用户的属性数据对候选用户进行点击预估,得到该候选用户的点击率;然后计算候选用户的曝光概率和该候选用户的点击概率的乘积,得到该候选用户的定向概率。重复执行上述步骤,可以得到各个候选用户的定向概率。

s404,根据各候选用户的定向概率从候选用户集中筛选出定向用户的属性数据,并将定向用户的属性数据添加至目标广告的定向人群数据中。

s405,存储目标广告的定向人群数据,并输出定向人群数据的属性信息。

在得到目标广告的定向人群数据之后,服务器可将该定向人群数据进行存储,以便于后续可基于该定向人群数据进行广告投放。在一种实施方式中,服务器可直接将目标广告的定向人群数据存储至数据库中;再一种实施方式中,服务器也可以对目标广告的定向人群数据进行压缩处理,将压缩处理后的定向人群数据存储至数据库中,以节省数据库的存储空间。

另外,服务器在得到目标广告的定向人群数据之后,还可获取该定向人群数据的属性信息,并输出该属性信息。其中,属性信息至少包括:数据名称及数据数量;此处的数据名称用于标识此次得到的定向人群数据,其可以是服务器随机设置的,也可以是广告主预先设置的,如数据1、数据a等。数据数量是指定向人群数据所对应的定向用户的数量;例如,定向人群数据包括5个定向用户的属性数据,那么定向人群数据所对应的定向用户的数量则为5,即数据数量便为5;又如,定向人群数据包括100个定向用户的属性数据,那么定向人群数据所对应的定向用户的数量则为100,即数据数量便为100。

s406,若检测到基于定向人群数据进行广告投放的触发事件,则在定向人群数据所对应的定向人群中投放目标广告。

在一种实施方式中,广告主可以根据自身的需求选择何时进行广告投放;此情况下,广告投放的触发事件可以包括:检测到广告主选择基于该定向人群数据进行广告投放的广告投放操作的事件。再一种实施方式中,服务器也可以自动进行广告投放;此情况下,广告投放的触发事件可以包括:检测到满足目标广告的广告投放条件的事件;此处的广告投放条件可包括但不限于:获取到定向人群数据的条件、或者获取到定向人群数据且经过预设时长后的条件。

服务器在检测到触发事件之后,便可响应于该触发事件,在定向人群数据所对应的定向人群中投放目标广告。具体的,可以获取定向人群数据中的各个定向用户的用户标识,将目标广告下发至各个定向用户的用户标识所关联的用户账号中,以实现在定向人群中投放该目标广告。

本发明实施例在人群定向的过程中,可先获取目标广告的参考用户集和候选用户集;其中,参考用户集包括多个参考用户的属性数据,候选用户集包括多个候选用户的属性数据。由于参考用户是指能够对目标用户产生正向反馈的用户,而候选用户是待定向的用户;因此可先采用参考用户集和候选用户集对预估模型进行训练优化,然后调用优化的预估模型根据各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率;这样可使得预估模型的训练空间和预测空间是一致的,从而提高各候选用户的定向概率的准确性。由于定向概率是指候选用户对目标广告产生正向反馈概率,因此可根据各候选用户的定向概率从候选用户集中筛选并添加定向用户的属性数据至目标广告的定向人群数据中;通过提高定向概率的准确性,可从而提高定向人群数据的准确性。

基于上述的描述,本发明实施例还提出了一种基于上述人群定向方法进行广告投放的应用场景;在此应用场景中,以采用曝光率和点击率联合训练的方式对预估模型进行训练优化为例进行说明。当广告主想要投放目标广告a时,可以登陆广告系统,如图5a所示。在成功登录广告系统之后,广告主可以点击用户界面中的创建按钮以进入定向条件的设置界面,如图5b所示。在该设置界面中,可包括多个定向条件:种子人群、定向人群数量、是否包含种子人群、扩展倾向(人群定向目标)、广告媒体平台、号码类型,等等。其中,种子人群可至少对应三个选项:广告主上传、第三方客户端上报、服务器自动确定。扩展倾向用于确定人群定向目标,如当扩展倾向为广告曝光,则人群定向目标为以曝光率为基准进行人群定向;当扩展倾向为广告点击,则人群定向目标为以点击率为基准进行人群定向,等等。

广告主可结合自身的广告需求,对这多个定向条件进行设置。例如,广告主设置的定向条件为:服务器自动确定种子人群、定向人群数量为500人、不包含种子人群、通过自定义方式设置扩展倾向为广告曝光点击、投放平台不限、号码类型为qq号。广告主在设置好这些定向条件之后,可点击提交按钮,此时广告系统的前端可根据广告主的设置信息生成人群定向请求,并将该人群定向请求发送至服务器。此处的人群定向请求至少携带以下信息:定向人群数量(500人)、目标广告的人群定向目标(联合曝光率和点击率进行人群定向且曝光率的权重等于点击率的权重)、广告系统的平台标识等等。相应的,服务器可接收该人群定向请求,并响应于该人群定向请求,进行后续的人群定向处理以得到目标广告的定向人群数据;其人群定向处理的具体实施过程可一并参见图5c所示:

服务器可获取目标广告的人群定向目标;具体的,可通过解析人群定向请求的方式获取人群定向目标。在获取到人群定向目标之后,可按照人群定向目标,从广告投放流水表中获取正样本;由于人群定向目标为联合曝光率和点击率进行人群定向且曝光率的权重等于点击率的权重,因此可将历史投放流水表中存在广告点击行为的历史用户的属性数据作为参考用户的属性数据,对参考用户的属性数据进行特征拼接得到正样本。然后为了均衡正样本和负样本之间的数量,可以根据正样本的数量确定负样本的数量。由于人群定向请求携带广告系统的平台标识,因此可采用广告系统中近期活跃的广告用户的属性数据构建候选用户集。在得到负样本的数量之后,可按照人群定向请求从候选用户集中抽样得到相应数量的负样本。具体的,由于人群定向请求为联合曝光率和点击率进行人群定向且曝光率的权重等于点击率的权重,因此可对候选用户集进行随机抽样,得到负样本。

由于负样本中可能存在于正样本相似的负样本,因此还可对负样本进行样本清洗以去除负样本中与正样本相似的负样本。在进行样本清洗之后,可以采用样本清洗后的负样本和正样本进行模型的优化训练、广告定向预估、定向人群数据生成的一系列处理。具体的,可采用样本清洗后的负样本和正样本对预估模型进行训练优化,得到优化的预估模型;其次,调用优化的预估模型根据各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率。然后,可按照定向概率从大到小的顺序,对候选用户集中各候选用户的属性数据进行排序,得到排序集合;根据定向人群数量(即500人)依次从排序集合中选取相应的候选用户的属性数据作为定向用户的属性数据,并将选取得到的各个定向用户的属性数据添加至定向人群数据中。服务器在得到定向人群数据后,可存储该人群定向数据,并输出定向人群数据的属性信息,如图5d所示。

广告主可获取到此次的定向人群数据之后,若想直接进行广告投放,则可通过点击“投放”按钮触发服务器直接基于该定向人群数进行目标广告的广告投放。若广告主此时不想进行广告投放,可以通过点击“退出”按钮退出广告系统,也可以通过点击“返回”按钮再次返回到定向条件的设置界面,并再次设置不同的定向条件。在重新设置不同的定向条件之后,仍可通过点击“提交”按钮触发前端再次向服务器发送人群定向请求;相应的,服务器可再次根据前端所发送的人群定向请求,再次进行人群定向处理得到另一个定向人群数据,并存储该再次得到的定向人群数据以及输出该再次得到的定向人群数据的属性信息(如数据名称为定向人群2、数据数量为100人)…以此类推。

当广告主想要投放目标广告时,可以选择至少一个定向人群数据进行广告投放,如图5e所示;前端若检测到广告主点击“投放”按钮的操作时,可向服务器发送广告投放的触发事件。相应的,服务器在检测到该触发事件之后,可根据广告主所选择的定向人群数据进行广告投放;具体的,服务器可获取广告主所选择的定向人群数据中的各个定向用户的用户标识,将目标广告下发至各个定向用户的用户标识所关联的用户账号中,以实现在定向人群中投放该目标广告。可选的,服务器成功投放目标广告之后,可输出反馈信息,如图5e所示。

由此可见,本发明实施例在广告投放的过程中,可先采用正样本和负样本对预估模型进行训练优化,然后调用优化的预估模型根据各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率。由于负样本是从候选用户集中抽样得到的,因此可避免训练空间和预测空间产生空间偏移的现象,可保证预估模型的训练空间和预测空间是一致的,从而提高各候选用户的定向概率的准确性。由于定向概率是指候选用户对目标广告产生正向反馈概率,因此可根据各候选用户的定向概率从候选用户集中筛选并添加定向用户的属性数据至目标广告的定向人群数据中;通过提高定向概率的准确性,可从而提高定向人群数据的准确性,进而可提高目标广告的曝光率和点击率。

基于上述人群定向方法实施例的描述,本发明实施例还公开了一种人群定向装置,所述人群定向装置可以是运行于服务器中的一个计算机程序(包括程序代码)。该人群定向装置可以执行图2或图4所示的方法。请参见图6,所述人群定向装置可以运行如下单元:

获取单元101,用于获取目标广告的参考用户集和候选用户集;所述参考用户集包括多个参考用户的属性数据,所述参考用户是指能够对所述目标广告产生正向反馈的用户;所述候选用户集包括多个候选用户的属性数据,所述候选用户是待定向的用户;

优化单元102,用于采用所述参考用户集和所述候选用户集对预估模型进行训练优化,得到优化的预估模型;

处理单元103,用于调用所述优化的预估模型根据所述候选用户集中各候选用户的属性数据对所述各候选用户进行广告定向预估,得到所述各候选用户的定向概率,所述定向概率是指候选用户对所述目标广告产生正向反馈的概率;

所述处理单元103,用于根据所述各候选用户的定向概率从所述候选用户集中筛选出定向用户的属性数据,并将所述定向用户的属性数据添加至所述目标广告的定向人群数据中。

在一种实施方式中,获取单元101在用于获取目标广告的参考用户集时,具体用于:

接收目标广告的人群定向请求,所述人群定向请求携带种子用户名单,所述种子用户名单中包括多个种子用户的属性数据,所述用户名单是由广告主上传的或者是由第三方客户端上报的,所述第三方客户端是指能够对所述目标广告对应的广告对象进行业务处理的客户端;

将所述种子用户名单中各种子用户的属性数据作为参考用户的属性数据添加至目标广告的参考用户集中。

再一种实施方式中,获取单元101在用于获取目标广告的参考用户集时,具体用于:

接收目标广告的人群定向请求,所述人群定向请求携带所述目标广告的人群定向目标;

获取所述目标广告的历史投放流水表,所述历史投放流水表中至少包括历史用户的属性数据和行为数据,所述历史用户的行为数据用于指示所述历史用户针对所述目标广告是否存在广告曝光行为和广告点击行为;

按照所述人群定向目标从所述历史投放流水表中获取参考用户的属性数据,并将所述参考用户的属性数据添加至所述目标广告的参考用户集中。

再一种实施方式中,获取单元101在用于按照所述人群定向目标从所述历史投放流水表中获取参考用户的属性数据时,具体用于:

若所述人群定向目标为以曝光率为基准进行人群定向,则将所述历史投放流水表中存在广告曝光行为的历史用户的属性数据作为参考用户的属性数据;

若所述人群定向目标为以点击率为基准进行人群定向,或者为联合曝光率和点击率进行人群定向且曝光率的权重等于或小于点击率的权重,则将所述历史投放流水表中存在广告点击行为的历史用户的属性数据作为参考用户的属性数据;

若所述人群定向目标为联合曝光率和点击率进行人群定向且曝光率的权重大于点击率的权重,则将对所述历史投放流水表中存在广告曝光行为的历史用户的属性数据进行抽样得到的属性数据作为参考用户的属性数据,及将所述历史投放流水表中存在广告点击行为的历史用户的属性数据作为参考用户的属性数据。

再一种实施方式中,优化单元102在用于采用所述参考用户集和所述候选用户集对预估模型进行训练优化,得到优化的预估模型时,具体用于:

将所述参考用户集中各参考用户的属性数据作为正样本,所述正样本的数量和参考用户的数量相同;

根据所述目标广告的人群定向目标,对所述参考用户集及所述候选用户集进行抽样得到多个负样本;

采用多个正样本和所述多个负样本对所述预估模型进行训练优化,得到优化的预估模型。

再一种实施方式中,所述候选用户集还包括各候选用户的行为数据,所述候选用户的行为数据用于指示所述候选用户针对所述目标广告是否存在广告曝光行为和广告点击行为;相应的,优化单元102在用于根据所述目标广告的人群定向目标,对所述参考用户集及所述候选用户集进行抽样得到多个负样本时,具体用于:

若所述人群定向目标为以曝光率为基准进行人群定向,则对所述候选用户集中不存在广告曝光行为的候选用户的属性数据进行随机抽样,得到负样本;

若所述人群定向目标为以点击率为基准进行人群定向,则对所述参考用户集中存在广告曝光行为且不存在广告点击行为的参考用户的属性数据进行随机抽样,得到负样本;

若所述人群定向目标为联合曝光率和点击率进行人群定向且曝光率的权重等于或大于点击率的权重,则对所述候选用户集进行随机抽样,得到负样本;

若所述人群定向目标为联合曝光率和点击率进行人群定向且曝光率的权重小于点击率的权重,则将对所述候选用户集进行随机抽样得到的候选用户的属性数据作为负样本,且将所述参考用户集中存在广告曝光行为且不存在广告点击行为的参考用户的属性数据进行随机抽样得到的属性数据作为负样本。

再一种实施方式中,优化单元102在用于采用多个正样本和所述多个负样本对所述预估模型进行训练优化,得到优化的预估模型时,具体用于:

根据所述多个正样本对所述多个负样本进行样本清洗处理,所述样本清洗处理是指去除所述多个负样本中与正样本相似的负样本的处理;

采用所述多个正样本和样本清洗处理后的负样本对所述预估模型进行训练优化,得到优化的预估模型。

再一种实施方式中,所述人群定向请求携带定向人群数量;相应的,处理单元103在用于根据所述各候选用户的定向概率从所述候选用户集中筛选出定向用户的属性数据时,具体用于:

按照定向概率从大到小的顺序,对所述候选用户集中各候选用户的属性数据进行排序,得到排序集合;

根据所述定向人群数量依次从所述排序集合中选取相应的候选用户的属性数据作为定向用户的属性数据。

再一种实施方式中,所述人群定向请求还携带将所述目标广告定向至各参考用户的指示信息;相应的,处理单元103在用于根据所述定向人群数量依次从所述排序集合中选取相应的候选用户的属性数据作为定向用户的属性数据时,具体用于:

求取所述定向人群数量和所述参考用户的数量之间的差值,得到筛选数量;并根据所述筛选数量依次从所述排序集合中选取相应的候选用户的属性数据作为定向用户的属性数据;

处理单元103还可用于:将所述参考用户集中的各参考用户的属性数据添加至所述目标广告的定向人群数据中。

再一种实施方式中,处理单元103还可用于:

存储所述目标广告的定向人群数据,并输出所述定向人群数据的属性信息,所述属性信息至少包括:数据名称及数据数量;

若检测到基于所述定向人群数据进行广告投放的触发事件,则在所述定向人群数据所对应的定向人群中投放所述目标广告。

根据本发明的一个实施例,图2或图4所示的方法所涉及的各个步骤均可以是由图6所示的人群定向装置中的各个单元来执行的。例如,图2中所示的步骤s201-s202可以分别由图6中所示的获取单元101和优化单元102来执行,步骤s203和s204可由图6中所示的处理单元103来执行;又如,图4中所示的步骤s401-s402可以分别由图6中所示的获取单元101和优化单元102来执行,步骤s403-s406可由图6中所示的处理单元103来执行。

根据本发明的另一个实施例,图6所示的人群定向装置中的各个单元可以分别或全部合并为一个或若干个另外的单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的多个单元来构成,这可以实现同样的操作,而不影响本发明的实施例的技术效果的实现。上述单元是基于逻辑功能划分的,在实际应用中,一个单元的功能也可以由多个单元来实现,或者多个单元的功能由一个单元实现。在本发明的其它实施例中,基于人群定向装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由多个单元协作实现。

根据本发明的另一个实施例,可以通过在包括中央处理单元(cpu)、随机存取存储介质(ram)、只读存储介质(rom)等处理元件和存储元件的例如计算机的通用计算设备上运行能够执行如图2或图4中所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图6中所示的人群定向装置设备,以及来实现本发明实施例的人群定向方法。所述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。

本发明实施例在人群定向的过程中,可先获取目标广告的参考用户集和候选用户集;其中,参考用户集包括多个参考用户的属性数据,候选用户集包括多个候选用户的属性数据。由于参考用户是指能够对目标用户产生正向反馈的用户,而候选用户是待定向的用户;因此可先采用参考用户集和候选用户集对预估模型进行训练优化,然后调用优化的预估模型根据各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率;这样可使得预估模型的训练空间和预测空间是一致的,从而提高各候选用户的定向概率的准确性。由于定向概率是指候选用户对目标广告产生正向反馈概率,因此可根据各候选用户的定向概率从候选用户集中筛选并添加定向用户的属性数据至目标广告的定向人群数据中;通过提高定向概率的准确性,可从而提高定向人群数据的准确性。

基于上述方法实施例以及装置实施例的描述,本发明实施例还提供一种服务器;该服务器可以是上述所提及的广告系统的后台服务器。请参见图7,该服务器至少包括处理器201、通信接口202以及计算机存储介质203。其中,通信接口202可包括射频收发器,服务器可通过该射频收发器与其他设备进行数据传输。服务器内的处理器201、通信接口202以及计算机存储介质203可通过总线或其他方式连接。

计算机存储介质203可以存储在服务器的存储器中,所述计算机存储介质203用于存储计算机程序,所述计算机程序包括程序指令,所述处理器201用于执行所述计算机存储介质203存储的程序指令。处理器201(或称cpu(centralprocessingunit,中央处理器))是服务器的计算核心以及控制核心,其适于实现一条或多条指令,具体适于加载并执行一条或多条指令从而实现相应方法流程或相应功能;在一个实施例中,本发明实施例所述的处理器201可以用于对目标广告进行一系列的人群定向处理,其具体可包括:

获取目标广告的参考用户集和候选用户集;所述参考用户集包括多个参考用户的属性数据,所述参考用户是指能够对所述目标广告产生正向反馈的用户;所述候选用户集包括多个候选用户的属性数据,所述候选用户是待定向的用户;

采用所述参考用户集和所述候选用户集对预估模型进行训练优化,得到优化的预估模型;

调用所述优化的预估模型根据所述候选用户集中各候选用户的属性数据对所述各候选用户进行广告定向预估,得到所述各候选用户的定向概率,所述定向概率是指候选用户对所述目标广告产生正向反馈的概率;

根据所述各候选用户的定向概率从所述候选用户集中筛选出定向用户的属性数据,并将所述定向用户的属性数据添加至所述目标广告的定向人群数据中。

本发明实施例还提供了一种计算机存储介质(memory),所述计算机存储介质是服务器中的记忆设备,用于存放程序和数据。可以理解的是,此处的计算机存储介质既可以包括服务器中的内置存储介质,当然也可以包括服务器所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了服务器的操作系统。并且,在该存储空间中还存放了适于被处理器201加载并执行的一条或多条的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速ram存储器,也可以是非不稳定的存储器(non-volatilememory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器的计算机存储介质。

在一个实施例中,可由处理器201加载并执行计算机存储介质中存放的一条或多条指令,以实现上述有关人群定向方法实施例中的方法的相应步骤;具体实现中,计算机存储介质中的一条或多条指令由处理器201加载并执行如下步骤:

获取目标广告的参考用户集和候选用户集;所述参考用户集包括多个参考用户的属性数据,所述参考用户是指能够对所述目标广告产生正向反馈的用户;所述候选用户集包括多个候选用户的属性数据,所述候选用户是待定向的用户;

采用所述参考用户集和所述候选用户集对预估模型进行训练优化,得到优化的预估模型;

调用所述优化的预估模型根据所述候选用户集中各候选用户的属性数据对所述各候选用户进行广告定向预估,得到所述各候选用户的定向概率,所述定向概率是指候选用户对所述目标广告产生正向反馈的概率;

根据所述各候选用户的定向概率从所述候选用户集中筛选出定向用户的属性数据,并将所述定向用户的属性数据添加至所述目标广告的定向人群数据中。

在一种实施方式中,在获取目标广告的参考用户集时,所述一条或多条指令还可由处理器201加载并具体执行:

接收目标广告的人群定向请求,所述人群定向请求携带种子用户名单,所述种子用户名单中包括多个种子用户的属性数据,所述用户名单是由广告主上传的或者是由第三方客户端上报的,所述第三方客户端是指能够对所述目标广告对应的广告对象进行业务处理的客户端;

将所述种子用户名单中各种子用户的属性数据作为参考用户的属性数据添加至目标广告的参考用户集中。

再一种实施方式中,在获取目标广告的参考用户集时,所述一条或多条指令还可由处理器201加载并具体执行:

接收目标广告的人群定向请求,所述人群定向请求携带所述目标广告的人群定向目标;

获取所述目标广告的历史投放流水表,所述历史投放流水表中至少包括历史用户的属性数据和行为数据,所述历史用户的行为数据用于指示所述历史用户针对所述目标广告是否存在广告曝光行为和广告点击行为;

按照所述人群定向目标从所述历史投放流水表中获取参考用户的属性数据,并将所述参考用户的属性数据添加至所述目标广告的参考用户集中。

再一种实施方式中,在按照所述人群定向目标从所述历史投放流水表中获取参考用户的属性数据时,所述一条或多条指令还可由处理器201加载并具体执行:

若所述人群定向目标为以曝光率为基准进行人群定向,则将所述历史投放流水表中存在广告曝光行为的历史用户的属性数据作为参考用户的属性数据;

若所述人群定向目标为以点击率为基准进行人群定向,或者为联合曝光率和点击率进行人群定向且曝光率的权重等于或小于点击率的权重,则将所述历史投放流水表中存在广告点击行为的历史用户的属性数据作为参考用户的属性数据;

若所述人群定向目标为联合曝光率和点击率进行人群定向且曝光率的权重大于点击率的权重,则将对所述历史投放流水表中存在广告曝光行为的历史用户的属性数据进行抽样得到的属性数据作为参考用户的属性数据,及将所述历史投放流水表中存在广告点击行为的历史用户的属性数据作为参考用户的属性数据。

再一种实施方式中,在采用所述参考用户集和所述候选用户集对预估模型进行训练优化,得到优化的预估模型时,所述一条或多条指令还可由处理器201加载并具体执行:

将所述参考用户集中各参考用户的属性数据作为正样本,所述正样本的数量和参考用户的数量相同;

根据所述目标广告的人群定向目标,对所述参考用户集及所述候选用户集进行抽样得到多个负样本;

采用多个正样本和所述多个负样本对所述预估模型进行训练优化,得到优化的预估模型。

再一种实施方式中,所述候选用户集还包括各候选用户的行为数据,所述候选用户的行为数据用于指示所述候选用户针对所述目标广告是否存在广告曝光行为和广告点击行为;相应的,在根据所述目标广告的人群定向目标,对所述参考用户集及所述候选用户集进行抽样得到多个负样本时,所述一条或多条指令还可由处理器201加载并具体执行:

若所述人群定向目标为以曝光率为基准进行人群定向,则对所述候选用户集中不存在广告曝光行为的候选用户的属性数据进行随机抽样,得到负样本;

若所述人群定向目标为以点击率为基准进行人群定向,则对所述参考用户集中存在广告曝光行为且不存在广告点击行为的参考用户的属性数据进行随机抽样,得到负样本;

若所述人群定向目标为联合曝光率和点击率进行人群定向且曝光率的权重等于或大于点击率的权重,则对所述候选用户集进行随机抽样,得到负样本;

若所述人群定向目标为联合曝光率和点击率进行人群定向且曝光率的权重小于点击率的权重,则将对所述候选用户集进行随机抽样得到的候选用户的属性数据作为负样本,且将所述参考用户集中存在广告曝光行为且不存在广告点击行为的参考用户的属性数据进行随机抽样得到的属性数据作为负样本。

再一种实施方式中,在采用多个正样本和所述多个负样本对所述预估模型进行训练优化,得到优化的预估模型时,所述一条或多条指令还可由处理器201加载并具体执行:

根据所述多个正样本对所述多个负样本进行样本清洗处理,所述样本清洗处理是指去除所述多个负样本中与正样本相似的负样本的处理;

采用所述多个正样本和样本清洗处理后的负样本对所述预估模型进行训练优化,得到优化的预估模型。

再一种实施方式中,所述人群定向请求携带定向人群数量;相应的,在根据所述各候选用户的定向概率从所述候选用户集中筛选出定向用户的属性数据时,所述一条或多条指令还可由处理器201加载并具体执行:

按照定向概率从大到小的顺序,对所述候选用户集中各候选用户的属性数据进行排序,得到排序集合;

根据所述定向人群数量依次从所述排序集合中选取相应的候选用户的属性数据作为定向用户的属性数据。

再一种实施方式中,所述人群定向请求还携带将所述目标广告定向至各参考用户的指示信息;相应的,在根据所述定向人群数量依次从所述排序集合中选取相应的候选用户的属性数据作为定向用户的属性数据时,所述一条或多条指令还可由处理器201加载并具体执行:

求取所述定向人群数量和所述参考用户的数量之间的差值,得到筛选数量;并根据所述筛选数量依次从所述排序集合中选取相应的候选用户的属性数据作为定向用户的属性数据;

所述一条或多条指令还可由处理器201加载并具体执行:将所述参考用户集中的各参考用户的属性数据添加至所述目标广告的定向人群数据中。

再一种实施方式中,所述一条或多条指令还可由处理器201加载并具体执行:

存储所述目标广告的定向人群数据,并输出所述定向人群数据的属性信息,所述属性信息至少包括:数据名称及数据数量;

若检测到基于所述定向人群数据进行广告投放的触发事件,则在所述定向人群数据所对应的定向人群中投放所述目标广告。

本发明实施例在人群定向的过程中,可先获取目标广告的参考用户集和候选用户集;其中,参考用户集包括多个参考用户的属性数据,候选用户集包括多个候选用户的属性数据。由于参考用户是指能够对目标用户产生正向反馈的用户,而候选用户是待定向的用户;因此可先采用参考用户集和候选用户集对预估模型进行训练优化,然后调用优化的预估模型根据各候选用户的属性数据对各候选用户进行广告定向预估,得到各候选用户的定向概率;这样可使得预估模型的训练空间和预测空间是一致的,从而提高各候选用户的定向概率的准确性。由于定向概率是指候选用户对目标广告产生正向反馈概率,因此可根据各候选用户的定向概率从候选用户集中筛选并添加定向用户的属性数据至目标广告的定向人群数据中;通过提高定向概率的准确性,可从而提高定向人群数据的准确性。

以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1