一种广告投放效果评估方法、装置及电子设备与流程

文档序号:16090123发布日期:2018-11-27 22:54阅读:111来源:国知局

本发明实施例涉及互联网直播技术领域,尤其涉及一种广告投放效果评估方法、装置及电子设备。



背景技术:

广告作为互联网直播公司的主要经济来源之一,如何有效的进行广告投放是直播公司必须掌握的技能。

当前对于广告的投放分为两种模式:批量投放和基于个性化推荐的投放。其中,批量投放是对所有用户都推送相同的广告信息,这种模式是大多数互联网公司能够做到的;基于个性化推荐的投放是按照用户的喜好进行的定点投放,其根据收集到的用户特征分析出包括用户性别、年龄以及购物习惯等信息给用户投放相应的广告,尽最大可能地满足用户的需求。

无论是批量投放还是基于个性化推荐的投放,对其投放效果进行评估都是非常有必要的事情,以根据广告的投放效果调整广告投放策略,实现更佳的广告投放。目前对广告投放效果的评估,一般是通过线下采用用户对广告点击率的提升来评估投放效果,但这种方法具有一定的缺陷性,例如,不能实时反映用户的需求,往往用户的需求是随时间变化的,线下处理显然不够及时。



技术实现要素:

本发明实施例提供一种广告投放效果评估方法、装置及电子设备,通过所述方法可以实时地对广告的投放效果进行评估。

为实现上述目的,本发明实施例采用如下技术方案:

第一方面,本发明实施例提供了一种广告投放效果评估方法,所述方法包括:实时获取每条投放广告对应的反馈信息;

基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块;

通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心;

将预设的各局部聚类模块运算得到的多个聚类中心实时地发送至全局聚类模块;

通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心;

根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估;

其中,所述预设的多个局部聚类模块的数量为至少两个,所述反馈信息包括投放广告的属性信息以及用户对所述投放广告的需求信息。

进一步的,所述基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块,包括:

通过反馈信息分发模块基于时间顺序对每条投放广告对应的反馈信息进行时间编号;

将每条所述反馈信息对应的时间编号分别与预设的局部聚类模块的总个数进行取余操作,得到取余结果;

将所述反馈信息分配至序号为所述取余结果的局部聚类模块。

进一步的,所述通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心,包括:

通过所述全局聚类模块基于K-means++聚类算法对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心。

进一步的,所述根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估,包括:

分别计算各所述目标聚类中心对应的类簇中所述反馈信息的数量;

根据各类簇中所述反馈信息的数据量对每条投放广告的投放效果进行评估。

进一步的,所述通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心之后,所述方法还包括:

将所述第二设定数量的目标聚类中心发送至先验知识存储模块,以使所述先验知识存储模块对其存储的先验知识进行更新。

进一步的,在所述通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心之前,所述方法还包括:

从所述先验知识存储模块中获取先验知识;

基于所述先验知识对所述局部聚类模块进行初始化。

进一步的,还包括:通过特征向量的方式对每个类簇中的元素进行数据压缩处理。

进一步的,所述通过特征向量的方式对每个类簇中的元素进行数据压缩处理,包括:

按照如下公式对每个类簇中的元素进行数据压缩处理:

其中,表示类簇c的特征向量,表示类簇c中各元素的各维度特征值的平方和,表示类簇c中各元素的各维度特征值的和,CF2t表示类簇c中各元素对应的时间编号的平方和,CF1t表示类簇c中各元素对应的时间编号的和,n为类簇c内元素的数量。

进一步的,所述通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心,包括:

分别计算所述反馈信息与所述局部聚类模块中已有的各类簇对应的聚类中心之间的距离;

若所述反馈信息与所述各类簇中的其中一个类簇对应的聚类中心之间的距离小于所述其中一个类簇的邻域半径,则将所述反馈信息融入至所述其中一个类簇中,并基于设定聚类算法对所述局部聚类模块中当前的各类簇进行运算,得到第一设定数量的聚类中心;

若所述反馈信息与所述各类簇对应的聚类中心之间的距离均不小于所述各类簇对应的邻域半径,则对所述局部聚类模块中已有的各类簇进行合并或者删除操作,并以所述反馈信息为元素创建一个新的类簇,并基于设定聚类算法对所述局部聚类模块中当前的各类簇进行运算,得到第一设定数量的聚类中心。

进一步的,所述各类簇对应的邻域半径为:

其中,r(c)表示类簇c对应的邻域半径,other表示距离类簇c最近的类簇,nc表示类簇c中元素的数量,nother表示类簇other中元素的数量,表示类簇c中元素的均方根值,表示类簇c中元素的平均值,表示与之间的欧氏距离,表示类簇other中元素的平均值,表示与之间的欧氏距离。

进一步的,所述对所述局部聚类模块中已有的各类簇进行合并或者删除操作,包括:

基于所述局部聚类模块中已有的各类簇中元素的数量以及元素的新旧程度确定各类簇的活跃程度;

若存在活跃程度低于设定值的类簇,则将活跃程度低于设定值的类簇删除;

若不存在活跃程度低于设定值的类簇,则将距离最近的两个类簇合并成一个类簇。

进一步的,所述基于所述局部聚类模块中已有的各类簇中元素的数量以及元素的新旧程度确定各类簇的活跃程度,包括:

统计所述各类簇中最新的设定数量的元素的融入时间;

计算所述各类簇中最新的设定数量的元素的平均融入时间;

将所述各类簇中最新的设定数量的元素的平均融入时间确定为各类簇的活跃程度。

进一步的,所述将距离最近的两个类簇合并成一个类簇,包括:

将所述距离最近的两个类簇分别对应的特征向量相加;

将相加之后的特征向量作为所述距离最近的两个类簇合并之后的新类簇的特征向量。

第二方面,本发明实施例提供了一种广告投放效果评估装置,所述装置包括:

获取模块,用于实时获取每条投放广告对应的反馈信息;

分配模块,用于基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块;

第一聚类模块,用于通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心;

发送模块,用于将预设的各局部聚类模块运算得到的多个聚类中心实时地发送至全局聚类模块;

第二聚类模块,用于通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心;

评估模块,用于根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估;

其中,所述预设的多个局部聚类模块的数量为至少两个,所述反馈信息包括投放广告的属性信息以及用户对所述投放广告的需求信息。

第三方面,本发明实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的广告投放效果评估方法。

第四方面,本发明实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时实现如上述第一方面所述的广告投放效果评估方法。

本发明实施例提供的一种广告投放效果评估方法,首先通过至少两个局部聚类模块分别对投放广告的反馈信息进行分布式聚类运算,然后再由全局聚类模块对各分布式局部聚类模块运算得到的聚类中心进行再次聚类,最终得到目标聚类中心,根据目标聚类中心以及投放广告的反馈信息对各投放广告的投放效果进行评估,实现了对广告的投放效果进行实时评估的目的,进而帮助广告运营人员及时调整投放策略,实现投放利益最大化,同时通过分布式聚类的方式,解决了单机聚类效率低的问题。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。

图1为本发明实施例一提供的一种广告投放效果评估方法流程示意图;

图2为本发明实施例二提供的一种广告投放效果评估方法流程示意图;

图3为本发明实施例二提供的一种广告投放效果评估架构示意图;

图4为本发明实施例三提供的一种广告投放效果评估方法流程示意图;

图5为本发明实施例四提供的一种广告投放效果评估装置结构示意图;

图6为本发明实施例五提供的一种电子设备的结构示意图。

具体实施方式

为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例一

图1为本发明实施例一提供的一种广告投放效果评估方法流程示意图。本实施例公开的广告投放效果评估方法可以由广告投放效果评估装置来执行,其中该装置可由软件和/或硬件实现,并一般集成在终端中,例如服务器等。具体参见图1所示,该方法包括如下步骤:

110、实时获取每条投放广告对应的反馈信息。

其中,所述反馈信息包括投放广告的属性信息以及用户对所述投放广告的需求信息。所述属性信息具体可以指投放广告的类型(如电器、书籍等);投放广告的位置,具体指广告在投放网站的位置;投放广告的加载速度以及投放广告的来源(例如淘宝、京东等)等。所述用户对投放广告的需求信息具体指用户是否点击查看了投放的广告,若用户点击查看了投放的广告,则表示用户对该广告有需求,若很多的用户点击查看了该广告,则表示该广告的投放效果是好的,该广告的投放是成功的。

具体的,所述每条投放广告对应的反馈信息可以采用如下格式进行表示:info=(uid,ad_type,ad_pos,type,speed,source,gif,size)各字段的含义如下表1所示;

其中,所述曝光指用户是否看到了投放的广告,所述标志点击指用户是否点击了投放的广告,上述表1中示出的投放广告的各字段信息均由后台服务器根据用户的行为实时反馈。

120、基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块。

具体的,所述设定规则可以是将各投放广告对应的反馈信息平均分配至预设的各局部聚类模块,以使各局部聚类模块具有相同的负荷,使各局部聚类模块尽可能具有相同的聚类速度,提高对广告投放效果评估的实时性。

示例性的,可通过如下方式实现将各投放广告对应的反馈信息平均分配至预设的各局部聚类模块:

通过反馈信息分发模块基于时间顺序对每条投放广告对应的反馈信息进行时间编号;

将每条所述反馈信息对应的时间编号分别与预设的局部聚类模块的总个数进行取余操作,得到取余结果;

将所述反馈信息分配至序号为所述取余结果的局部聚类模块。

后台反馈的每条投放广告对应的反馈信息均经过所述反馈信息分发模块,由所述反馈信息分发模块基于时间顺序对每条投放广告对应的反馈信息进行时间编号,例如所述反馈信息分发模块中可设置计数器,从0开始计数,每来一条反馈信息则将当前的计数值赋给所述反馈信息,以作为所述反馈信息的时间编号,同时计数器的计数值加1。在对各局部聚类模块进行初始化时,为各局部聚类模块设置相应的序号,本实施例以三个局部聚类模块为例,其对应的序号分别为0、1和2,通过将每条所述反馈信息对应的时间编号分别与预设的局部聚类模块的总个数进行取余操作,得到取余结果,例如,假设某反馈信息的时间编号为5,5与3进行取余数操作,取余结果为2,则将该反馈信息分配至编号为2的局部聚类模块。

其中,所述局部聚类模块的数量可以进行拓展,并不局限于3个,由于投放广告的数据量很大,与各投放广告对应的反馈信息的数据量也很庞大,因此通过设置多个分布式的局部聚类模块共同对各投放广告对应的反馈信息进行聚类运算,可提高聚类速度以及处理能力,以提高广告投放效果评估的实时性。

进一步的,在将反馈信息分配至预设的局部聚类模块之前会利用先验知识对所述预设的各局部聚类模块进行初始化,使各局部聚类模具有一定数量的类簇,以提高对新的反馈信息进行聚类运算的速度。所述先验知识通常为预先对一定数量的反馈信息进行聚类得到的设定数量的聚类中心,利用先验知识对所述预设的各局部聚类模块进行初始化,具体为:将预先得到的设定数量的聚类中心保存至各局部聚类模块。

130、通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心。

具体的,通过所述局部聚类模块对所述反馈信息进行聚类运算为:通过特定的聚类算法将新来的反馈信息融入至局部聚类模块中已有的聚类中心对应的类簇中并更新当前类簇的聚类中心,或者以所述新来的反馈信息为聚类中心新建一个类簇,并基于一定规则删除或者合并局部聚类模块中已有的类簇,以保证聚类中心的数量不变。

所述特定的聚类算法可以是DBSCAN算法,DBSCAN算法是一种基于密度的优秀聚类算法,不需要预先设定分类的个数,能够有效的发现噪音点,但是其时间复杂度很大,在数据量巨大的情况下聚类速度急剧下降,本实施例通过分布式局部聚类的方式对巨大的数据量进行分布式分散,以解决聚类速度急剧下降的问题。

140、将预设的各局部聚类模块运算得到的多个聚类中心实时地发送至全局聚类模块。

其中,预设的各局部聚类模块并行工作,分别对分配过来的各投放广告对应的反馈信息进行聚类运算,并将各布局聚类模块得到多个聚类中心实时地发送至全局聚类模块。

150、通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心。

具体的,由于全局聚类模块要处理的聚类中心的数据量相比于局部聚类模块处理的反馈信息的数据量要小的多,因此,全局聚类模块可以采用聚类质量较高的算法对所述多个聚类中心进行处理。由于传统的聚类算法需要对待聚类数据集进行不止一次的全盘扫描,所以在全局聚类模块中可以采用任务机制。所述任务机制具体指在每一批聚类中心(来自多个局部聚类模块的聚类中心)到达时就新建一个事务来临时存储聚类中心、运行聚类算法和记录聚类结果,执行完这三个流程之后会自动关闭。为了灵活地控制聚类的数目且不需要数据特征的先验知识,全局聚类模块可以采用基于划分的聚类算法K-means++对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心。

K-means++聚类算法的流程如下:

输入:k—目标聚类中心的数目,D—包含n个来个局部聚类模块的聚类中心的数据集

输出:k个目标聚类中心的集合

1)从D中选择k个对象作为初始聚类中心;

2)根据D中每个对象的均值,计算每个对象与上述k个初始聚类中心之间的距离,并根据最小距离将D中的每个对象划分至相应的初始聚类中心对应的类簇中;

3)重新计算每个元素发生变化的类簇的均值(即聚类中心);

4)循环执行步骤2)-3),直到聚类中心不再发生变化,聚类结束。

上述步骤1)从D中选择k个对象作为初始聚类中心的过程具体可以为:

设置种子点seeds=0;

从D中随机选择一个对象作为第一个聚类中心;

seeds++;

若seeds<k,则,对数据集D中所有没有被选为聚类中心的对象x,计算其与已选为聚类中心的对象之间的距离d(x);

选择一个对象作为聚类中心,选择的原则是:d(x)越大,选对象x为聚类中心的概率越大;

seeds++;

若seeds=k,则结束。

160、根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估。

具体的,分别计算各所述目标聚类中心对应的类簇中所述反馈信息的数量;

根据各类簇中所述反馈信息的数据量对每条投放广告的投放效果进行评估。

当得到目标聚类中心时,分别计算各所述目标聚类中心对应的类簇中所述反馈信息的数量,元素数量越多的类簇,表示该类簇中的反馈信息对应的广告的投放效果越好。

本实施例提供的一种广告投放效果评估方法,首先通过分布式局部聚类模块分别对投放广告的反馈信息进行聚类运算,然后再由全局聚类模块对各分布式局部聚类模块运算得到的聚类中心进行再次聚类,最终得到目标聚类中心,根据目标聚类中心以及投放广告的反馈信息对各投放广告的投放效果进行评估,实现了对广告的投放效果进行实时评估的目的,进而帮助广告运营人员及时调整投放策略,实现投放利益最大化,同时通过分布式聚类的方式,解决了单机聚类效率低的问题。

实施例二

图2为本发明实施例二提供的一种广告投放效果评估方法流程示意图。在上述实施例的基础上,本实施例进行了优化,进一步,将全局聚类模块输出的目标聚类中心反馈给先验知识存储模块,以使所述先验知识存储模块对其存储的先验知识进行更新,并且在每次通过局部聚类模块对反馈信息进行聚类运算之前,从所述先验知识存储模块中获取最新的先验知识,这样优化的好处是使整个评估系统达到状态平衡,进一步提高了局部聚类模块在线聚类的速度、准确性和实时性。具体参见图2所示,该方法包括如下步骤:

210、实时获取每条投放广告对应的反馈信息。

220、基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块。

230、从所述先验知识存储模块中获取先验知识,并基于所述先验知识对所述局部聚类模块进行初始化。

其中,从所述先验知识存储模块中获取先验知识具体为从所述先验知识存储模块中获取设定数量的最新的聚类中心,并利用最新的聚类中心替换已有的相对较旧的聚类中心,同时清空所述局部模块已有的类簇。所述最新的指时间戳最新,例如:聚类中心a的时间戳为2018.06.19日的10:01,分,而聚类中心b的时间戳为2018.06.19日的10.02分,则聚类中心b相对聚类中心a为较新的聚类中心。设定数量的最新的聚类中心具体为:假设所述先验知识存储模块中共有a、b、c、d和e5个聚类中心,各聚类中心对应的时间戳分别为同日的10:01、10:02、10:03、10:04和10:05,则从中获取3个最新的聚类中心为:获取聚类中心c、d和e。

240、通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心。

250、将预设的各局部聚类模块运算得到的多个聚类中心实时地发送至全局聚类模块。

260、通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心。

270a、根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估。

270b、将所述第二设定数量的目标聚类中心发送至先验知识存储模块,以使所述先验知识存储模块对其存储的先验知识进行更新。

具体的,所述先验知识存储模块将接收到的目标聚类中心与其存储的聚类中心进行时间戳比对,并利用新的聚类中心替换旧的聚类中心,最终使先验知识存储模块中的聚类中心维持在设定数量即可。在第一次向先验知识存储模块反馈目标聚类中心之前,先验知识存储模块中存储的先验知识是根据预先保存在系统磁盘上的设定数量的反馈信息数据基于传统聚类算法运算得到的设定数量的聚类中心以及对应的类簇。

可参见图3所示的一种广告投放效果评估架构图,具体包括:先验知识存储模块310,用于接收初始化输入以及全局聚类模块340反馈的目标聚类中心,并将最新的目标聚类中心发送至局部聚类模块330,以对局部聚类模块330进行初始化;反馈信息分发模块320,用于对每条投放广告对应的反馈信息基于所述反馈信息到达该模块的时间顺序进行时间编号,并将所述反馈信息平均分配至预设的局部聚类模块330;局部聚类模块330用于对分配来的反馈信息进行在线聚类运算,得到第一设定数量的聚类中心,并将该聚类中心发送至全局聚类模块340;全局聚类模块340用于对接收到的多个第一设定数量的聚类中心进行再次聚类运算,得到目标聚类中心,并将目标聚类中心输出的同时实时反馈至先验知识存储模块310。

本实施例提供的一种广告投放效果评估方法,通过将全局聚类模块输出的目标聚类中心反馈给先验知识存储模块,以使所述先验知识存储模块对其存储的先验知识进行更新,并且在每次通过局部聚类模块对反馈信息进行聚类运算之前,从所述先验知识存储模块中获取最新的先验知识,并基于该最新的先验知识进行初始化,实现了整个评估系统的状态平衡,进一步提高了局部聚类模块在线聚类的速度、准确性和实时性。

实施例三

图4为本发明实施例三提供的一种广告投放效果评估方法流程示意图。在上述实施例的基础上,本实施例进行了进一步优化。在反馈信息数据流处理的过程中,高速的数据流通和信息交互给网络带来了很大的压力,本实施例通过采用特征向量的方式对每个类簇中的元素进行数据压缩处理,提高了数据流通、交互的速度,保证了数据质量。具体参见图4所示,该方法包括如下步骤:

410、实时获取每条投放广告对应的反馈信息。

420、基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块。

430、通过特征向量的方式对每个类簇中的元素进行数据压缩处理。

具体的,按照如下公式对每个类簇中的反馈信息进行数据压缩处理:

其中,表示类簇c的特征向量,表示类簇c中各元素的各维度特征值的平方和,表示类簇c中各元素的各维度特征值的和,CF2t表示类簇c中各元素对应的时间编号的平方和,CF1t表示类簇c中各元素对应的时间编号的和,n为类簇c内元素的数量。

440、分别计算所述反馈信息与所述局部聚类模块中已有的各类簇对应的聚类中心之间的距离。

具体的,通过计算反馈信息的特征平均值与各类簇的特征平均值之间的欧氏距离作为所述反馈信息与各类簇对应的聚类中心之间的距离。

所述反馈信息的特征平均值为其中,表示反馈信息各维度特征值的和,各类簇的特征平均值为其中,表示类簇c中各元素的各维度特征值的和,n为类簇c内元素的数量。

450a、若所述反馈信息与所述各类簇中的其中一个类簇对应的聚类中心之间的距离小于所述其中一个类簇的邻域半径,则将所述反馈信息融入至所述其中一个类簇中,并基于设定聚类算法对所述局部聚类模块中当前的各类簇进行运算,得到第一设定数量的聚类中心。

450b、若所述反馈信息与所述各类簇对应的聚类中心之间的距离均不小于所述各类簇对应的邻域半径,则对所述局部聚类模块中已有的各类簇进行合并或者删除操作,并以所述反馈信息为元素创建一个新的类簇,并基于设定聚类算法对所述局部聚类模块中当前的各类簇进行运算,得到第一设定数量的聚类中心。

具体的,所述各类簇对应的邻域半径为:

其中,r(c)表示类簇c对应的邻域半径,other表示距离类簇c最近的类簇,nc表示类簇c中元素的数量,nother表示类簇other中元素的数量,表示类簇c中元素的均方根值,表示类簇c中元素的平均值,表示与之间的欧氏距离,表示类簇other中元素的平均值,表示与之间的欧氏距离。

示例性的,所述对所述局部聚类模块中已有的各类簇进行合并或者删除操作,包括:

基于所述局部聚类模块中已有的各类簇中元素的数量以及元素的新旧程度确定各类簇的活跃程度;

若存在活跃程度低于设定值的类簇,则将活跃程度低于设定值的类簇删除;

若不存在活跃程度低于设定值的类簇,则将距离最近的两个类簇合并成一个类簇。

其中,选择需要进行合并或删除的类簇时需要考虑到类簇中元素个数的多少以及当前类簇对整个局部聚类模块的贡献性,其中贡献性由类簇的新旧程度决定。如果一个类簇的元素个数很少,但都是新到的元素,直接进行类簇删除操作势必会引起错误,因此需要综合考虑类簇的新旧程度和元素个数。在一些情况下,一个已经存在的类簇经过历史数据流后积累了大量的元素,但它在最近的一段时间内不再接受新的元素,这样的类簇不再是活跃的,对整个局部聚类模块的贡献也应该进行削弱。

为了度量一个类簇的活跃程度,需要使用统计的方式对每个类簇最近接受的元素做分析,考虑到系统对存储空间的限制,每个类簇只保存最近m个元素的到达时间(m远小于类簇中的元素个数),这m个元素采用队列的存储结构,以保证先进先出的顺序。计算出队列中的时间平均值与当前系统时间的1/n做对比来判断类簇是否是活跃状态,

进一步的,所述基于所述局部聚类模块中已有的各类簇中元素的数量以及元素的新旧程度确定各类簇的活跃程度,包括:

统计所述各类簇中最新的设定数量的元素的融入时间;

计算所述各类簇中最新的设定数量的元素的平均融入时间;

将所述各类簇中最新的设定数量的元素的平均融入时间确定为各类簇的活跃程度。

假设Q表示m个最新的元素融入当前簇的融入时间组成的队列,current表示当前系统时间,若Q中各成员的和/m>=current/n,则Q所在的类簇为活跃簇,n通常取值为2。

进一步的,所述将距离最近的两个类簇合并成一个类簇,包括:

将所述距离最近的两个类簇分别对应的特征向量相加;

将相加之后的特征向量作为所述距离最近的两个类簇合并之后的新类簇的特征向量。

具体的,局部聚类模块接受新反馈信息过程的伪代码如下:

输入:

tr—新到达的反馈信息

t_last—当前局部聚类模块中的先验知识时间戳

t_current—先验知识存储模块存储的时间戳

clusterNum—当前局部聚类模块的类簇个数

输出:clusterNum个聚类中心

(1)if t_current>t_last;

(2)当前局部聚类模块初始化;//即从先验知识存储模块中获取设定数量的最新的聚类中心

(3)计算tr到所有类簇的聚类中心的距离,找到距离最近的类簇c;

(4)if tr到c中心的距离小于c的邻域半径:

(5)tr融入c中;

(6)else:

(7)if clusterNum>=MaxClusterNum:

(8)计算每个类簇的活跃性;

(9)if不存在非活跃类簇;

(10)对距离最近的两个类簇进行合并;

(11)clusterNum﹣=1;

(12)else:

(13)删除平均到达时间最早的非活跃簇;

(14)clusterNum﹣=1;

(15)以tr为元素新建一个新类簇;

(16)clusterNum+=1;

其中MaxClusterNum是局部聚类模块最多可容纳的类簇数目,在初始化局部聚类模块的时候指定。局部聚类模块中的类簇数目达到MaxClusterNum后,就会进入一种平衡的状态,各类簇中心在数据变化不剧烈的情况下也将处于稳定。

460、将预设的各局部聚类模块运算得到的多个聚类中心实时地发送至全局聚类模块。

470、通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心。

480、根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估。

本实施例提供的一种广告投放效果评估方法,通过采用特征向量的方式对每个类簇中的元素进行数据压缩处理,提高了数据流通、交互的速度,保证了数据质量;若新来的反馈信息不符合融入至当前局部聚类模块已存在的各类簇的融入条件,则通过删除非活跃类簇或者合并类簇并以新来的反馈信息为中心新建一个类簇的方式,保证了当前局部聚类模块中的类簇数目维持不变,同时确保了线聚类的准确性和实时性。

实施例四

图5为本发明实施例四提供的一种广告投放效果评估的装置结构示意图。参见图5所示,所述装置包括:获取模块510,分配模块520,第一聚类模块530,发送模块540,第二聚类模块550和评估模块560;

其中,获取模块510,用于实时获取每条投放广告对应的反馈信息;分配模块520,用于基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块;第一聚类模块530,用于通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心;发送模块540,用于将预设的各局部聚类模块运算得到的多个聚类中心实时地发送至全局聚类模块;第二聚类模块550,用于通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心;评估模块560,用于根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估;所述预设的多个局部聚类模块的数量为至少两个,所述反馈信息包括投放广告的属性信息以及用户对所述投放广告的需求信息。

本实施例提供的广告投放效果评估的装置,首先通过分布式局部聚类模块分别对投放广告的反馈信息进行聚类运算,然后再由全局聚类模块对各分布式局部聚类模块运算得到的聚类中心进行再次聚类,最终得到目标聚类中心,根据目标聚类中心以及投放广告的反馈信息对各投放广告的投放效果进行评估,实现了对广告的投放效果进行实时评估的目的,进而帮助广告运营人员及时调整投放策略,实现投放利益最大化,同时通过分布式聚类的方式,解决了单机聚类效率低的问题。

实施例五

图6为本发明实施例三提供的一种电子设备的结构示意图。如图6所示,该电子设备包括:处理器670、存储器671及存储在存储器671上并可在处理器670上运行的计算机程序;其中,处理器670的数量可以是一个或多个,图6中以一个处理器670为例;处理器670执行所述计算机程序时实现如上述实施例中所述的广告投放效果评估方法。如图6所示,所述电子设备还可以包括输入装置672和输出装置673。处理器670、存储器671、输入装置672和输出装置673可以通过总线或其他方式连接,图6中以通过总线连接为例。

存储器671作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中广告投放效果评估的装置/模块(例如,广告投放效果评估的装置中的获取模块510、分配模块520等)。处理器670通过运行存储在存储器671中的软件程序、指令以及模块,从而执行电子设备的各种功能应用以及数据处理,即实现上述的广告投放效果评估方法。

存储器671可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器671可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器671可进一步包括相对于处理器670远程设置的存储器,这些远程存储器可以通过网络连接至电子设备/存储介质。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置672可用于接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入。输出装置673可包括显示屏等显示设备。

实施例六

本发明实施例六还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种广告投放效果评估方法,该方法包括:

实时获取每条投放广告对应的反馈信息;

基于设定规则将所述反馈信息分配至预设的多个局部聚类模块中的其中一个局部聚类模块;

通过所述局部聚类模块对所述反馈信息进行聚类运算,得到第一设定数量的聚类中心;

将预设的各局部聚类模块运算得到的多个聚类中心实时地发送至全局聚类模块;

通过所述全局聚类模块对接收到的多个聚类中心进行聚类运算,得到第二设定数量的目标聚类中心;

根据所述第二设定数量的目标聚类中心以及所述反馈信息对每条投放广告的投放效果进行评估;

其中,所述预设的多个局部聚类模块的数量为至少两个,所述反馈信息包括投放广告的属性信息以及用户对所述投放广告的需求信息。

当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的广告投放效果评估的相关操作。

通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,存储介质,或者网络设备等)执行本发明各个实施例所述的。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1