基于大数据实时定位用户的竞价原生广告奖励系统及方法与流程

文档序号：14947318发布日期：2018-07-17 21:48阅读：155来源：国知局

本发明涉及高效的海量数据算法以及大数据技术领域，更具体的说，涉及一种用于互联网广告海量数据快速定位用户的基于大数据实时定位用户行为的竞价原生广告奖励系统及方法。

背景技术：

在互联网广告行业里，由于互联网数据成量级的增长趋势，导致数据量非常的巨大，以及带来的用户行为分析、用户建模等问题越来越难，从而导致用户定位查询时，响应速度慢，查询时间长，算法效率低，甚至在数据量过于庞大，算法效率相对低下的情况下出现用户建模错误，用户定位失效等现象。

而由于在互联网广告系统里，为了使广告可以及时投放出去，常采用非精准定位投放算法，因此无法提高广告投放的质量，导致广告主资源的极大浪费。

技术实现要素：

本发明针对现有技术中存在的上述缺陷，提供了一种基于大数据实时定位用户行为的竞价原生广告奖励系统及方法，该系统解决了在海量大数据里进行用户模型的建立以及快速定位用户的问题。

为实现上述目的，本发明是通过以下技术方案实现的：

根据本发明的一个方面，提供了一种基于大数据实时定位用户行为的竞价原生广告奖励系统，包括数据采集中心、业务管理中心、数据分析中心以及广告智能投放引擎；其中：

所述数据采集中心，在时间维度上持续采集初始用户数据，并将采集的初始用户数据根据业务管理中心所配置的所需用户模型，进行用户数据建模及用户行为确认，形成可使用用户数据；

所述业务管理中心配置出可使用用户数据的用户特性以及模型参数；

所述数据分析中心包括用户数据部分和广告数据部分；当数据采集中心将海量的可使用用户数据传送至数据分析中心后，数据分析中心根据业务管理中心的模型参数，在多层维度上进行对应的用户数据校对和分析，形成用户数据样本；

所述广告智能投放引擎包括数据优化中心和投放体系，所述数据优化中心通过遗传算法对用户数据样本进行优化训练，形成优化后用户数据，所述投放体系将数据分析中心广告数据部分的广告数据针对优化后用户数据进行投放。

优选地，所述用户特性包括静态特征和动态特征，其中，所述静态特征包括手机号码、姓名、性别、年龄、城市、行业、收入水平和/或兴趣爱好，所述动态特征包括时间、点击次数和/或查看内容类别。

优选地，所述模型参数包括：

-用户属性，包括手机号码、姓名、性别、年龄、城市、行业、收入水平、兴趣爱好、时间特性等；

-投放策略属性，包括地域、时间段、频次、类型、操作系统、网络类型、用户年龄段、消费能力等。

优选地，所述遗传算法是基于误差传播的多层前馈网络算法。

优选地，所述多层前馈网络包括输入层、隐含层及输出层；所述输入层、隐含层及输出层分别由多个单元组成。

优选地，在多层前馈网络中，所述遗传算法将用户数据样本训练过程分为信息正向传播过程和误差反向传播过程；其中：

所述信息正向传播过程具体为：输入样本-＞输入层-＞隐含层-＞输出层；

所述误差反向传播过程具体为：输出误差-＞隐含层-＞输入层；

误差反向传播过程的主要目的是：通过将输出误差反传，将误差分摊给各层所有单元，从而获得各层单元的误差信号，进而修正各单元的权值；

其中，符号->表示输出至。

优选地，通过遗传算法优化训练用户数据样本，包括如下步骤：

步骤a，初始化k个串，具体为：从用户数据样本的m个用户特征中随机选出n个，n＜m，并对这n个用户特征组成的串进行编码，形成编码后的串，编码后的串为初始群体中的个体；

步骤b，根据步骤a中得到的多个串对应的用户特征分别进行训练，训练时间分别记为t1、t2……、tk，形成训练后的多层前馈网络，并用训练后的多层前馈网络进行预测，预测的结果的正确个数与总个数之比为正确率，k个串的正确率分别记为l1、l2、……lk；

步骤c，包括如下两个步骤：

-选出正确率最高的串k作为评价值最高的个体进行下一代的复制；

-选择出评价值最高的个体之后进行突变操作，根据突变概率q对编码后的串k中的每一个用户特征进行替换；

步骤d，重复操作步骤b至步骤c，经过N代迭代之后，第N+1代中评价值最高的个体即为最优解。

所述步骤c中，下一代的复制和突变操作，主要为了遗传特性和优化后代样本。

优选地，所述步骤d中，替换的规则是从m-n个剩下的用户特征当中随机选择一个进行。

根据本发明的第二个方面，提供了一种基于大数据实时定位用户行为的竞价原生广告奖励系统的执行方法，包括如下步骤：

步骤1，媒体客户端发起广告请求，并将用户数据传递给数据采集中心；

步骤2，数据采集中心首先校验用户数据的合法性，如果不合法，则返回错误信息；如果合法，则将用户数据通过数据分析中心推送至广告智能投放引擎内，广告智能投放引擎通过上述任一项所述的遗传算法进行用户数据优化筛选；

步骤3，用户数据经过用户模型预测和确定，广告智能投放引擎的投放体系运作广告投放选举算法；

步骤4，广告投放选举算法选取最符合当前用户模型的广告列表，然后将广告形成一份队列，按照设定的规则进行广告投放。

优选地，所述广告投放选举算法具体为：在根据区域、时间、类型等投放策略属性条件的筛选后，得到可投放的广告队列，可投放的广告队列中的每一个广告均有投放权重，在权重不同的情况下，选举权重最大的广告；在权重相同的情况下，依据上一次得到的广告，选举该广告后面的一条作为优先投放广告；如果此次投放为第一次投放或者上一次得到的广告为可投放的广告队列中的最后一个广告，则此次选举第一个广告为优先投放广告。

优选地，所述设定的规则根据客户所希望的用户属性设定；例如客户A希望定向投放到20～30岁年龄段的用户，且消费能力为中等，那此项规则就为：30＞年龄＞20，且消费能力＝中等。

与现有技术相比，本发明具有如下有益效果：

1、本发明提高了大数据的实时效率。

2、本发明提升了广告主的广告价值影响。

3、本发明在海量大数据里，实现了算法和架构的高效性。

4、本发明利用用户在互联网里的行为数据定位用户，并基于遗传算法优化广告投放方法。

5、本发明利用遗传算法，根据诸多维度，定期对用户数据进行行为上的分析，进而学习，最后通过学习累积后对用户的行为进行预测。

6、本发明具有分众性、定向性和互动性等特点。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1为本发明系统业务逻辑图；

图2为遗传算法的多层前馈网络结构拓补图。

具体实施方式

下面对本发明的实施例作详细说明：本实施例在以本发明技术方案为前提下进行实施，给出了详细的实施方式和具体的操作过程。应当指出的是，对本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

实施例

本实施例提供了一种基于大数据的高效实时定位用户行为的竞价原生广告奖励系统，包括数据采集中心、业务管理中心、数据分析中心以及广告智能投放引擎；

其中：

数据采集中心，会在时间维度上不停的采集初始用户数据，采集来的初始用户数据，会根据业务管理中心所配置的所需用户模型，进行用户数据建模及用户行为确认，形成可使用用户数据；

在业务管理中心配置出可使用用户数据的用户特性及模型参数，以备数据分析中心和广告智能投放引擎利用；

数据分析中心分为两部分，一部分为用户数据部分，一部分为广告数据部分；当数据采集中心将相应的海量可使用用户数据传送至数据分析中心后，数据分析中心会根据业务管理中心的模型参数，在多层维度上进行对应的用户数据校对和分析，形成用户数据样本；

广告智能投放引擎包含高效的遗传算法以及智能的投放体系；广告智能投放引擎通过遗传算法对用户数据样本进行优化训练，形成优化后用户数据，所述投放体系将数据分析中心广告数据部分的广告数据针对优化后用户数据进行投放。

上述遗传算法是基于误差传播的多层前馈网络算法，由输入层、隐含层及输出层三层构成，如图2所示，图中，A为输入层，B为隐含层，C为输出层，Wji为输入层与隐含层之间的连接权重，W1j为隐含层与输出层之间的连接权重，Xn为输入层第n个神经元(单元)的输入信号，Ym为输出层第m个神经元(单元)的输入信号，n和m分别为自然数。遗传算法把学习过程分为两个阶段：信息正向传播和误差反向传播，并且利用遗传算法优化训练用户数据样本，具体步骤如下：

步骤(1)，从用户数据样本的m个用户特征中随机选出n个，并对这n个用户特征组成的串进行编码；比如用户数据样本具有性别、年龄和收入三个用户特征，将这三个用户特征对应的数值分别用二进制表示并将用户特征组合到一起，编码后的串k即为初始群体中的个体，假设共初始化3个串，分别为k1，k2和k3；

步骤(2)，根据步骤(1)中3个串对应的用户特征分别训练，训练时间记为t1、t2和t3，并用训练之后的网络结构进行预测，预测的结果的正确个数与总个数之比为正确率，这3个串对应的正确率分别记为11，12和13；

步骤(3)，包括如下两个步骤：

-选出评价值最高个体(正确率最高个体)进行下一代的复制；

-选择出评价值最高个体之后进行突变操作，根据突变概率q对编码后的串k中的每一个用户特征进行替换，替换的规则是从m-n个剩下的用户特征当中随机选择一个进行；

步骤(4)重复执行步骤(2)至步骤(3)进行迭代，继续产生可执行的群体，经过N代迭代之后，第N+1代中评价值最高的个体即为最优解。

上述用户特征可分为静态特征和动态特征两类：静态特征包括：手机号码，姓名，性别，年龄，城市，行业，收入水平，兴趣爱好；动态特征包括时间、点击次数、查看内容类别。

进一步地，所述模型参数包括：用户属性(手机号码、姓名、性别、年龄、城市、行业、收入水平、兴趣爱好、时间特性等)，投放策略属性(地域、时间段、频次、类型、操作系统、网络类型、用户年龄段、消费能力等)。

根据上述诸多维度，遗传算法会定期对用户数据进行行为上的分析，进而学习，最后通过学习累积后进行对用户的行为预测。

本实施例提供的基于大数据的高效实时定位用户行为的竞价原生广告奖励系统，其奖励方法如图1所示；图中示意性的展示了一个广告系统的业务流程，其中主要包括了用户客户端的数据请求，以及广告如何进行智能投放，具体步骤如下：

步骤1，媒体客户端发起广告请求，并将用户数据传递给数据采集中心；

步骤2，数据采集中心先去校验用户数据的合法性，如果不合法，返回错误信息；如果合法，则将用户数据通过数据分析中心推送到广告智能投放引擎内，广告智能投放引擎通过遗传算法进行用户数据优化筛选；

步骤3，用户数据经过用户模型预测和确定，广告智能投放引擎的投放体系运行广告投放选举算法；

步骤4，广告投放选举算法将选取最符合当前这个用户模型的广告列表，然后将广告形成一份队列，按照设定的规则进行广告投放；

最终将最符合这个用户模型的广告呈现给这个用户。

进一步地，所述广告投放选举算法具体为：在根据区域、时间、类型等条件的筛选后，得到可投放的广告队列，每一个广告均有投放权重，在权重不同的情况下，选举权重最大的广告；在权重相同的情况下，依据上一次得到的广告，选举该广告后面的一条作为优先投放广告；如果此次为第一次或者上一次广告为队列最后一个，则此次选举第一个广告为优先投放广告。

进一步地，所述设定的规则根据客户希望的用户属性设定。

具体为，例如客户A希望定向投放到20～30岁年龄段的用户，且消费能力为中等，那此项规则就为：30＞年龄＞20，且消费能力＝中等。

以上对本发明的具体实施例进行了描述。需要理解的是，本发明并不局限于上述特定实施方式，本领域技术人员可以在权利要求的范围内做出各种变形或修改，这并不影响本发明的实质内容。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周晓波;
技术所有人：上海宾谷网络科技有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。