一种基于用户行为的广告点击率预测方法和装置的制作方法

文档序号:6434931阅读:142来源:国知局
专利名称:一种基于用户行为的广告点击率预测方法和装置的制作方法
技术领域
本发明涉及广告点击率预测、用户行为分析、回归模型,具体涉及试图通过分析用户的网络浏览或搜索行为对其行为进行建模分析,从而预测其对投放广告的点击率。
背景技术
互联网的兴起使人们可以在浏览相同页面时看到不同的广告,实现广告的个性化展示。通过这种方式,可以向每个用户更精准的展示其可能感兴趣的广告,从而提高广告的点击率,改善广告投放效果。现有广告精准投放策略主要包括如下三类搜索触发(sponsored search)、内容 IZ5K (content match)、tf 为胃向(behavioral targeting)。其中,搜索触发策略包括根据用户向搜索引擎提交的关键词来进行广告检索,由于关键词直接反映了用户当前的兴趣,故可以向用户推送与当前搜索内容相关的广告。内容匹配策略则包括对用户正在浏览的网页的内容进行建模分析,向用户展示与网页内容相近的广告。行为定向策略包括根据用户的历史行为记录对其兴趣进行建模分析,向用户展示符合其兴趣特点的广告。当不同用户浏览同一页面或提交相同的查询请求时,所看到的广告也是不同的。搜索触发和内容匹配两类技术并没用考虑用户的个性化兴趣,不同用户搜索同一关键词或浏览同一网页时,所展示的广告往往是相同的,而在实际应用中,两个用户浏览同一页面或进行同一查询时,其关注点可能并不相同。而行为定向方法则较少的考虑用户在同一类别中的大量广告中的偏好,即同一用户在浏览不同页面时可能会展现相同的广告。 因此,现有技术中的广告投放策略没有较好地考虑用户个性化兴趣,不能较为精确地预测用户对广告的点击率,从而不能精准地投放用户感兴趣的广告。

发明内容
为了解决上述技术问题,本发明提供了一种将行为定向方法与内容匹配/搜索触发方法进行结合的基于用户行为的两阶段广告点击率预测方法和系统,目的是帮助广告主比较方便定位可能对其广告感兴趣的用户群体,同时在向用户投放广告时充分考虑用户的当前浏览或检索行为所反映的兴趣点,以增强广告投放效果,本发明将行为定向方法与内容匹配/搜索触发方法进行结合,以充分利用不同方法的优势。本发明提供了一种基于用户行为的广告点击率预测方法,其特征在于,包括以下步骤行为定向预测步骤,通过分析用户行为来训练行为定向模型,根据所述行为定向模型预测所述用户对不同类别广告的点击率,得到点击率预测值;类别内排序步骤,根据所述用户当前行为类型对每个类别内的广告排序,得到类别内广告排序列表;综合排序步骤,基于所述点击率预测值和所述类别内广告排序列表对所有广告的点击率进行排序,得到综合排序列表。
进一步,该方法还包括,所述行为定向预测步骤具体包括以下步骤步骤A,获取与所述用户点击广告的行为相关的用户特征信息;步骤B,根据所述用户特征信息分别得到用户行为信息和融合特征信息,分别得到用户行为信息和融合特征信息,其中所述用户行为信息为与用户感兴趣的广告类别相关的信息,所述融合特征信息为将所述用户特征信息中的各类特征进行合并得到的信息;步骤C,基于所述用户行为信息和所述融合特征信息训练行为定向模型;步骤D,利用所述行为定向模型预测所述用户对不同类别广告的点击率,得到所述点击率预测值。进一步,该方法还包括,所述类别内排序步骤具体包括以下步骤步骤E,根据所述点击率预测值得到所述用户所感兴趣的每个类别的广告列表;步骤F,基于所述用户当前的行为类型分别对所述每个类别的广告列表中的广告进行排序,得到所述类别内广告排序列表。进一步,该方法还包括,所述综合排序步骤进一步包括根据所述综合排序列表, 向所述用户展示预定数量的点击率最高的广告。进一步,该方法还包括,所述步骤C中包括展示预测模型训练和点击预测模型训练,以得到点击预测模型的权重矩阵和展示预测模型的权重矩阵。进一步,该方法还包括,所述点击预测模型训练包括以下步骤步骤C11,初始化广告类别的权重矩阵;步骤C12,基于所述权重矩阵计算所述用户对每个类别广告的点击次数预测值;步骤C13,依据所述点击次数预测值,更新所述权重矩阵;步骤C14,重复步骤 C12和C13,进行迭代处理,直至过程收敛或达到预定的迭代次数,得到所述点击预测模型的权重矩阵。进一步,该方法还包括,所述展示预测模型训练包括以下步骤步骤C21,初始化广告类别的权重矩阵;步骤C22,基于所述权重矩阵计算所述用户对每个类别广告的展示次数预测值;步骤C23,依据所述展示次数预测值,更新所述权重矩阵;步骤C24,重复步骤 C22和C23,进行迭代处理,直至过程收敛或达到预定的迭代次数,得到所述展示预测模型的权重矩阵。进一步,该方法还包括,在所述步骤D中,根据所述点击预测模型的权重矩阵计算点击预测次数,根据所述展示预测模型的权重矩阵计算展示预测次数,基于所述点击预测次数和所述展示预测次数得到所述点击率预测值。进一步,该方法还包括,在所述步骤F中,所述用户当前行为类型为利用搜索引擎进行搜索或浏览网页;如果所述用户当前的行为是利用搜索引擎进行搜索,则根据所述用户所提交的查询词采用搜索触发模型对类别内广告按点击率进行排序;如果所述用户当前的行为是浏览网页,则根据所述用户所浏览的网页内容,选用内容匹配模型对类别内广告按点击率进行排序。进一步,该方法还包括,在所述综合排序步骤中,将所述点击率预测值和所述广告排序列表中的点击率值进行乘积、线性加权或非线性组合,得到所述综合排序列表。本发明还提供一种基于用户行为的广告点击率预测装置,所述装置包括行为定向预测单元,用于通过分析用户行为来训练行为定向模型,根据所述行为定向模型预测所述用户对不同类别广告的点击率,得到点击率预测值;类别内排序单元,用于根据所述用户当前行为类型对每个类别内的广告排序,得到类别内广告排序列表;综合排序单元,用于基于所述点击率预测值和所述类别内广告排序列表对所有广告的点击率进行排序,得到综合排序列表。与现有技术相比,本发明至少具有以下优点本发明通过在行为定向方法的基础上引入第二步用户对类别内具体广告条目的点击预测,使本发明的方法能够对每个类别的广告建立预测模型,从而根据广告的类别特点对广告进行更精准的排序。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。


附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中图1是根据本发明实施例一的基于用户行为的广告点击率预测方法的流程图;图2是根据本发明实施例一的训练和预测行为定向模型的流程图;图3是根据本发明实施例一的利用搜索触发模型的类内广告排序的流程图;图4是根据本发明实施例二的基于用户行为的广告点击率预测装置结构框图。
具体实施例方式以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例以及各实施例中的各个特征可以相互结合, 所形成的技术方案均在本发明的保护范围之内。另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。实施例一图1示出了根据本发明实施例一的基于用户网络访问行为(本文中简称为用户行为)的广告点击率预测方法的流程图,下面参照图1详细说明本实施例方法的详细步骤。本实施例的方法总体包括两阶段,如图1中所示,细实线所示部分的第一阶段为行为定向阶段,粗实线所示的第二阶段为利用内容匹配/搜索触发方法的类别内排序阶段。第一阶段具体包括以下步骤步骤S110,获取与用户点击广告的行为相关的用户特征信息。具体的,根据用户的历史搜索报文、用户对网页的浏览报文及用户先前所点击或展示过的广告报文,分别得到用户的查询词特征、网站访问特征及网页相关特征、广告相关特征等用户特征信息。其中查询词特征为用户以前利用搜索引擎进行检索时的相关特征,如进行分词后的查询词相关的词频TF或词频-逆文档频度TF*IDF特征,所使用查询词的平均长度、个数等统计特征等。网站访问特征包括用户对不同网站的访问次数、停留时间等统计特征。网页相关特征包括用户以前所浏览过网页的内容所表示的特征集合,如内容相关的TF、TF*IDF特征,所浏览网页的类别、停留时间等。广告相关特征包括用户对不同类型广告的展示次数、点击次数,用户所点击/展示过广告的竞价词、内容描述相关特征以及广告的着陆页landing page本身的内容特征。步骤S120,根据获取的用户特征信息,分别得到用户行为信息和融合特征信息。具体的,根据步骤SllO所获取的用户的查询词特征、网站访问特征及网页相关特征、广告相关特征等,对用户的行为进行分析,以获得用户行为信息,例如,分析用户感兴趣的广告类别,以将与用户感兴趣的广告类别相关的信息作为用户行为信息。对获取的用户特征信息中不同的特征进行融合以获得融合特征信息,其中,特征融合是指将用户相关的各类特征进行合并,以从各个不同角度对用户行为进行描述,如用户所使用过的关键词、访问过的网站列表、访问过的网页相关特性、行为分析得到的用户感兴趣的广告类别等。其中关键词、网站及网页相关特征可以直接从报文或日志中得到,而用户感兴趣的广告类别无法直接从相关数据中获得,需要借助用户行为分析方法从报文中经分析得到。步骤S130,基于用户行为信息和融合特征信息训练行为定向模型。在用户行为分析所获得的用户行为信息的基础上,利用对特征融合所获得的融合特征信息,构建融合特征向量,以用户对每个类别广告的点击数据为目标值,来训练行为定向模型。行为定向模型的可选择常用的回归模型,例如泊松回归模型、支持向量机SVM模型、逻辑斯特模型和线性回归模型等。在本实施例中,仅以泊松回归模型为例进行说明。参照图2,具体说明利用泊松回归模型训练行为定向模型的过程。如图2上半部分所示,模型训练过程可分为广告的展示预测模型训练和点击预测模型训练两部分。在点击预测模型训练过程中,将本实施例中得到的用户的融合特征向量记为X,用户对各个类别广告的点击次数向量记为1,点击预测的泊松模型的权重矩阵记为ω,模型训练过程包括以下子步骤S131,初始化步骤,根据如下公式初始化广告类别的权重矩阵。
^ yikxIj
Γ π‘ Zj Xif
/ηΛ
、二I⑴
i其中,表示广告类别k在j维特征空间上的权重,yik表示用户i所点击过的类别k广告的次数,Xu为用户i在j维特征空间上的特征值。Xu,表示用户i的第j’维的特征值。计算得到的构成了权重矩阵ω。步骤S132,基于权重矩阵计算训练集中用户对每个类别广告的点击次数预测值。根据权重矩阵ω,计算训练集中用户对每个类别广告的点击次数预测值,公式如下λ = ωτχ(2)其中λ为泊松分布参数,即用户对广告的点击次数的预测值。步骤S133,根据计算得出点击次数预测值,更新权重矩阵,具体公式如下
权利要求
1.一种基于用户行为的广告点击率预测方法,其特征在于,包括以下步骤行为定向预测步骤,通过分析用户行为来训练行为定向模型,根据所述行为定向模型预测所述用户对不同类别广告的点击率,得到点击率预测值;类别内排序步骤,根据所述用户当前行为类型对每个类别内的广告排序,得到类别内广告排序列表;综合排序步骤,基于所述点击率预测值和所述类别内广告排序列表对所有广告的点击率进行排序,得到综合排序列表。
2.根据权利要求1所述的方法,其特征在于,所述行为定向预测步骤具体包括以下步骤步骤A,获取与所述用户点击广告的行为相关的用户特征信息; 步骤B,根据所述用户特征信息分别得到用户行为信息和融合特征信息,其中所述用户行为信息为与用户感兴趣的广告类别相关的信息,所述融合特征信息为将所述用户特征信息中的各类特征进行合并得到的信息;步骤C,基于所述用户行为信息和所述融合特征信息训练行为定向模型; 步骤D,利用所述行为定向模型预测所述用户对不同类别广告的点击率,得到所述点击率预测值。
3.根据权利要求1或2所述的方法,其特征在于,所述类别内排序步骤具体包括以下步骤步骤E,根据所述点击率预测值得到所述用户所感兴趣的每个类别的广告列表; 步骤F,基于所述用户当前的行为类型分别对所述每个类别的广告列表中的广告进行排序,得到所述类别内广告排序列表。
4.根据权利要求1或2所述的方法,其特征在于,所述综合排序步骤进一步包括 根据所述综合排序列表,向所述用户展示预定数量的点击率最高的广告。
5.根据权利要求2所述的方法,其特征在于,所述步骤C中包括展示预测模型训练和点击预测模型训练,以得到点击预测模型的权重矩阵和展示预测模型的权重矩阵。
6.根据权利要求5所述的方法,其特征在于,所述点击预测模型训练包括以下步骤 步骤Cll,初始化广告类别的权重矩阵;步骤C12,基于所述权重矩阵计算所述用户对每个类别广告的点击次数预测值; 步骤C13,依据所述点击次数预测值,更新所述权重矩阵;步骤C14,重复步骤C12和C13,进行迭代处理,直至过程收敛或达到预定的迭代次数, 得到所述点击预测模型的权重矩阵。
7.根据权利要求5所述的方法,其特征在于,所述展示预测模型训练包括以下步骤 步骤C21,初始化广告类别的权重矩阵;步骤C22,基于所述权重矩阵计算所述用户对每个类别广告的展示次数预测值; 步骤C23,依据所述展示次数预测值,更新所述权重矩阵;步骤C24,重复步骤C22和C23,进行迭代处理,直至过程收敛或达到预定的迭代次数, 得到所述展示预测模型的权重矩阵。
8.根据权利要求5至7任一项所述的方法,其特征在于,在所述步骤D中,根据所述点击预测模型的权重矩阵计算点击预测次数,根据所述展示预测模型的权重矩阵计算展示预测次数,基于所述点击预测次数和所述展示预测次数得到所述点击率预测值。
9.根据权利要求3所述的方法,其特征在于,在所述步骤F中,所述用户当前行为类型为利用搜索引擎进行搜索或浏览网页;如果所述用户当前的行为是利用搜索引擎进行搜索,则根据所述用户所提交的查询词采用搜索触发模型对类别内广告按点击率进行排序;如果所述用户当前的行为是浏览网页,则根据所述用户所浏览的网页内容,选用内容匹配模型对类别内广告按点击率进行排序。
10.根据权利要求1所述的方法,其特征在于,在所述综合排序步骤中,将所述点击率预测值和所述广告排序列表中的点击率值进行乘积、线性加权或非线性组合,得到所述综合排序列表。
11.一种基于用户行为的广告点击率预测装置,所述装置包括行为定向预测单元,用于通过分析用户行为来训练行为定向模型,根据所述行为定向模型预测所述用户对不同类别广告的点击率,得到点击率预测值;类别内排序单元,用于根据所述用户当前行为类型对每个类别内的广告排序,得到类别内广告排序列表;综合排序单元,用于基于所述点击率预测值和所述类别内广告排序列表对所有广告的点击率进行排序,得到综合排序列表。
全文摘要
本发明公开了一种基于用户行为的广告点击率预测方法装置,该方法包括以下步骤行为定向预测步骤,通过分析用户行为来训练行为定向模型,根据所述行为定向模型预测所述用户对不同类别广告的点击率,得到点击率预测值;类别内排序步骤,根据所述用户当前行为类型对每个类别内的广告排序,得到类别内广告排序列表;综合排序步骤,基于所述点击率预测值和所述类别内广告排序列表对所有广告的点击率进行排序,得到综合排序列表。本发明的方法能够对每个类别的广告建立预测模型,从而根据广告的类别特点对广告进行更精准的排序。
文档编号G06F17/30GK102346899SQ20111030245
公开日2012年2月8日 申请日期2011年10月8日 优先权日2011年10月8日
发明者李娜, 罗峰, 黄苏支 申请人:亿赞普(北京)科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1