一种基于用户消费特征向量的手机广告投放方法与流程

文档序号:12008563阅读:198来源:国知局
本发明涉及一种基于用户消费特征向量的手机广告投放方法。属于手机广告、电信业务、数据挖掘和分析领域。

背景技术:
手机是一个个人媒体,所以对手机用户的分析以及免打扰机制变得非常重要。因为手机的个人媒体属性,决定了手机广告可以更加精准,更加符合广告主的投放要求。但是目前,各手机广告平台的用户数据分析系统常常只是通过用户所处的地理位置和时间(直接内存访问)、手机属性(包括手机型号、手机操作系统等)以及人口统计学特征(基于少量的注册信息),给广告主提供投放参考。还有一些运营商基于用户的电信服务品牌、ARPU值、GPRS流量、漫游次数等电信属性数据,运用聚类分析、分类分析等数据挖掘的方法把用户大致分为几个群体,给广告主提供投放参考。这些基于简单的静态数据对用户进行细分的方法,不但用户数据不能实时更新,细分的准确性得不到保证,而且目标用户真实的消费能力如何、消费倾向是什么也并不知晓,还做不到真正的精准投放。

技术实现要素:
针对现有技术存在的问题,本发明的目的在于提供一种基于用户消费特征向量的手机广告投放方法,本方法基于实时的、丰富的用户消费特征数据进行手机广告投放,对广告主来说更有意义。尤其是考虑到实际的产业环境,需要面对来自不同行业的各种各样的广告主的时候,更是如此。但是如何获得用户的消费行为特征进行用户细分,是业内颇具挑战性的问题。本发明的目的是提出一种基于用户消费特征向量的手机广告投放方法,本方法无需获取用户的性别、年龄等隐私信息(对用户本身是谁并不关心),利用用户在浏览移动互联网网页以及使用手机客户端时所透露的实时的兴趣、行为信息进行深入分析,通过向量的形式对用户进行标识。为了实现以上目的,本发明提出以下技术方案:一种基于用户消费特征向量的手机广告投放方法,其步骤为:1)手机广告发布服务器获取用户的移动互联网浏览内容,并对其进行分词并赋予分词权重,得到一用户关键词表向量;2)根据获取的移动互联网浏览内容构建相应用户的用户消费特征向量;3)从广告经验文本数据库中提取关键词并设定关键词权重,然后针对每一用户消费特征向量,构造一特征矩阵;4)对用户的用户关键词表向量、特征矩阵进行相似度计算,得出每位用户的用户消费特征向量各个分量的值;5)设定用户消费标签与用户的消费特征向量分量不同阈值范围之间的映射关系;6)手机广告发布服务器根据用户当前的消费特征向量各分量值和所述映射关系为每一用户标注相应的消费标签,并根据消费标签选取用户进行广告投放。进一步的,构建所述用户消费特征向量的方法为:根据获取的移动互联网浏览内容数据,选择几个热门行业作为分量构建所述用户消费特征向量。进一步的,所述特征矩阵的构造方法为:将所述消费特征向量的每个分量作为特征矩阵的一个行指标,提取的关键词作为特征矩阵的列指标,关键词在对应分量上的权重为矩阵元素;得到所述特征矩阵。进一步的,所述计算用户当前的消费特征向量各分量值的方法为:将所述用户关键词表向量与所述特征矩阵相乘,得出每位用户的消费特征向量各个分量值。进一步的,步骤1)中,所述手机广告发布服务器还获取用户的移动互联网浏览轨迹数据和移动客户端使用行为数据。进一步的,根据移动互联网浏览轨迹数据构建用户浏览轨迹消费特征向量;根据移动客户端使用行为数据构建用户使用行为消费特征向量。进一步的,对所述用户浏览轨迹消费特征向量进行相似度计算,得到用户浏览轨迹消费特征向量各分量的值,然后所述手机广告发布服务器根据用户消费标签与用户浏览轨迹消费特征向量分量不同阈值范围之间的映射关系,为每一用户标注相应的消费标签,并根据消费标签选取用户进行广告投放。进一步的,对所述用户使用行为消费特征向量进行相似度计算,得到用户使用行为消费特征向量各分量的值,然后所述手机广告发布服务器根据用户消费标签与用户使用行为消费特征向量分量不同阈值范围之间的映射关系,为每一用户标注相应的消费标签,并根据消费标签选取用户进行广告投放。进一步的,利用文本特征抽取技术提取关键词并设定关键词权重。进一步的,所述手机广告发布服务器为所述用户消费特征向量每一分量设定一衰减函数和一半衰期参数,将用户一段时间内的消费特征向量通过衰减函数做加权,求得用户在该段时间的消费特征向量值;所述消费标签根据用户消费特征向量分量的值实时更新。进一步的,构建所述广告经验文本数据库的方法为:首先分行业搜集关于广告的文本资料;然后基于已分好类的文本资料,应用文本特征抽取的方法,抽取出用户描述广告的关键词,得到所述广告经验文本数据库。进一步的,不同消费标签对应着用户消费向量不同的阈值范围,一个用户设有一个或多个消费标签;所述阈值范围为[0,1]。本发明的方法具体包括如下几个步骤,其处理流程如图所示:1)手机广告发布服务器通过各类数据库接口获得丰富的用户动态数据,如用户的移动互联网浏览轨迹和内容数据、移动客户端使用行为数据等。对于移动互联网页面内容数据,我们应用分词技术进行分析并赋予分词权重,得出用户关键词表向量;2)构建用户消费特征向量。用户消费特征向量可按照不同的维度灵活构建,对于移动互联网浏览轨迹数据,可以选择URL地址、浏览时间、浏览频次等几个分量构建向量,对于移动互联网浏览内容,可以选择几个热门行业作为分量构建向量,比如我们选择九类重点行业构造用户行业类消费特征向量[食品饮料,房地产,汽车,服装,美容,IT数码产品,游戏软件,金融保险,时尚奢侈品,其他行业],对于移动客户端使用行为数据,可以选择客户端型号、操作系统类型、常用APP类型等作为分量构建向量;3)通过用户的移动互联网浏览内容数据分析用户消费特征时,利用文本特征抽取技术从广告经验文本数据库(经验文本数据库可以是一已构建好的数据库,或者根据需要自己建立)中选出有代表性的关键词,设定关键词权重,为用户消费特征向量构造特征矩阵;对每个特定的用户消费特征向量,只有一个特征矩阵;特征矩阵构造方法:行指标由特征向量的各个分量组成,每个分量为一个行指标,列指标由关键词组成,这些关键词可以用来区别不同的行指标。以2)中提到的消费特征向量为例说明如何构造特征矩阵,将行业名称作为特征矩阵的行,将关键词列表作为特征矩阵的列名称,而矩阵元素表示列所对应的关键词表在行所对应的行业上的权重,具体权重计算根据历史或者经验数据计算后赋值,这样就组成了一个关于行业兴趣消费特征向量的特征矩阵;其中,广告经验文本数据库构建:首先,需要分行业广泛搜集关于广告的文本资料,如可以通过网络爬虫等技术从网络获取;然后基于已经分好类的文本,应用文本特征抽取的方法,如基于信息增益方法、基于熵的方法,抽取出用户描述广告的关键词,从而构成广告经验文本数据库。4)通过相似度计算,得出每位用户的消费特征向量各个分量的值;比如,将用户浏览行为数量化,即上述第1)步中经过赋权重的用户关键词表向量与特征矩阵的每个行相比,计算两个向量的相似度,即得到用户在特征向量每个分量的值;5)设定用户消费标签与用户消费特征向量分量不同阈值范围之间的映射关系;6)基于此映射关系,系统自动为所有用户标注相应的消费标签;通过设定衰减函数反映用户消费特征向量的实时变化,相应的用户的消费标签也会实时变化。7)手机广告发布服务器根据消费标签选取用户进行广告投放。所述发明中的“用户消费特征向量”,主要包含能够反映用户个体在消费行为方面的属性变量,比如1)中的用户行业类消费特征向量,通过这种向量标识用户对各个行业的消费倾向。所述发明中的“用户关键词表”,主要是指通过对用户浏览的移动互联网页面内容进行分词、权重计算后得出的关键词列表,可以通过这些关键词将用户个体“特征词”化;也就是说用几个词就可以简单的描述一个人的特征、喜欢的事物,就好像这个人的标签一样。所述发明中的“特征矩阵”,即由用户消费特征向量的每个分量在选出的主要关键词汇上的权重组成,而权重计算方式可以有多种算法,常见的有TF-IDF赋值法,布尔权重法,基于熵概念的权重法等多种权重赋值方式。除此之外,关于主要关键词的选择,也是特征矩阵计算的一个关键点,涉及的算法也比较丰富,基于不同的业务场景选择有效的算法,在此不再做赘述。所述发明中的“用户消费标签与用户消费特征向量分量不同阈值范围之间的映射关系”,以用户消费特征向量作为分析用户的基础数据,通过采用定性和定量的研究方法对特征向量进行挖掘分析,得出用户消费标签与用户消费特征向量分量不同阈值范围之间的映射关系。用户消费特征向量各个分量的阈值都在[0,1]之间,不同用户标签对应着分量不同的阈值。以用户行业类消费特征向量[食品饮料,房地产,汽车,服装,美容,IT数码产品,游戏软件,金融保险,时尚奢侈品,其他行业]为例,我们设定两个阈值0.4、0.7,如果用户A的汽车分量的阈值超过0.4,那系统自动为其标示为汽车爱好者,如果用户B的美容分量的阈值超过0.7,系统自动为其标示为美容达人。所述发明中的“消费标签”,是指直接面向广告主的、可以直接的、形象的反映广告主诉求的用户标识,不同消费标签对应着用户消费向量不同的阈值范围,一个用户可以拥有多个消费标签。所述发明中的“衰减函数”,是指能够反映用户的消费特征向量值伴随着用户的消费兴趣一天天发生变化的函数。设定一个时间窗,假设为s天,以s天相似度的加权平均值作为消费特征向量分量的值,不同消费特征向量分量有不同的衰减方式,即一个消费特征向量中,每一属性变量设定不同的衰减函数,衰减函数形如负指数分布,函数形式相同,只是参数不同,不同分量设定不同的半衰期参数。在数据的更新频度机制上,特征矩阵、用户消费标签和用户消费特征向量之间的映射关系分别设定不同的更新周期,而每个用户的消费特征向量能够做到每天更新。与现有技术相比,本发明的优点与积极效果为:用户消费兴趣和消费倾向的变化能够实时的通过用户消费特征向量体现出来,从而使我们能够真正的做到精准营销,提高广告收入;同时,我们不去关心每位用户究竟是谁,我们只关心哪些用户在某个时间段内对什么感兴趣,这样用户数据安全能够得到充分保障;另外,用户消费特征向量的变化基本由系统自动更新,减少了人工干预,有效地降低了平台运营成本。附图说明附图示意了本发明的方法流程图。具体实施方式下面结合附图和具体示例对本发明进一步说明。下面运用一个具体的例子来说明如何应用本发明来获得用户的消费特征向量,并设定用户消费标签与用户消费特征向量之间的映射关系,将其应用于手机广告用户细分领域。实例:假设存在这样一种业务场景,用户使用移动终端通过无线运营商请求访问不同的页面内容,无线运营商将用户请求的页面返回到用户终端;可以搜集到的用户信息有:用户的请求信息,如何时登陆,访问网页顺序等信息,以及运营商向用户返回的页面信息。此时,有一个母婴用户广告主打算在六一儿童节期间向潜在用户投放关于该品牌的营销信息。计算过程示例:1)累积能搜集到的每个用户的访问页面内容信息,对页面内容进行分词,按照词出现的频次多少获得用户关键词表,并赋予每个词不同的权重,即获得二维元组表示的数量化的用户关键词表;如用户A的关键词表为{(小儿咳嗽,0.8),(摄影,0.3),(宝宝,0.6),......},记为Ti;2)构建用户行业消费特征向量{时尚,母婴,数码,};3)构建针对2)中特征向量的特征矩阵。特征矩阵根据经验文本库中与特征向量有关的文本,应用文本特征抽取技术获得特征词汇(哺乳,可爱,绿色,品牌,......),并获得每个词在相关向量上的权重,形如表1所示,记特征矩阵为V;表1、特征矩阵表哺乳可爱绿色品牌......其他时尚v11v12v13v14v1n母婴V21v22v23v24v2n数码v31v32v33v34v3n......其他v10,1v10,2v10,3v10,4v10,n4)计算每个用户的特征向量各个分量的值。即将1)中的用户关键词表与3)中的特征矩阵相乘,记为Ui=V*Ti,得到用户的特征向量,如Ui={0.1,0.7,0.3,......},则表示用户A在时尚方面的表现为0.1,母婴方面的表现为0.7;5)设定用户消费特征向量与用户标签之间的对应关系,根据经验设定:特征向量在“母婴”分量上的值大于0.4时,则判断该用户对“母婴”产品感兴趣,为“母婴”潜在用户;6)基于此对应关系,系统自动为所有用户标注相应的消费标签;并设定用户在母婴方面的半衰减周期为1周,即经过一周后用户在“母婴”方面的影响减少一半即原来的二分之一,得到用户的衰减参数为0.1;将用户一段时间以来的特征向量通过衰减函数做加权,求得用户在特定时间的特征向量;设到t0时刻用户的特征向量为{0.2,0.8,0.3,.......};7)广告主选择消费行为标签“母婴用户关注者”作为潜在的广告投放定向条件,向满足这些条件的人群投放相关的广告。比如,在这些用户浏览的网页上或者该类用户使用的移动业务上搭载相关的广告。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1