信息推送方法和装置与流程

文档序号:12612231阅读:156来源:国知局
信息推送方法和装置与流程
本申请涉及信息处理技术,特别涉及一种信息推送方法和装置。
背景技术
:随着互联网技术的不断发展,互联网已经成为推送信息的主要手段之一。目前,可通过网站或APP(Application,应用程序)展示信息、网络搜索信息、社交网站推荐信息、网络视频信息等方式推送信息。信息在推送时,都有一个期望,例如推送该信息后导致受众使用某一产品或者安装某一应用程序。当受众看到一个信息之后,受众的后续行为达成了该信息的期望,此过程可称之为信息转化。由于信息可通过多个不同的页面进行推送,在一个信息转化之前,受众可能会通过多个不同页面接触到该信息,并且,受众看到不同信息的频率也各不相同。因此,信息推送后,通过不同的投放页面进行推送对信息的转化效果的影响是不同的。而不同的投放页面对信息最终转化的贡献可为信息推送提供一个有效的指导,以提高信息推送的效果。目前虽然可以根据信息转化的结果得到一个总体的转化效果,但是,在信息转化的过程中,各个投放页面对信息转化的贡献却并不明确,衡量多个不同投放页面在信息转化过程中的贡献时,准确性不够高,因此,以此为依据对信息推送进行指导时,会导致信息推送效果不理想。技术实现要素:本申请旨在至少在一定程度上解决上述技术问题。为此,本申请的第一个目的在于提出一种信息推送方法,能够更准确地衡量各个信息投放页面对信息发生指定事件的贡献,提高信息推送效果。本申请的第二个目的在于提出一种信息推送装置。为达上述目的,根据本申请第一方面实施例提出了一种信息推送方法,包括以下步骤:获取多个受众在M个投放页面访问指定信息的行为日志记录,其中,M为正整数;根据所述行为日志记录及对应所述信息发生指定事件的记录确定所述信息的一个或多个转化路径,所述转化路径包括受众在一个或多个投放页面接收所述信息的时间顺序;按照所述时间顺序将每个转化路径分别划分为N个阶段,其中,每个阶段中包括一个或多个投放页面,其中,N为正整数;对于每一个转化路径,根据每个投放页面在每一个阶段内是否向受众投放所述指定信息的记录,构建该转化路径在该阶段的页面向量;计算各页面向量的相似性;确定相似性满足设定阈值的转化路径;统计各投放页面在相似性满足设定阈值的转化路径中的出现概率;根据各投放页面在相似性满足设定阈值的转化路径中的出现概率对所述M个投放页面中第j个投放页面在第i个阶段中对发生所述指定事件的贡献权重进行量化,其中,i=1,…,N,j=1,…,M;对所述第j个投放页面在第一至第N个阶段中对发生所述指定事件的贡献权重进行汇总,以得到所述第j个投放页面对发生所述指定事件的贡献值;根据该投放页面对发生所述指定事件的贡献值,在用户访问所述投放页面时进行所述指定信息的推送。本申请实施例的信息推送方法,按照时间顺序将信息的转化路径划分为多个阶段,并分别量化各投放页面在在每个阶段中对发生指定事件的贡献权重,进而根据各阶段中投放页面的贡献权重汇总得到投放页面对发生指定事件的贡献值。从而,本申请的实施例通过将转化路径划分为多个阶段,并分阶段量化投放页面贡献权重,并进一步根据阶段内的贡献权重确定对整个转化过程的贡献值,使用转化路径分段的方法计算投放页面在时间轴上的贡献权重,并由数据驱动能够达到单一投放页面的贡献权重自动随时间衰减的效果,由此能够更准确地衡量投放页面的对信息发生指定事件的贡献值,从而在后续信息推送时信息能够更合理分配信息投放渠道,提高信息推送效果。本申请第二方面实施例提供了一种信息推送装置,包括:获取模块,用于获取多个受众在M个投放页面访问指定信息的行为日志记录,其中,M为正整数;第一确定模块,用于根据所述行为日志记录及对应所述信息发生指定事件的记录确定所述信息的一个或多个转化路径,所述转化路径包括受众在一个或多个投放页面接收所述信息的时间顺序;阶段划分模块,用于按照所述时间顺序将每个转化路径分别划分为N个阶段,其中,每个阶段中包括一个或多个投放页面,其中,N为正整数;构建模块,用于对于每一个转化路径,根据每个投放页面在每一个阶段内是否向受众投放所述指定信息的记录,构建该转化路径在该阶段的页面向量;计算模块,用于计算各页面向量的相似性;第二确定模块,用于确定相似性满足设定阈值的转化路径;统计模块,用于统计各投放页面在相似性满足设定阈值的转化路径中的出现概率;量化模块,用于根据各投放页面在相似性满足设定阈值的转化路径中的出现概率对所述M个投放页面中第j个投放页面在第i个阶段中对发生所述指定事件的贡献权重进行量化,其中,i=1,…,N,j=1,…,M;汇总模块,用于对所述第j个投放页面在第一至第N个阶段中对发生所述指定事件的贡献权重进行汇总,以得到所述第j个投放页面对发生所述指定事件的贡献值;推送模块,用于根据该投放页面对发生所述指定事件的贡献值,在用户访问所述投放页面时进行所述指定信息的推送。本申请实施例的信息推送装置,按照时间顺序将信息的转化路径划分为多个阶段,并分别量化各投放页面在在每个阶段中对发生指定事件的贡献权重,进而根据各阶段中投放页面的贡献权重汇总得到投放页面对发生指定事件的贡献值。从而,本申请的实施例通过将转化路径划分为多个阶段,并分阶段量化投放页面贡献权重,并进一步根据阶段内的贡献权重确定对整个转化过程的贡献值,使用转化路径分段的方法计算投放页面在时间轴上的贡献权重,并由数据驱动能够达到单一投放页面的贡献权重自动随时间衰减的效果,由此能够更准确地衡量投放页面的对信息发生指定事件的贡献值,从而在后续信息推送时信息能够更合理分配信息投放渠道,提高信息推送效果。本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1为根据本申请一个实施例的信息推送方法的流程图;图2a为根据本申请一个实施例的转化路径的阶段划分示意图一;图2b为根据本申请一个实施例的转化路径的阶段划分示意图二;图3为根据本申请一个实施例的转化路径及其中各个阶段对应的阶段页面向量的示意图;图4为根据本申请一个实施例的信息推送装置的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。目前,在信息推送的过程中,虽然可使用时间衰减来分配不同投放页面对信息发生转化的贡献值权重的方法,但是上述使用时间衰减分配贡献值权重的方法中,是根据人工经验来分配权重,不易掌握,且主观因素较多,因此得到的各个投放页面对信息转化贡献的准确性较低,难以对信息推送进行有效的指导,导致信息推送效果不理想。为此,本申请提出一种信息推送方法和装置。下面参考附图描述根据本申请实施例的信息推送方法和装置。图1为根据本申请一个实施例的信息推送方法的流程图。如图1所示,根据本申请实施例的信息推送方法,包括:S1,获取多个受众在M个投放页面访问指定信息的行为日志记录,其中,M为正整数。在信息推送的过程中,信息可通过多个不同投放渠道进行投放。其中,信息投放是指响应用户的页面访问请求而进行的信息展现。一个投放渠道可对应一个投放页面,每个投放页面对应一个网络站点。每个受众可被看作是一个用户。举例来说,投放页面可以包括网站或者APP展示页面、搜索页面、视频页面、社交网站页面等。其中,行为日志记录用于记录用户访问的投放页面、访问时间、用户操作等。其中,可根据用户的操作判断信息是否发生指定事件。以信息为广告为例,如果广告发生了转化,即用户购买了广告对应的产品,则表示信息发生了指定事件。S2,根据所述行为日志记录及对应所述信息发生指定事件的记录确定所述信息的一个或多个转化路径,所述转化路径包括受众在一个或多个投放页面接收所述信息的时间顺序。由于信息投放时,可通过多个不同的投放渠道进行投放,因此,信息受众在信息最终转化之前,可能会在多个不同投放渠道接收到投放的信息,即可通过多个不同的投放页面向用户展现信息。受众在通过一个投放渠道接收到信息可被称为信息曝光行为。对于受众而言,每一次在每一个投放渠道上的信息曝光行为都被记录下来,并按照时间的先后排序,如果信息发生转化,则排序后的投放渠道对应的曝光行为记录就构成了信息的一条转化路径。也就是说,转化路径为信息从开始投放到最终转化的过程中,受众的信息曝光行为记录的有序组合。举例来说,以广告为例,按照其投放的渠道分类,则包括展示广告(网站页面广告)、搜索广告及社交广告。如果,受众接收广告的顺序依次是展示广告、搜索广告及社交广告,且受众在接收广告后发生的特定行为,则该广告的转化路径可表示为:【展示广告】==》【搜索广告】==》【社交广告】==》【转化成交】。具体地,可根据所有发生转化行为的受众对应的行为日志记录,得到发生信息发生指定事件的多个转化路径。S3,按照所述时间顺序将每个转化路径分别划分为N个阶段,其中,每个阶段中包括一个或多个投放页面,其中,N为正整数。具体地,在本申请的一个实施例中,可对每个转化路径进行线性划分。举例来说,可按照时间顺序将每个转化路径分别划分为时间长度均相同的N个阶段。每一段的时间长度相同。例如,如果使用过去D天的广告对应的用户行为记录来进行分析,将根据D天的广告对应的用户行为记录确定的转化路径分别分为N个阶段,则转化路径中每一阶段的长度都是包含了(D/N)天的用户行为记录。如图2a所示,可以按时间顺序将一个根据8天的用户行为记录得到的转化路径均分为4个阶段,分别为A,B,C,D,其中每个阶段的时间长度都是2天。在本申请的另一个实施例中,可对每个转化路径进行非线性划分。举例来说,可根据预设的记忆取消模块将每个转化路径分别划分为N个阶段。其中,该预设的记忆曲线模型可为艾宾浩斯记忆曲线模型。举例来说,根据艾宾浩斯记忆曲线模型可知大多人的记忆规律为:第三个记忆周期:12小时;第四个记忆周期:1天;第五个记忆周期:2天;第六个记忆周期:4天;第七个记忆周期:7天;因此,可按照上述规律将一个根据8天数据得到的转化路径示划分为图2b中所示5段,即将第0.5天、第1天、第2天、第4天分别作为第0天到第7天之间5个阶段的分割点。由于该转化路径的划分是根据符合人类的记忆规律的记忆曲线模型进行的,因此,根据这种方式得到的划分结果计算得到的投放页面对信息发生指定事件的贡献值的准确性更高。应当理解,在本申请的实施例中,还可使用其他可行的时间分段方法,本申请对此不做限定。S4,对于每一个转化路径,根据每个投放页面在每一个阶段内是否向受众投放所述指定信息的记录,构建该转化路径在该阶段的页面向量。具体地,在本申请的实施例中,步骤S4可具体包括:S41,对于每一个转化路径,根据各投放页面在该转化路径中的每个阶段内是否向受众投放所述指定信息的记录,构建在该转化路径中各个阶段对应的阶段页面向量。其中,阶段页面向量为一个阶段内各个投放页面组成的向量。在本申请的实施例中,对于一个转化路径,对于第i个阶段,可根据在第i个阶段内是否向受众投放指定信息的记录,将向受众投放指定信息的投放页面对应的向量值设为第一数值,将未向受众投放指定信息的投放页面对应的向量值设为第二数值。然后根据预设的渠道码表确定每个投放页面在阶段页面向量中的位置,并按照确定的位置对已经确定的向量值进行排序,以得到第i个阶段对应的阶段页面向量。其中,预设的渠道码表中包括预设数量的渠道(每个渠道对应一个投放页面)及其对应的位置。其中,为了便于计算,第一数值可设为1,第二数值可设为0。举例来说,表1为根据本申请一个实施例的渠道码表的示意图。如表1所示,该渠道码表中包括渠道1-8以及与渠道1-8分别对应的第1-8码位(即在阶段页面向量中的位置)。表1第8位第7位第6位第5位第4位第3位第2位第1位渠道8渠道7渠道6渠道5渠道4渠道3渠道2渠道1如果在第i个阶段中渠道1、渠道3和渠道5向受众投放了指定信息,则可根据表1所示的渠道码表确定渠道1、渠道3和渠道5对应的码位分别为第1位、第3位和第5位,则在第i个阶段对应的阶段页面向量中,第1位、第3位和第5位的值为1,其他位的向量值为0,即第i个阶段对应的阶段页面向量为00010101。应当理解,在生成各个阶段对应的阶段页面向量的过程中,不论一个渠道是否重复以及重复出现几次,该渠道在阶段页面向量中对应的码位即为第一数值。也就是说,该过程仅考虑阶段中是否包含某一渠道,而不考虑该渠道重复出现几次,从而能够去除短期内(一个阶段内)单渠道多次重复曝光的影响。S42,对于每一个转化路径,根据除第i个阶段之外的其他N-1个阶段对应的阶段页面向量构建该转化路径中第i个阶段对应的阶段向量,其中,i=1,…,N。举例来说,图3为根据本申请一个实施例的转化路径及其中各个阶段对应的阶段页面向量的示意图。如图3所示,示出了3个转化路径(分别为conversion1,conversion2、conversion3、conversion4和conversion5),且三个路径均按照时间(timeline)被划分为A、B、C和D四个阶段,即stageA、stageB、stageC和stageD。在各个转化路径中每个阶段所对应的阶段页面向量可如图3中所示。其中,在转化路径1中A-D各阶段对应的阶段页面向量可表示为R(1,A)=(00000111),R(1,B)=(00000101),R(1,C)=(00000011),R(1,D)=(00010000)。因此,转化路径1在A阶段的页面向量即为:根据B、C、D阶段对应的阶段页面组成的向量,可表示为也可被称为BCD阶段对应的阶段页面向量组。同理,转化路径2-5在A阶段的页面向量分别为:进一步地,还可构建转化路径1-5在B阶段的页面向量、转化路径1-5在C阶段的页面向量以及转化路径1-5在D阶段的页面向量。S5,计算各页面向量的相似性。在本申请的实施例中,各页面向量的相似性是指,在转化路径中的一个阶段相同的情况下,各个转化路径中其他阶段的相似性。举例来说,在假设各转化路径的A阶段相同的情况下,各转化路径中B、C、D阶段的相似性。用上述页面向量表示即为计算R(1,BCD)、R(2,BCD)、R(3,BCD)、R(4,BCD)、R(5,BCD)之间的相似性。其中,页面向量之间的相似性可以使用页面向量的距离来度量。应当理解,本申请的实施例中,用于计算两个页面向量的距离的方法有多种,例如,欧几里得距离(euclideanmetric)、曼哈顿距离(ManhattanDistance)、明可夫斯基距离(MinkowskiDistance)、汉明距离(Hammingdistance)等,在实际应用中可以按照需要选择。S6,确定相似性满足设定阈值的转化路径。具体地,可分别确定假设A阶段相同的情况下B、C、D阶段的相似性小于或等于设定阈值的转化路径、假设B阶段相同的情况下,A、C、D阶段的相似性小于或等于设定阈值的转化路径、假设C阶段相同的情况下,A、B、D阶段的相似性小于或等于设定阈值的转化路径、假设D阶段相同的情况下,A、B、C阶段的相似性小于或等于设定阈值的转化路径。举例来说,对于图3所示实施例,以假设各转化路径中的A阶段相同的情况下为例,假设上述设定阈值为0,根据上述转化路径1-5在A阶段的页面向量可以确定,相似性小于或等于设定阈值的转化路径为(1,4)和(2,3),也就是说,各转化路径中的A阶段相同的情况下,转化路径1和4的相似性满足设定阈值,转化路径2和3的相似性满足设定阈值。同理,也可确定在假设各转化路径中B阶段相同的情况下,上述转化路径1-5中相似性小于或等于设定阈值的转化路径;在假设各转化路径中C阶段相同的情况下,上述转化路径1-5中相似性小于或等于设定阈值的转化路径;在假设各转化路径中D阶段相同的情况下,上述转化路径1-5中相似性小于或等于设定阈值的转化路径。S7,统计各投放页面在相似性满足设定阈值的转化路径中的出现概率。S8,根据各投放页面在相似性满足设定阈值的转化路径中的出现概率对所述M个投放页面中第j个投放页面在第i个阶段中对发生所述指定事件的贡献权重进行量化,其中,i=1,…,N,j=1,…,M。在本申请的实施例中,可分别在各转化路径中A阶段相同的情况下、各转化路径中B阶段相同的情况下、各转化路径中C阶段相同的情况下、各转化路径中D阶段相同的情况下,分别统计各投放页面在相似性满足设定阈值的转化路径中的出现概率。具体地,可通过以下公式(1)统计第j个投放页面在相似性满足设定阈值的转化路径中的第i个阶段中的出现概率Wij:其中,Np(i)为相似性满足设定阈值的转化路径的总数,在统计得到Wij之后,可将Wij作为第j个投放页面在第i个阶段中对发生所述指定事件的贡献权重,以完成对第j个投放页面在第i个阶段中对发生所述指定事件的贡献权重的量化。举例来说,对于图3所示的实施例,可根据相似性满足设定阈值的转化路径1、2、3和4来量化各个投放页面在A阶段中对信息发生指定时间的贡献权重。其中,转化路径总数为4。渠道1在这4个转化路径的A阶段中出现了2次,因此,在A阶段中渠道1对信息发生指定时间的贡献权重为:WA1=2/4=0.5。渠道2在这4个转化路径的A阶段中出现了3次,因此,在A阶段中渠道2对信息发生指定时间的贡献权重为:WA2=3/4=0.75。可以看出,虽然渠道2在各个转化路径中的A阶段中一共出现了4次(conversation1、2中的A阶段中各出现1次,conversation4的A阶段各出现2次),但是在A阶段的阶段页面向量中只出现了3次(通过阶段页面向量对conversation4的A阶段中出现的2次进行了过滤)。通过生成渠道向量的过程达到了去除短期内(一个阶段内)单渠道多次重复曝光的影响。由于在短期内单一渠道的重复曝光和只曝光一次差别并不明显,而在长期内多次曝光则能够增加受众对广告的记忆和认知,更为有效,因此,本申请中去除短期内(如一个阶段内)单渠道的重复出现,从而据此得到的渠道转化贡献更加准确。同理,在A阶段中渠道3对信息发生指定时间的贡献权重为:WA3=3/4=0.75,在A阶段中渠道4对信息发生指定时间的贡献权重为:WA4=1/4=0.25,在A阶段中其他渠道对信息发生指定时间的贡献权重为0。对于其他阶段中各个渠道对信息发生指定时间的贡献权重的计算方法可参照阶段A中渠道对信息发生指定时间的贡献权重的计算方法,在此不一一说明。S9,对所述第j个投放页面在第一至第N个阶段中对发生所述指定事件的贡献权重进行汇总,以得到所述第j个投放页面对发生所述指定事件的贡献值。在本申请的一个实施例中,S9可具体包括:S91,根据所述第j个投放页面在第一至第N阶段中对发生所述指定事件时的相对贡献权重组成所述第j个投放页面的贡献权重向量,其中,所述贡献权重向量长度为N。S92,对所述第j个投放页面的贡献权重向量进行求模,并将所述第j个投放页面的贡献权重向量的模作为所述第j个投放页面对发生所述指定事件的贡献值。其中,第j个投放页面的贡献权重向量可表示为Wj=(W1j,...,WNj),其中,W1j,...,WNj分别为第j个投放页面在第一至第N阶段中对发生所述指定事件时的相对贡献权重。第j个投放页面对发生所述指定事件的贡献值可通过公式(2)表示:第j个投放页面在第i个阶段中对发生所述指定事件时的相对贡献权重Wij反映了在其他阶段相似的情况下,第j个投放页面在第i个阶段对信息发生所述指定事件的相对贡献,而Wj=(W1j,...,WNj)反映了第j个投放页面在不同阶段对信息发生所述指定事件的相对贡献,构成了一个贡献权重向量。举例来说,对于图3所示实施例,对于渠道1,可根据渠道1在A、B、C、D这4个阶段中对发生成交时间的相对贡献权重WA1、WB1、WC1、WD1组成渠道1的贡献权重向量(WA1,WB1,WC1,WD1),然后根据以下公式(3)计算渠道1的贡献权重向量的模,即渠道1对发生成交的贡献值(credit)。同理,可按照上述方法计算计算渠道2、3、4、5、6对发生成交的贡献值。S10,根据该投放页面对发生所述指定事件的贡献值,在用户访问所述投放页面时进行所述指定信息的推送。举例来说,如果投放页面1对信息发生指定事件成交的贡献值较大,投放页面2对信息发生指定事件的贡献值较小,则在用户访问投放页面时,可主要通过投放页面1进行信息的推送。本申请实施例的信息推送方法,按照时间顺序将信息的转化路径划分为多个阶段,并分别量化各投放页面在在每个阶段中对发生指定事件的贡献权重,进而根据各阶段中投放页面的贡献权重汇总得到投放页面对发生指定事件的贡献值。从而,本申请的实施例通过将转化路径划分为多个阶段,并分阶段量化投放页面贡献权重,并进一步根据阶段内的贡献权重确定对整个转化过程的贡献值,使用转化路径分段的方法计算投放页面在时间轴上的贡献权重,并由数据驱动能够达到单一投放页面的贡献权重自动随时间衰减的效果,由此能够更准确地衡量投放页面的对信息发生指定事件的贡献值,从而在后续信息推送时信息能够更合理分配信息投放渠道,提高信息推送效果。此外,本申请通过生成页面向量去除短期内(一个阶段内)单个投放页面多次重复曝光的影响,进一步提高了衡量投放页面对信息发生指定事件的贡献的准确性。下面结合具体示例对本申请实施例的技术效果进一步进行说明。以信息为广告为例,对于以下两种广告转化情况a1和b1:a1.第一天看了渠道A的广告,第10天看了渠道B的广告,发生转化,得到的路径P1;b1.第一天上午先看了渠道A,下午看了渠道B的广告,发生转化,得到路径P2;在相关技术中,由于没有区分时间段,之区分了节点的先后次序,因此将上述a1、b1两种情况中渠道A对广告发生转化的贡献看作是一致的。但实际上,由于人类的记忆规律作用,在情况a1中用户很可能已经忘记了通过渠道A看到的广告,因此,情况a1相对于情况b1,渠道A的作用发生了衰减,渠道A贡献是不一致的。本申请的实施例正是通过在时间轴上将转化路径划分为多个阶段,并分别计算每个阶段内不同渠道的贡献权重,从而达到单一渠道的贡献权重自动随时间衰减的效果。另外,对于以下两种广告转化情况a2和b2:a2.A(第1天)→A(第1天)→B(第1天)→B(第5天)→C(第10天);b2.A(第1天)→A(第5天)→B(第5天)→B(第6天)→C(第10天);在相关技术中,认为渠道A的贡献在情况a2和b2中是一样的。但是,可以看出,在情况a2中,渠道A在短期内出现了2次(都是第一天出现),情况b2中渠道A在较长时间内出现了2次(分别为第1天和第5天)。根据人类记忆规律,短期内被重复曝光与只曝光一次差别并不明显,而在长期进行多次曝光则是有效的。因此这两种情形下渠道A对最终转化的贡献应该有所差别,但是,现有技术认为两种情形下A对最终转化的贡献是没有差别的。而本申请的实施例在生成页面向量过程中,仅考虑阶段中是否包含一个渠道,而不考虑该渠道重复出现几次,从而去除短期内(一个阶段内)单渠道多次重复曝光的影响。由此可见,通过本申请实施例能够更准确地获取不同投放页面对信息发生指定事件的贡献,且得到的结果更符合实际转化情况。为了实现上述实施例,本申请还提出一种信息推送装置。图4为根据本申请一个实施例的信息推送装置的结构示意图。如图4所示,根据本申请实施例的信息推送装置,包括:获取模块1、第一确定模块2、阶段划分模块3、构建模块4、计算模块5、第二确定模块6、统计模块7、量化模块8、汇总模块9和推送模块10。具体地,获取模块1用于获取多个受众在M个投放页面访问指定信息的行为日志记录,其中,M为正整数。在信息推送的过程中,信息可通过多个不同投放渠道进行投放。其中,信息投放是指响应用户的页面访问请求而进行的信息展现。一个投放渠道可对应一个投放页面,每个投放页面对应一个网络站点。每个受众可被看作是一个用户。举例来说,投放页面可以包括网站或者APP展示页面、搜索页面、视频页面、社交网站页面等。其中,行为日志记录用于记录用户访问的投放页面、访问时间、用户操作等。其中,可根据用户的操作判断信息是否发生指定事件。以信息为广告为例,如果广告发生了转化,即用户购买了广告对应的产品,则表示信息发生了指定事件。第一确定模块2用于根据所述行为日志记录及对应所述信息发生指定事件的记录确定所述信息的一个或多个转化路径,所述转化路径包括受众在一个或多个投放页面接收所述信息的时间顺序。由于信息投放时,可通过多个不同的投放渠道进行投放,因此,信息受众在信息最终转化之前,可能会在多个不同投放渠道接收到投放的信息,即可通过多个不同的投放页面向用户展现信息。受众在通过一个投放渠道接收到信息可被称为信息曝光行为。对于受众而言,每一次在每一个投放渠道上的信息曝光行为都被记录下来,并按照时间的先后排序,如果信息发生转化,则排序后的投放渠道对应的曝光行为记录就构成了信息的一条转化路径。也就是说,转化路径为信息从开始投放到最终转化的过程中,受众的信息曝光行为记录的有序组合。举例来说,以广告为例,按照其投放的渠道分类,则包括展示广告(网站页面广告)、搜索广告及社交广告。如果,受众接收广告的顺序依次是展示广告、搜索广告及社交广告,且受众在接收广告后发生的特定行为,则该广告的转化路径可表示为:【展示广告】==》【搜索广告】==》【社交广告】==》【转化成交】。具体地,第一确定模块2可根据所有发生转化行为的受众对应的行为日志记录,得到发生信息发生指定事件的多个转化路径。阶段划分模块3用于按照所述时间顺序将每个转化路径分别划分为N个阶段,其中,每个阶段中包括一个或多个投放页面,其中,N为正整数。具体地,在本申请的一个实施例中,阶段划分模块3可对每个转化路径进行线性划分。举例来说,阶段划分模块3可按照时间顺序将每个转化路径分别划分为时间长度均相同的N个阶段。每一段的时间长度相同。例如,如果使用过去D天的广告对应的用户行为记录来进行分析,将根据D天的广告对应的用户行为记录确定的转化路径分别分为N个阶段,则转化路径中每一阶段的长度都是包含了(D/N)天的用户行为记录。如图2a所示,可以按时间顺序将一个根据8天的用户行为记录得到的转化路径均分为4个阶段,分别为A,B,C,D,其中每个阶段的时间长度都是2天。在本申请的另一个实施例中,阶段划分模块3可对每个转化路径进行非线性划分。举例来说,阶段划分模块3可根据预设的记忆取消模块将每个转化路径分别划分为N个阶段。其中,该预设的记忆曲线模型可为艾宾浩斯记忆曲线模型。举例来说,根据艾宾浩斯记忆曲线模型可知大多人的记忆规律为:第三个记忆周期:12小时;第四个记忆周期:1天;第五个记忆周期:2天;第六个记忆周期:4天;第七个记忆周期:7天;因此,可按照上述规律将一个根据8天数据得到的转化路径示划分为图2b中所示5段,即将第0.5天、第1天、第2天、第4天分别作为第0天到第7天之间5个阶段的分割点。由于该转化路径的划分是根据符合人类的记忆规律的记忆曲线模型进行的,因此,根据这种方式得到的划分结果计算得到的投放页面对信息发生指定事件的贡献值的准确性更高。应当理解,在本申请的实施例中,还可使用其他可行的时间分段方法,本申请对此不做限定。构建模块4用于对于每一个转化路径,根据每个投放页面在每一个阶段内是否向受众投放所述指定信息的记录,构建该转化路径在该阶段的页面向量。具体地,在本申请的实施例中,构建模块4可具体用于:对于每一个转化路径,根据各投放页面在该转化路径中的每个阶段内是否向受众投放所述指定信息的记录,构建在该转化路径中各个阶段对应的阶段页面向量;对于每一个转化路径,根据除第i个阶段之外的其他N-1个阶段对应的阶段页面向量构建该转化路径中第i个阶段对应的阶段向量,其中,i=1,…,N。其中,阶段页面向量为一个阶段内各个投放页面组成的向量。在本申请的实施例中,对于一个转化路径,对于第i个阶段,可根据在第i个阶段内是否向受众投放指定信息的记录,将向受众投放指定信息的投放页面对应的向量值设为第一数值,将未向受众投放指定信息的投放页面对应的向量值设为第二数值。然后根据预设的渠道码表确定每个投放页面在阶段页面向量中的位置,并按照确定的位置对已经确定的向量值进行排序,以得到第i个阶段对应的阶段页面向量。其中,预设的渠道码表中包括预设数量的渠道(每个渠道对应一个投放页面)及其对应的位置。其中,为了便于计算,第一数值可设为1,第二数值可设为0。举例来说,表1为根据本申请一个实施例的渠道码表的示意图。如表1所示,该渠道码表中包括渠道1-8以及与渠道1-8分别对应的第1-8码位(即在阶段页面向量中的位置)。表1第8位第7位第6位第5位第4位第3位第2位第1位渠道8渠道7渠道6渠道5渠道4渠道3渠道2渠道1如果在第i个阶段中渠道1、渠道3和渠道5向受众投放了指定信息,则可根据表1所示的渠道码表确定渠道1、渠道3和渠道5对应的码位分别为第1位、第3位和第5位,则在第i个阶段对应的阶段页面向量中,第1位、第3位和第5位的值为1,其他位的向量值为0,即第i个阶段对应的阶段页面向量为00010101。应当理解,在生成各个阶段对应的阶段页面向量的过程中,不论一个渠道是否重复以及重复出现几次,该渠道在阶段页面向量中对应的码位即为第一数值。也就是说,该过程仅考虑阶段中是否包含某一渠道,而不考虑该渠道重复出现几次,从而能够去除短期内(一个阶段内)单渠道多次重复曝光的影响。举例来说,图3为根据本申请一个实施例的转化路径及其中各个阶段对应的阶段页面向量的示意图。如图3所示,示出了3个转化路径(分别为conversion1,conversion2、conversion3、conversion4和conversion5),且三个路径均按照时间(timeline)被划分为A、B、C和D四个阶段,即stageA、stageB、stageC和stageD。在各个转化路径中每个阶段所对应的阶段页面向量可如图3中所示。其中,在转化路径1中A-D各阶段对应的阶段页面向量可表示为R(1,A)=(00000111),R(1,B)=(00000101),R(1,C)=(00000011),R(1,D)=(00010000)。因此,转化路径1在A阶段的页面向量即为:根据B、C、D阶段对应的阶段页面组成的向量,可表示为也可被称为BCD阶段对应的阶段页面向量组。同理,转化路径2-5在A阶段的页面向量分别为:进一步地,还可构建转化路径1-5在B阶段的页面向量、转化路径1-5在C阶段的页面向量以及转化路径1-5在D阶段的页面向量。计算模块5用于计算各页面向量的相似性。在本申请的实施例中,各页面向量的相似性是指,在转化路径中的一个阶段相同的情况下,各个转化路径中其他阶段的相似性。举例来说,在假设各转化路径的A阶段相同的情况下,各转化路径中B、C、D阶段的相似性。用上述页面向量表示即为计算R(1,BCD)、R(2,BCD)、R(3,BCD)、R(4,BCD)、R(5,BCD)之间的相似性。其中,页面向量之间的相似性可以使用页面向量的距离来度量。应当理解,本申请的实施例中,用于计算两个页面向量的距离的方法有多种,例如,欧几里得距离(euclideanmetric)、曼哈顿距离(ManhattanDistance)、明可夫斯基距离(MinkowskiDistance)、汉明距离(Hammingdistance)等,在实际应用中可以按照需要选择。第二确定模块6用于确定相似性满足设定阈值的转化路径。具体地,第二确定模块6可分别确定假设A阶段相同的情况下B、C、D阶段的相似性小于或等于设定阈值的转化路径、假设B阶段相同的情况下,A、C、D阶段的相似性小于或等于设定阈值的转化路径、假设C阶段相同的情况下,A、B、D阶段的相似性小于或等于设定阈值的转化路径、假设D阶段相同的情况下,A、B、C阶段的相似性小于或等于设定阈值的转化路径。举例来说,对于图3所示实施例,以假设各转化路径中的A阶段相同的情况下为例,假设上述设定阈值为0,根据上述转化路径1-5在A阶段的页面向量可以确定,相似性小于或等于设定阈值的转化路径为(1,4)和(2,3),也就是说,各转化路径中的A阶段相同的情况下,转化路径1和4的相似性满足设定阈值,转化路径2和3的相似性满足设定阈值。同理,第二确定模块6也可确定在假设各转化路径中B阶段相同的情况下,上述转化路径1-5中相似性小于或等于设定阈值的转化路径;在假设各转化路径中C阶段相同的情况下,上述转化路径1-5中相似性小于或等于设定阈值的转化路径;在假设各转化路径中D阶段相同的情况下,上述转化路径1-5中相似性小于或等于设定阈值的转化路径。统计模块7用于统计各投放页面在相似性满足设定阈值的转化路径中的出现概率。量化模块8用于根据各投放页面在相似性满足设定阈值的转化路径中的出现概率对所述M个投放页面中第j个投放页面在第i个阶段中对发生所述指定事件的贡献权重进行量化,其中,i=1,…,N,j=1,…,M。在本申请的实施例中,统计模块7可分别在各转化路径中A阶段相同的情况下、各转化路径中B阶段相同的情况下、各转化路径中C阶段相同的情况下、各转化路径中D阶段相同的情况下,分别统计各投放页面在相似性满足设定阈值的转化路径中的出现概率。具体地,统计模块7可通过以下公式(1)统计第j个投放页面在相似性满足设定阈值的转化路径中的第i个阶段中的出现概率Wij:其中,Np(i)为相似性满足设定阈值的转化路径的总数,在统计得到Wij之后,量化模块8可将Wij作为第j个投放页面在第i个阶段中对发生所述指定事件的贡献权重,以完成对第j个投放页面在第i个阶段中对发生所述指定事件的贡献权重的量化。举例来说,对于图3所示的实施例,可根据相似性满足设定阈值的转化路径1、2、3和4来量化各个投放页面在A阶段中对信息发生指定时间的贡献权重。其中,转化路径总数为4。渠道1在这4个转化路径的A阶段中出现了2次,因此,在A阶段中渠道1对信息发生指定时间的贡献权重为:WA1=2/4=0.5。渠道2在这4个转化路径的A阶段中出现了3次,因此,在A阶段中渠道2对信息发生指定时间的贡献权重为:WA2=3/4=0.75。可以看出,虽然渠道2在各个转化路径中的A阶段中一共出现了4次(conversation1、2中的A阶段中各出现1次,conversation4的A阶段各出现2次),但是在A阶段的阶段页面向量中只出现了3次(通过阶段页面向量对conversation4的A阶段中出现的2次进行了过滤)。通过生成渠道向量的过程达到了去除短期内(一个阶段内)单渠道多次重复曝光的影响。由于在短期内单一渠道的重复曝光和只曝光一次差别并不明显,而在长期内多次曝光则能够增加受众对广告的记忆和认知,更为有效,因此,本申请中去除短期内(如一个阶段内)单渠道的重复出现,从而据此得到的渠道转化贡献更加准确。同理,在A阶段中渠道3对信息发生指定时间的贡献权重为:WA3=3/4=0.75,在A阶段中渠道4对信息发生指定时间的贡献权重为:WA4=1/4=0.25,在A阶段中其他渠道对信息发生指定时间的贡献权重为0。对于其他阶段中各个渠道对信息发生指定时间的贡献权重的计算方法可参照阶段A中渠道对信息发生指定时间的贡献权重的计算方法,在此不一一说明。汇总模块9用于对所述第j个投放页面在第一至第N个阶段中对发生所述指定事件的贡献权重进行汇总,以得到所述第j个投放页面对发生所述指定事件的贡献值。在本申请的一个实施例中,汇总模块9可具体用于:根据所述第j个投放页面在第一至第N阶段中对发生所述指定事件时的相对贡献权重组成所述第j个投放页面的贡献权重向量,其中,所述贡献权重向量长度为N;对所述第j个投放页面的贡献权重向量进行求模,并将所述第j个投放页面的贡献权重向量的模作为所述第j个投放页面对发生所述指定事件的贡献值。其中,第j个投放页面的贡献权重向量可表示为Wj=(W1j,...,WNj),其中,W1j,...,WNj分别为第j个投放页面在第一至第N阶段中对发生所述指定事件时的相对贡献权重。第j个投放页面对发生所述指定事件的贡献值可通过公式(2)表示:第j个投放页面在第i个阶段中对发生所述指定事件时的相对贡献权重Wij反映了在其他阶段相似的情况下,第j个投放页面在第i个阶段对信息发生所述指定事件的相对贡献,而Wj=(W1j,...,WNj)反映了第j个投放页面在不同阶段对信息发生所述指定事件的相对贡献,构成了一个贡献权重向量。举例来说,对于图3所示实施例,对于渠道1,可根据渠道1在A、B、C、D这4个阶段中对发生成交时间的相对贡献权重WA1、WB1、WC1、WD1组成渠道1的贡献权重向量(WA1,WB1,WC1,WD1),然后根据以下公式(3)计算渠道1的贡献权重向量的模,即渠道1对发生成交的贡献值(credit)。同理,汇总模块9可按照上述方法计算计算渠道2、3、4、5、6对发生成交的贡献值。推送模块10用于根据该投放页面对发生所述指定事件的贡献值,在用户访问所述投放页面时进行所述指定信息的推送。举例来说,如果投放页面1对信息发生指定事件成交的贡献值较大,投放页面2对信息发生指定事件的贡献值较小,则在用户访问投放页面时,可主要通过投放页面1进行信息的推送。本申请实施例的信息推送装置,按照时间顺序将信息的转化路径划分为多个阶段,并分别量化各投放页面在在每个阶段中对发生指定事件的贡献权重,进而根据各阶段中投放页面的贡献权重汇总得到投放页面对发生指定事件的贡献值。从而,本申请的实施例通过将转化路径划分为多个阶段,并分阶段量化投放页面贡献权重,并进一步根据阶段内的贡献权重确定对整个转化过程的贡献值,使用转化路径分段的方法计算投放页面在时间轴上的贡献权重,并由数据驱动能够达到单一投放页面的贡献权重自动随时间衰减的效果,由此能够更准确地衡量投放页面的对信息发生指定事件的贡献值,从而在后续信息推送时信息能够更合理分配信息投放渠道,提高信息推送效果。此外,本申请通过生成页面向量去除短期内(一个阶段内)单个投放页面多次重复曝光的影响,进一步提高了衡量投放页面对信息发生指定事件的贡献的准确性。流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属
技术领域
的技术人员所理解。在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。本
技术领域
的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。上述提到的存储介质可以是只读存储器,磁盘或光盘等。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。尽管已经示出和描述了本申请的实施例,本领域的普通技术人员可以理解:在不脱离本申请的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本申请的范围由权利要求及其等同限定。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1