一种素材推荐方法、装置、存储介质、终端与流程

文档序号:17014737发布日期:2019-03-02 02:24阅读:131来源:国知局
一种素材推荐方法、装置、存储介质、终端与流程
本发明涉及互联网广告发布
技术领域
,尤其涉及一种素材推荐方法、装置、存储介质、终端。
背景技术
:在目前的互联网应用中,通常要要用到精准推荐技术,例如广告的推荐、内容的推荐等等。以广告推荐为例,在互联网广告行业中,实时竞价(realtimebidding,简称rtb)是近年来逐渐流行的一种广告采买方式。与传统的合约式广告采买模式不同,rtb允许广告素材发布方针对每一个广告素材的展示机会进行竞价,从而以人群购买取代了广告素材的展示位购买。在此基础上,需求方平台(demandsideplatform,简称dsp)作为广告素材发布方的代理,为了协助广告素材发布方完成rtb操作,需要在100ms内对每个广告素材发布请求进行决策,以判断是否参与竞价,以及如果参与竞价则出价多少。而广告素材发布方通常会以点击通过率(clickthroughrate,简称ctr)和转化率(conversionrate,简称cvr)为指标考察dsp的代理投放效果。目前的dsp在向用户推荐广告素材时,通常是将历史流量中点击率或转化率较高的素材推荐给用户,并不能按照用户所喜欢的素材风格来向其推荐素材;另外,对于素材库中从未投放过的新素材,通常需要先尝试性的投放给用户,根据反馈的点击情况,然后再调整可能对新素材的风格感兴趣的投放人群,造成投放成本增加。如何根据用户喜欢的风格更准确的向用户推荐素材,是亟待解决的问题。技术实现要素:本发明解决的技术问题是如何更准确地推荐素材。为解决上述技术问题,本发明实施例提供了一种素材推荐方法,包括如下步骤:根据多个用户的历史流量数据,确定至少一个用户类别;统计所述各个用户类别各自的典型素材,并根据各个用户类别的典型素材的风格向量确定每个用户类别的风格向量,所述典型素材选自每一用户类别的历史流量数据中展现次数大于预设阈值的素材,所述典型素材的风格向量是基于预定义的多个风格维度确定的;根据当前用户的实时流量数据确定所述当前用户所属的用户类别;将素材库中的储备素材按照其风格向量与所述当前用户所属的用户类别的风格向量的相似度进行排序,以根据排序结果确定候选素材;将所述候选素材推荐给所述当前用户。可选的,根据多个用户的历史流量数据,确定至少一个用户类别包括:从所述多个用户的历史流量数据中选取k个用户的历史流量数据作为中心数据,其中,每个中心数据均对应一个用户类别,k为正整数;根据所述多个用户的历史流量数据与k个所述中心数据的相似度,将所述多个用户划分为k个用户类别。可选的,根据所述多个用户的历史流量数据与k个所述中心数据的相似度,将所述多个用户划分为k个用户类别包括:比较各个用户的历史流量数据与k个所述中心数据的相似度,记录下与每一用户相似度最高的中心数据;将各个用户划分入相似度最高的中心数据对应的用户类别中。可选的,统计所述各个用户类别各自的典型素材,并根据各个用户类别的典型素材的风格向量确定每个用户类别的风格向量包括:统计在每一用户类别的历史流量数据中展现次数大于预设阈值的素材,并将展现次数大于预设阈值的素材按照点击率从高到低排序,选取点击率排序靠前的n个素材作为典型素材,其中,n为正整数;对于每一用户类别,分别计算其中各个典型素材的风格向量,并根据各个典型素材的风格向量计算所述用户类别的风格向量。可选的,根据各个典型素材的风格向量计算所述用户类别的风格向量包括:计算所述用户类别内各个典型素材的风格向量的累加和,以得到所述用户类别的风格向量。可选的,将素材库中的储备素材按照其风格向量与所述当前用户所属的用户类别的风格向量的相似度进行排序,以根据排序结果确定候选素材包括:按照相似度从高到低对所述储备素材进行排序,选取排序靠前的m张素材作为候选素材。为解决上述技术问题,本发明实施例还提供了一种广告素材推荐装置,包括用户聚类模块,适于根据多个用户的历史流量数据,确定至少一个用户类别;素材风格统计模块,适于统计所述各个用户类别各自的典型素材,并根据各个用户类别的典型素材的风格向量确定每个用户类别的风格向量,所述典型素材选自每一用户类别的历史流量数据中展现次数大于预设阈值的素材,所述典型素材的风格向量是基于预定义的多个风格维度确定的;实时流量确定模块,适于根据当前用户的实时流量数据确定所述当前用户所属的用户类别;素材排序模块,适于将素材库中的储备素材按照其风格向量与所述当前用户所属的用户类别的风格向量的相似度进行排序,以根据排序结果确定候选素材;素材推荐模块,适于将所述候选素材推荐给所述当前用户。可选的,所述用户聚类模块包括:聚类中心选取子模块,适于从所述多个用户的历史流量数据中选取k个用户的历史流量数据作为中心数据,其中,每个中心数据均对应一个用户类别,k为正整数;用户划分子模块,适于根据所述多个用户的历史流量数据与k个所述中心数据的相似度,将所述多个用户划分为k个用户类别。可选的,所述用户划分子模块包括:比较单元,适于比较各个用户的历史流量数据与k个所述中心数据的相似度,记录下与每一用户相似度最高的中心数据;划分单元,适于将各个用户划分入相似度最高的中心数据对应的用户类别中。可选的,所述素材风格统计模块包括:典型素材提取子模块,统计在每一用户类别的历史流量数据中展现次数大于预设阈值的素材,并将展现次数大于预设阈值的素材按照点击率从高到低排序,选取点击率排序靠前的n个素材作为典型素材,其中,n为正整数;素材风格提取子模块,对于每一用户类别,适于分别计算其中各个典型素材的风格向量,并根据各个典型素材的风格向量计算所述用户类别的风格向量。可选的,所述素材风格提取子模块包括:累加单元,适于计算所述用户类别内各个典型素材的风格向量的累加和,以得到所述用户类别的风格向量。可选的,所述素材排序模块包括:排序子模块,适于按照相似度从高到低对所述储备素材进行排序,选取排序靠前的m张素材作为候选素材,其中,m为正整数。为解决上述技术问题,本发明实施例还提供了一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行所述的素材推荐方法的步骤。为解决上述技术问题,本发明实施例还提供了一种终端,包括存储器和处理器,所述存储器上存储有能够在所述处理器上运行的计算机指令,所述处理器运行所述计算机指令时执行所述的素材推荐方法的步骤。与现有技术相比,本发明实施例的技术方案具有以下有益效果:本发明技术方案的素材推荐方法可以根据多个用户的历史流量数据,确定至少一个用户类别;随后,统计所述各个用户类别各自的典型素材,并根据各个用户类别的典型素材的风格向量确定每个用户类别的风格向量,所述典型素材选自每一用户类别的历史流量数据中展现次数大于预设阈值的素材,所述典型素材的风格向量是基于预定义的多个风格维度确定的;接下来,该方法在线应用时,可以根据当前用户的实时流量数据确定所述当前用户所属的用户类别;然后将素材库中的储备素材按照其风格向量与所述当前用户所属的用户类别的风格向量的相似度进行排序,以根据排序结果确定候选素材;最后再将所述候选素材推荐给所述当前用户。由此,可以根据用户喜欢的风格向其推荐素材,有利于提高素材的点击率。对于广告推荐而言,还有利于提高转化率,从而实现以更少的成本获得更优的广告素材投放效果。对于内容(例如新闻、短视频等)推荐而言,可以使得推荐更加准确,有利于改善用户体验。进一步,本发明技术方案可以从所述多个用户的历史流量数据中选取k个用户的历史流量数据作为中心数据,然后根据所述用户的历史流量数据与k个所述中心数据的相似度,将所述多个用户划分为k个用户类别。由此,采用聚类方式来对多个用户进行分类,便于后续对用户类别的风格进行准确分析。进一步,本发明技术方案可以统计在每一用户类别的历史流量数据中展现次数大于预设阈值的素材,并将展现次数大于预设阈值的素材按照点击率从高到低排序,选取点击率排序靠前的n个素材作为典型素材,接下来,对于每一用户类别,分别计算其中各个典型素材的风格向量,并根据各个典型素材的风格向量计算所述用户类别的风格向量。由于点击率高的素材可以比点击率低的素材更加准确的反应出相关用户喜欢的风格,因此,把点击率高的素材作为典型素材,可能提高计算的准确性,从而有利于增加后续素材推荐时的精准度。进一步,本发明技术方案可以将素材库中的储备素材按照其风格向量与所述当前用户所属的用户类别的风格向量的相似度从高到低进行排序,选取排序靠前的m张素材作为候选素材。由此,对于素材库中新加入的从未投放过的素材,可以预先判断可能对其感兴趣的用户,防止新素材的冷启动,有效避免了素材投放成本的浪费。附图说明图1是本发明实施例一种素材推荐方法的流程图;图2是图1中步骤s11的一种具体实施方式的流程图;图3是图1中步骤s12的一种具体实施方式的流程图;图4是本发明实施例一种素材推荐装置的结构示意图;图5是图4中用户聚类模块的结构示意图;图6是图4中素材风格统计模块的结构示意图。具体实施方式本领域技术人员可以理解,目前的dsp在向用户推荐广告素材时,通常是将历史流量中点击率或转化率较高的素材推荐给用户,并不能按照用户所喜欢的素材风格来向其推荐素材;另外,对于素材库中从未投放过的新素材,通常需要先尝试性的投放给用户,根据反馈的点击情况,然后再调整可能对新素材的风格感兴趣的投放人群,造成投放成本增加。本发明实施例中的素材推荐方法可以根据多个用户的历史流量数据,确定至少一个用户类别;随后,统计所述各个用户类别各自的典型素材,并根据各个用户类别的典型素材的风格向量确定每个用户类别的风格向量,所述典型素材选自每一用户类别的历史流量数据中展现次数大于预设阈值的素材,所述典型素材的风格向量是基于预定义的多个风格维度确定的;接下来,该方法在线应用时,可以根据当前用户的实时流量数据确定所述当前用户所属的用户类别;然后将素材库中的储备素材按照其风格向量与所述当前用户所属的用户类别的风格向量的相似度进行排序,以根据排序结果确定候选素材;最后再将所述候选素材推荐给所述当前用户。由此,可以根据用户喜欢的风格向其推荐素材,有利于提高素材的点击率。对于广告推荐而言,还有利于提高转化率,从而实现以更少的成本获得更优的广告素材投放效果。对于内容(例如新闻、短视频等)推荐而言,可以使得推荐更加准确,有利于改善用户体验。为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明的保护范围。图1是本发明实施例一种素材推荐方法的流程图。本实施例中的素材推荐方法可以应用于广告推荐,例如由需求方平台dsp在协助广告素材发布方执行rtb操作时使用,以提高广告素材的点击率和转化率。请参考图1,所述素材推荐方法可以包括如下步骤:步骤s11:根据多个用户的历史流量数据,确定至少一个用户类别;步骤s12:统计所述各个用户类别各自的典型素材,并根据各个用户类别的典型素材的风格向量确定每个用户类别的风格向量,所述典型素材选自每一用户类别的历史流量数据中展现次数大于预设阈值的素材,所述典型素材的风格向量是基于预定义的多个风格维度确定的;步骤s13:根据当前用户的实时流量数据确定所述当前用户所属的用户类别;步骤s14:将素材库中的储备素材按照其风格向量与所述当前用户所属的用户类别的风格向量的相似度进行排序,以根据排序结果确定候选素材;步骤s15:将所述候选素材推荐给所述当前用户。本实施例中,所述素材可以是图片,所述图片中可以包含广告信息,例如:待售商品信息。具体地,所述图片的格式可以是jpg、jpeg、tif、gif、bmp等格式,本发明实施例对此不做限制。进一步地,所述历史流量数据可以包括设备的标识信息(identification,简称id),以下简称设备id。作为一个非限制性实施例,可以通过所述设备id关联所述用户及其上网行为产生的互联网访问痕迹。或者,对于基于个人电脑(personalcomputer,简称pc)端产生的用户互联网访问痕迹,也可以根据所述pc端上安装的浏览器的id关联所述用户。优选地,与所述用户相关联的互联网访问痕迹可以包括所述用户在素材发布方和/或素材展示平台的网站上的浏览记录,所述浏览记录中可以包括浏览时长、浏览的具体网页中的素材等等。其中,所述素材发布方可以是指所述待发布素材的提供方;所述素材展示平台可以是指为所述待展示素材提供展示位的平台。另外,基于所述用户的上网行为产生的互联网访问痕迹,不仅可以得到用户浏览的具体网页中的素材信息,还可以获取所述用户的基础信息。具体地,所述用户的基础信息可以包括所述用户的居住城市、年龄、性别、购买力等信息。优选地,所述用户的基础信息可以收集自所述素材发布方(和/或素材展示平台,如网站、网页等),还可以直接采集自所述用户的历史互联网访问数据。例如,可以基于用户向所述素材发布方和/或素材展示平台提供的数据直接获取该用户的基础信息;又例如,还可以基于所述用户在所述素材发布方和/或素材展示平台的互联网访问痕迹,推测获得所述用户的基础信息。其中,推测的操作可以由所述素材发布方和/或素材展示平台执行,或者,也可以由执行本实施例所述方案的终端(如dsp)执行。进一步地,所述dsp可以预先记录至少一个用户的基础信息以及相关联的设备id,当接收到实时流量数据后,可以基于所述流量数据中的设备id从预存记录中查找对应的基础信息,然后根据该基础信息对实时用户进行类别划分。具体执行步骤s11时,可以通过聚类算法将用户划分为不同的用户类别。具体地,本实施例中的聚类算法可以采用分割算法(例如:k-means算法)、分层次算法(例如:rock算法)、基于密度的算法(例如:dbscan算法)、基于网格的算法(例如:sting算法)等。本领域技术人员可以根据具体的应用场合而适应性的选择合适的聚类算法,本发明实施例对此不做限制。请参见图2,图2是图1中步骤s11的一种具体实施方式的流程图。在一个非限制性的实施例中,例如:采用k-means算法将用户划分为不同的用户类别,可以包括如下步骤:步骤s21:从所述多个用户的历史流量数据中选取k个用户的历史流量数据作为中心数据,其中,每个中心数据均对应一个用户类别,k为正整数;步骤s22:根据所述用户的历史流量数据与k个所述中心数据的相似度,将所述多个用户划分为k个用户类别。本实施例中,可以将所述用户的历史流量数据进行数字化处理,每一个历史流量数据都可以作为一个用户的标识,下面以一个具体应用场景对步骤s21和步骤s22的具体执行过程进行详细说明。在所述具体应用场景中,以一共有100个用户为例,需要将100个用户划分为5个用户类别,每个用户类别中的用户群有着相似的购买偏好以及信息浏览偏好,不同用户类别中的用户群有着不同的购买偏好以及信息浏览偏好。不同用户类别之间的差异度越大,则表示分类越清晰,分类效果越优。在机器学习的过程中,首先用数字a1、a2、a3、a4、a5、a6、a7、a8……a100分别作为这100个用户的标识,这100个数据就是与所述用户对应的历史流量数据。初始运行时,k-means算法会随机选择5个历史流量数据,作为5个用户类别的中心数据,例如,a4、a26、a59、a73、a89。接下来,需要比较100个用户的历史流量数据与5个所述中心数据的相似度,记录下与每一用户相似度最高的中心数据,然后将100个用户划分入相似度最高的中心数据对应的用户类别中。具体地,对于历史流量数据a1,可以分别计算a1到a4、a26、a59、a73、a89的距离。距离越近,则相似度越高,换言之,距离越远,则相似度越低。若a1到a4的距离最近,则可以将a1划归入中心数据a4所在的用户类别。接下来,可以用同样的方式分别计算a2、a3、a4、a5、a6、a7、a8……a100到各个中心数据的距离,并依次将a2、a3、a4、a5、a6、a7、a8……a100代表的用户各自划分入5个不同的用户类别中。若第一次划分完成后,以a4为中心数据的用户类别其包括的用户集合为{a1、a2、a3、a4、a5、a6、a7、a8},则继续计算所述用户集合{a1、a2、a3、a4、a5、a6、a7、a8}中所有数据的平均数,将平均数记为b1,即b1=(a1+a2+a3+a4+a5+a6+a7+a8)/8,用b1代替a4作为该用户类别中的新的中心数据。以同样的方式分别计算出其他四个用户类别的新的中心数据。计算完成后,五个用户类别的中心数据可以由a4、a26、a59、a73、a89被更新为b1、b2、b3、b4、b5。接下来,分别计算a1、a2、a3、a4、a5、a6、a7、a8……a100到五个类别的新的中心数据b1、b2、b3、b4、b5的距离,以将上述数据a1、a2、a3、a4、a5、a6、a7、a8……a100所代表的用户进行重新划分类别。对于重新划分后的每一个用户集合,继续计算其新的中心数据,并根据新的中心数据再次对所有的用户进行划分。经过多次迭代计算后,会得到较为稳定的各个用户类别的中心数据,即各个用户类别的中心数据不再随着迭代次数而变化。此时,可以认为用户类别划分结束。需要说明的是,所述用户类别的数量可以根据具体需求以及用户数量的多少进行设置,例如,可以是5个类别、7个类别、12个类别等,本发明实施例对此不做限制。在完成多个用户的类别划分后,可以统计所述各个用户类别各自的典型素材,并根据各个用户类别的典型素材的风格向量确定每个用户类别的风格向量。请参考图3,所述图3是步骤s12的一种具体实施方式的流程图。在具体实施步骤s12时,可以包括如下细分步骤:步骤s31:统计在每一用户类别的历史流量数据中展现次数大于预设阈值的素材,并将展现次数大于预设阈值的素材按照点击率从高到低排序,选取点击率排序靠前的n个素材作为典型素材,其中,n为正整数;步骤s32:对于每一用户类别,分别计算其中各个典型素材的风格向量,并根据各个典型素材的风格向量计算所述用户类别的风格向量。进一步地,所述用户类别的风格向量可以是所述用户类别内各个典型素材的风格向量的累加和。具体地,所述典型素材的风格向量是基于预定义的多个风格维度确定的。在一个非限制性的实施例中,所述风格维度的数量可以是2个,分别为复古风格和韩式风格,。例如,若某个素材只属于复古风格,则其风格向量可以表示为(1,0),若某个素材只属于韩式风格,则其风格向量可以表示为(0,1)。其中,风格向量中的数字1代表在二维维度中,某个素材具有某个风格,风格向量中的数字0代表在二维维度中,某个素材不具有某个风格。在另一个非限制性的实施例中,所述风格维度的数量可以是更多个,例如可以是复古风格、韩式风格和朋克风格。例如,若某个素材只属于复古风格,则其风格向量可以表示为(1,0,0),若某个素材只属于朋克风格,则其风格向量可以表示为(0,0,1),若某个素材同时属于复古风格和朋克风格,则其风格向量可以表示为(1,0,1)。其中,风格向量中的数字1代表在三维维度中,某个素材具有某个风格,风格向量中的数字0代表在三维维度中,某个素材不具有某个风格。由此可见,对于不同的典型素材,其风格向量是不同的。由此,可以将典型素材的风格进行数字化,便于后续的计算和归类。本领域技术人员可以理解,为了更准确的标识典型素材,也可以选择四维数字向量、五维数字向量或更多维度的数字向量,本发明实施例对此不做限制。在具体实施步骤s31时,每一个用户类别都可以看做一个用户群,所述用户群内的所有用户的历史流量数据所展现的素材具有相似的风格。在此基础上,可以统计在每一用户群的历史流量数据中展现次数大于预设阈值的素材,其中,所述预设阈值可以设置为1000、2000、5000等。预设阈值越高,展现次数大于预设阈值的素材越少,有可能不能全面代表所述用户群的风格,造成计算不准确;预设阈值越低,展现次数大于预设阈值的素材越多,造成计算时的噪音过大,也会影响计算结果的准确性。本领域技术人员可以根据具体需求和计算精准度的考量而合理选择预设阈值,本发明实施例对此不做限制。接下来,可以将展现次数大于预设阈值的素材按照点击率从高到低排序,选取点击率排序靠前的n个素材作为典型素材,n可以取值为200、100、50等。n值可以被看做最终参与计算的样本值,n的数值过大或过小也会影响整体样本的代表性和计算的准确度。本领域技术人员可以根据具体需求和计算精准度的考量而合理选择n的具体数值,本发明实施例对此不做限制。在具体实施步骤s32时,可以选用基于imagenet数据集训练的vgg19卷积神经网络(convolutionalneuralnetworks,简称cnn)模型的“block2_conv1”,“block3_conv1”,“block4_conv1”,“block5_conv1”等层输出结果作为素材图像的内容特征表征(featuremap)。featuremap=vgg19(img)imagestyle=concat(flatten(graml))其中,为vgg19第l层输出的featuremap中的一个矩阵,0<i<=l,为vgg19第l层输出的featuremap中的另一个矩阵,0<j<=l;表示通过向量化特征图谱i和j的内积生成的典型素材的风格向量,graml表示第l层所有风格向量的和,imagestyle表示通过连接碾平后的各层风格向量而得到的最终的风格向量。所述用户类别的风格向量可以由如下公式计算得到:其中,m为用户类别的风格向量,ctr′h*imagestyleh为第h个典型素材的风格向量,n为步骤s31中选出的点击率排序靠前素材的数量,ctr′h代表第h个典型素材的点击率经过权重比例处理后得到比率值,点击率ctr越高,则ctr′h的值就越大,例如,对于点击率分别为a、b、c的素材,经过权重比例处理后分别可以表示为a/(a+b+c)、b/(a+b+c)、c/(a+b+c)。当然,在具体计算时,也可以根据不同的应用场合而直接利用点击率的具体数值进行风格向量的计算,而不利用经过权重比例处理后得到比率值。本实施例在计算用户类别的风格向量时,可以将每个典型素材的点击率的权重考虑在内,点击率较高的素材占有较大比重,点击率较低的素材占有较小的比重。由于点击率高的素材可以比点击率低的素材更加准确的反映出相关用户喜欢的风格,由此,可以有效提高计算的准确性,从而有利于增加后续素材推荐时的精准度。请继续参考图1,接下来,执行步骤s13,对于检测到的实时流量,可以根据所述实时流量数据确定当前用户所属的用户类别。具体实施时,当用户实时浏览某一网页时,该用户的互联网访问行为便可以生成实时流量数据。例如,当用户访问素材展示平台(如网页)时,若该网页上有一个广告素材的展示位,该网页所属的站点(即后台服务器)会通知dsp有人在浏览该网页,并询问dsp是否需要竞价该广告素材的展示位。所述dsp可以采用本实施例的技术方案,根据与实时用户相关联的设备id数据或者实时用户基础信息数据来计算与各个用户类别中的中心数据之间的相似度,并根据最高相似度确定实时用户所属的具体用户类别。为实时用户确定具体的用户类别后,可以继续执行步骤s14,将素材库中的储备素材按照其风格向量与所述当前用户所属的用户类别的风格向量的相似度进行排序,以根据排序结果确定候选素材。进一步地,可以按照相似度从高到低对所述储备素材进行排序,选取排序靠前的m张素材作为候选素材。在一个具体应用场景中,例如:用户类别共有5个,则用户类别的风向向量共有5个(例如:h1、h2、h3、h4、h5),素材库中具有7个储备素材,这7个储备素材共有7个风格向量(例如:fig1、fig2、fig3、fig4、fig5、fig6、fig7)。所述7个储备素材其风格向量分别与5个用户类别的风格向量的相似度在表1比较如下:表1h1h2h3h4h5fig11.21.9360.4fig21.53.64.721fig30.84.4752.6fig43613.54.1fig522.850.63.2fig66.912.44.65fig74.50.43.971.7在上表中,第一行中的h1、h2、h3、h4、h5是五个用户类别所对应的风格向量,第一列中的fig1-fig7代表的是素材库中的储备素材的风格向量,表格中的数字是储备素材的风格向量与5个不用的用户类别风格向量之间的距离,数字越小,则表示相似度越高。所述储备素材的风格向量可以通过与典型素材风格向量相同的计算方式得到,在此不再赘述。若实时流量数据表明,实时用户所属的用户类别具有的风格向量为h5,则按照fig1-fig7的风格向量与h5之间相似度的大小进行排序。例如,按照上表进行排序为fig1、fig2、fig7、fig3、fig5、fig4、fig6。接下来,可以根据系统预先设定的每次需要向实时用户推荐的素材张数准备候选素材。如果需要向用户推荐3张素材,则推荐的候选素材可以为fig1、fig2、fig7;如果需要向用户推荐5张素材,则推荐的候选素材可以为fig1、fig2、fig7、fig3、fig5;如果需要向用户推荐7张素材,则推荐的候选素材可以为fig1、fig2、fig7、fig3、fig5、fig4、fig6。在确定候选素材后,可以继续执行步骤s15,以将所述候选素材推荐给所述当前用户。在上述具体应用场景中,也可以不按照相似度从高到低(即距离从小到大)的顺序来确定向实时用户推荐的候选素材。换句话说,如果需要向用户推荐3张素材,也可以从上述7个素材中随机选取3张素材作为推荐的候选素材,例如:可以是fig2、fig5、fig4,此时,fig2、fig5、fig4与用户类别风格向量h5的相似度并不是排列在前3位的。本发明技术方案可以将素材库中的储备素材按照其风格向量与所述当前用户所属的用户类别的风格向量的相似度从高到低进行排序,选取排序靠前的m张素材作为候选素材。由此,对于素材库中新加入的从未投放过的素材,可以预先判断可能对其感兴趣的用户,防止新素材的冷启动,有效避免了素材投放成本的浪费。虽然以上实施例以广告推荐为例进行说明,但需要说明的是,本实施例的技术方案并不限于广告推荐,还可以用于内容推荐或其他对象的推荐。例如,在内容推荐中,可以对新闻、短视频等素材进行推荐。进行内容推荐时,新闻、短视频的风格维度可以根据需要进行设定。在一个非限制性的实施方式中,例如,可以根据新闻中所包含的关键词将所述新闻的素材风格划分为报道风格、评论风格、分析风格等。进一步地,参照图4,图4是本发明实施例一种素材推荐装置的结构示意图。本发明实施例还提供了一种素材推荐装置1,所述素材推荐装置1可以包括:用户聚类模块2,适于根据多个用户的历史流量数据,确定至少一个用户类别;素材风格统计模块3,适于统计所述各个用户类别各自的典型素材,并根据各个用户类别的典型素材的风格向量确定每个用户类别的风格向量,所述典型素材选自每一用户类别的历史流量数据中展现次数大于预设阈值的素材,所述典型素材的风格向量是基于预定义的多个风格维度确定的;实时流量确定模块4,适于根据当前用户的实时流量数据确定所述当前用户所属的用户类别;素材排序模块5,适于将素材库中的储备素材按照其风格向量与所述当前用户所属的用户类别的风格向量的相似度进行排序,以根据排序结果确定候选素材;素材推荐模块6,适于将所述候选素材推荐给所述当前用户。所述素材推荐装置1可以向用户推荐其感兴趣的广告素材,有利于提高素材的点击率。对于广告推荐而言,还有利于提高转化率,从而实现以更少的成本获得更优的广告素材投放效果。对于内容(例如新闻、短视频等)推荐而言,可以使得推荐更加准确,有利于改善用户体验。进一步地,参照图5,图5是图4中用户聚类模块的结构示意图。所述用户聚类模块2可以包括:聚类中心选取子模块21,适于从所述多个用户的历史流量数据中选取k个用户的历史流量数据作为中心数据,其中,每个中心数据均对应一个用户类别,k为正整数;用户划分子模块22,适于根据所述多个用户的历史流量数据与k个所述中心数据的相似度,将所述多个用户划分为k个用户类别。所述素材推荐装置中的用户聚类模块可以采用聚类方式来对多个用户进行分类,便于后续对用户类别的风格进行准确分析。进一步地,所述用户划分子模块22可以包括:比较单元221,适于比较各个用户的历史流量数据与k个所述中心数据的相似度,记录下与每一用户相似度最高的中心数据;划分单元222,适于将各个用户划分入相似度最高的中心数据对应的用户类别中。进一步地,参照图6,图6是图4中素材风格统计模块的结构示意图。所述素材风格统计模块3可以包括:典型素材提取子模块31,统计在每一用户类别的历史流量数据中展现次数大于预设阈值的素材,并将展现次数大于预设阈值的素材按照点击率从高到低排序,选取点击率排序靠前的n个素材作为典型素材,其中,n为正整数;素材风格提取子模块32,对于每一用户类别,适于分别计算其中各个典型素材的风格向量,并根据各个典型素材的风格向量计算所述用户类别的风格向量。由于点击率高的素材可以比点击率低的素材更加准确的反应出相关用户喜欢的风格,因此,把点击率高的素材作为典型素材,可能提高计算的准确性,从而有利于增加后续素材推荐时的精准度。进一步地,所述素材风格提取子模块32可以包括:累加单元321,适于计算所述用户类别内各个典型素材的风格向量的累加和,以得到所述用户类别的风格向量。进一步地,所述素材排序模块5可以包括:排序子模块(未图示),适于按照相似度从高到低对所述储备素材进行排序,选取排序靠前的m张素材作为候选素材,其中,m为正整数。由此,所述素材推荐装置1在应用时,对于素材库中新加入的从未投放过的素材,可以预先判断可能对其感兴趣的用户,防止新素材的冷启动,有效避免了素材投放成本的浪费。关于所述素材推荐装置1的工作原理、工作方式的更多内容,可以参照图1至图3中的相关描述,这里不再赘述。本发明实施例还公开了一种存储介质,其上存储有计算机指令,所述计算机指令运行时可以执行图1、图2或图3中所示的素材推荐方法的步骤。所述存储介质可以包括rom、ram、磁盘或光盘等。所述存储介质还可以包括非挥发性存储器(non-volatile)或者非瞬态(non-transitory)存储器等。本发明实施例还公开了一种终端,所述终端可以包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的计算机指令。所述处理器运行所述计算机指令时可以执行图1、图2或图3中所示的素材推荐方法的步骤。所述终端包括但不限于手机、计算机、平板电脑等终端设备。虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1