生成推荐模型的方法、推荐系统、计算设备及存储介质与流程

文档序号:36100561发布日期:2023-11-21 12:49阅读:59来源:国知局
生成推荐模型的方法与流程

本申请涉及计算机,尤其涉及一种生成推荐模型的方法、推荐系统、计算设备及存储介质。


背景技术:

1、随着互联网的普及,每个人都可以成为信息的发布者与传播者,用户凭借互联网与智能设备享受着不断更新的、丰富的购物信息所带来的极大便利;同时,也不得不遭受着过度的信息轰炸,信息过载问题日益突出。在复杂的信息环境中,如何在信息污染的海量信息中筛选出对自己有价值的内容,成为亟待解决的问题。个性化的推荐技术,是解决信息过载最有效的方式之一。大数据智能推荐系统成为信息领域的研究热点,它的目标就是搭建海量信息和用户兴趣需求的桥梁,用户能更快更好地获取对自己有价值的信息,同时信息能够更好地被推荐给喜欢它的用户,从而推荐平台留存更多的用户资源,实现信息生产者、信息消费者和平台提供者的共赢。

2、从传统上,推荐系统的召回阶段强调快速,在准确程度要求并非很高的情况下,尽可能多召回用户有可能感兴趣的资源。其对资源的丰富度要求较高,一般为策略型导向,由多路召回组成,如非个性化的热门召回、个性化的兴趣标签等召回。排序阶段则可以融入较多特征,使用复杂模型,实现精准的个性化推荐。排序除了“快”(快指的是高效的反馈结果),更要求“准”(准指的是推荐结果准确性高)。排序阶段的模型能够取到很好的效果,离不开高质量的样本,而样本通过特征来刻画。从长远看,特征工程的优劣决定了模型的上限,例如早期的逻辑回归(logistic regression)并没有多复杂,但是却被业内使用多年,就是因为其中汇聚了特征工程的大量经验和高效性。

3、由此可见,在推荐系统中,特征工程的存在还是有其必要性的,特别是一些高级特征。常见的一种方案是人工特征工程。该方案首先收集大量用户与点击资源对应的标记,通过观察数据,合理推理,构造词袋特征。其次,使用线性逻辑回归等方法来训练得到模型,最终通过模型判断,某个资源被某个用户点击的概率大于某个阈值,则该用户推荐该资源。为了提升特征质量,需要不断的提出新特征。该方案的主要优点是技术实现简单、推荐结果用户说服力好,解释性强。然而,根据数据,人工能抽象出来的特征总类很有限。随着人工特征工程的深入,投入的人力和时间越来越长,得到的新特征对系统的提升却越来越少。

4、因此,需要一种新的推荐方案,以解决推荐系统中特征的相关问题。


技术实现思路

1、本申请提供了一种生成推荐模型的方法、推荐系统、计算设备及存储介质,以力图解决或者至少缓解上面存在的至少一个问题。

2、根据本申请的一个方面,提供了生成推荐模型的方法,包括:利用已有用户的用户特征,预测用户缺省的用户特征,其中所述用户特征包括用户的行为特征、上下文特征和属性特征;利用已有资源的资源特征,预测新生产资源缺省的资源特征,其中所述资源特征包括动态特征和静态特征;对用户特征和资源特征进行处理,生成特征向量的集合,作为训练样本;利用所述训练样本来训练生成推荐模型,所述推荐模型包含耦接的全连接神经网络组件和预测分类组件。

3、可选地,在根据本申请的方法中,利用已有用户的用户特征,预测用户缺省的用户特征,包括:若缺省的用户特征包含行为特征,则选取已有的行为特征中的众数,作为缺省的行为特征;若缺省的用户特征包含属性特征,则至少利用缺省属性特征的用户的上下文特征与已有的上下文特征,确定出与该缺省属性特征的用户属于同一类别的用户,并利用同一类别用户的属性特征,确定出缺省的属性特征。

4、可选地,在根据本申请的方法中,利用同一类别用户的属性特征,确定出缺省的属性特征,包括:选取同一类别下用户的属性特征的众数,作为缺省的属性特征。

5、可选地,在根据本申请的方法中,利用已有资源的资源特征,预测新生产资源缺省的资源特征,包括:利用向量处理模型对所述静态特征进行处理,生成资源的语义特征;利用语义特征计算各资源的相似度,将相似度最高的资源对应的动态特征,作为缺省的动态特征。

6、可选地,在根据本申请的方法中,对用户特征和资源特征进行处理,生成特征向量的集合,包括:基于压缩编码对用户特征进行分桶,生成用户特征向量;基于资源的动态特征和语义特征,生成资源特征向量;对所述用户特征向量和所述资源特征向量进行特征交叉组合,生成新的特征向量,并将所述用户特征向量、所述资源特征向量和新的特征向量,作为特征向量的集合。

7、可选地,在根据本申请的方法中,利用训练样本来训练生成推荐模型,推荐模型包含耦接的全连接神经网络组件和预测分类组件,还包括:基于训练样本中用户对资源是否产生点击行为,对所述训练样本进行标注;将训练样本输入所述全连接神经网络组件,以生成新的特征向量;将所述新的特征向量输入所述预测分类组件,以输出预测点击率;基于所述预测点击率和标注的数据,调整所述推荐模型的网络参数,直到训练结束,对应的推荐模型为最终训练生成的推荐模型。

8、可选地,根据本申请的方法还包括:基于用户行为日志生成用户特征,其中,所述行为特征至少包括:浏览、点击、评论、搜索、分享中的至少一个,上下文特征至少包括设备型号、网络状态,属性特征至少包括性别、年龄、地域;基于用户与资源之间的交互行为,获取资源的动态特征,所述动态特征至少包括:曝光、点击、评论、点赞;从资源本身获取资源的静态特征,所述静态特征至少包括:资源类型、作者、发布时间。

9、根据本申请的再一方面,提供了一种推荐系统,包括:离线训练单元,适于通过执行如上所述的方法,训练生成推荐模型;线上排序单元,适于针对线上访问用户,基于所述用户的用户特征和候选资源的资源特征,利用所述推荐模型确定出所述用户的推荐资源及其顺序。

10、根据本申请的再一方面,提供了一种计算设备,包括:一个或多个处理器存储器;一个或多个程序,其中所述一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行如上任一方法的指令。

11、根据本申请的再一方面,提供了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令在被计算设备执行时,使得计算设备执行如上所述的任一方法。

12、综上所述,根据本申请的方案,一方面,构建用户已有特征与缺省特征间的联系,预测缺省特征值;另一方面,计算资源的静态特征的语义相似度,用相似资源的特征填充缺省特征。解决了对缺少的特征(如,新用户的行为特征、冷门资源特征等)进行随机填充的不稳定性与不可解释性。此外,输入推荐模型的特征向量包含用户特征向量、资源特征向量及其交叉特征向量,很好地挖掘了特征间的潜在语义属性,丰富了底层特征语义信息。总之,根据本申请的方案,利用资源、用户的多维度信息,生成丰富的特征向量,能够有效提高推荐的精度。

13、上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。



技术特征:

1.一种生成推荐模型的方法,包括:

2.如权利要求1所述的方法,其中,所述利用已有用户的用户特征,预测用户缺省的用户特征,包括:

3.如权利要求2所述的方法,其中,利用同一类别用户的属性特征,确定出缺省的属性特征,包括:

4.如权利要求1-3中任一项所述的方法,其中,所述利用已有资源的资源特征,预测新生产资源缺省的资源特征,包括:

5.如权利要求1-4中任一项所述的方法,其中,所述对用户特征和资源特征进行处理,生成特征向量的集合,包括:

6.如权利要求1-5中任一项所述的方法,所述利用训练样本来训练生成推荐模型,推荐模型包含耦接的全连接神经网络组件和预测分类组件,还包括:

7.如权利要求1-6中任一项所述的方法,还包括:

8.一种推荐系统,包括:

9.一种计算设备,包括:

10.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令在被计算设备执行时,使得所述计算设备执行如权利要求1-7中任一项所述的方法。


技术总结
本申请公开了生成推荐模型的方法、推荐系统、计算设备及存储介质。其中生成推荐模型的方法包括:利用已有用户的用户特征,预测用户缺省的用户特征,其中用户特征包括用户的行为特征、上下文特征和属性特征;利用已有资源的资源特征,预测新生产资源缺省的资源特征,其中资源特征包括动态特征和静态特征;对用户特征和资源特征进行处理,生成特征向量的集合,作为训练样本;利用训练样本来训练生成推荐模型,推荐模型包含耦接的全连接神经网络组件和预测分类组件。根据本方案可以提升排序阶段的准确率。

技术研发人员:李相相,王显峰,吴一璞,范欣
受保护的技术使用者:车智互联(北京)科技有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1