资源推荐方法及装置与流程

文档序号：15558105发布日期：2018-09-29 01:36阅读：176来源：国知局

本发明涉及互联网技术领域，特别是涉及一种资源推荐方法及装置。

背景技术：

随着人工智能(ai)技术的发展，越来越多的领域使用ai技术为用户提供服务。一种常见的网络资源(例如视频资源)的个性化推荐框架是：通过用户行为构建用户画像，提取特征，利用算法模型提供给用户一组排序好的推荐列表。这种人工智能的方式相较于传统的人工运营方法具有更强的个性化、更好的多样性和更好的数据效果；然而，这种方法存在的一个缺陷就是对于用户画像的强依赖性，只有建立的丰富的用户画像信息，完整的刻画用户的各个维度属性，才能够更精准的为用户提供个性化的结果。对于一个全新的用户而言，由于缺少足够的用户行为，用户画像的维度明显不足，不能够完整的刻画这类用户，导致这种冷启动的用户群的推荐效果较为一般。

技术实现要素：

为了实现对新用户进行资源推荐，本发明实施例提供一种资源推荐方法及装置。

本发明实施例提供的一种资源推荐方法，包括：

当接收到用户针对目标资源集的推荐请求时，实时读取预先为所述目标资源集建立的决策树文件；

根据所述决策树文件，确定所述用户在所述决策树各个节点的推荐概率，其中，所述各个节点的推荐概率是基于各个节点的期望收益和所述用户在决策树的置信区间得到的；

根据所述各个节点的推荐概率，确定推荐主题。

在一种可选方式中，还包括：通过如下步骤建立所述决策树文件：

收集样本用户的特征候选集；

计算所述特征候选集中每个特征的信息熵和条件熵，并根据所述信息熵和条件熵计算得到每个特征的信息增益；

根据各个特征的信息增益的大小顺序以及与预设的最低信息增益阈值的比较结果，从所述特征候选集中按照顺序选取出各个特征作为决策树的各个节点；

根据选取的各个特征构建出决策树，并计算每个节点的期望收益。

在一种可选方式中，还包括：确定所述用户在决策树的置信区间；

所述确定所述用户在决策树的置信区间包括：

计算每个样本用户对于决策树所有节点的探索置信区间；

根据用户反馈行为实时确定用户兴趣主题，实时更新所述探索置信区间，得到所述用户在决策树的置信区间。

在一种可选方式中，所述根据所述决策树文件，确定所述用户在所述决策树各个节点的推荐概率，包括：

根据所述决策树文件，确定各个节点的期望收益，并读取所述用户在所述决策树的置信区间；

根据所述期望收益与置信区间，计算所述用户在决策树每个节点的权重为；

根据当前节点权重与所有节点权重之和，计算出当前节点的推荐概率。

在一种可选方式中，所述根据所述各个节点的推荐概率遍历决策树，从而确定推荐主题包括：

根据所述各个节点的推荐概率，确定推荐概率最高的节点为推荐根节点；

在所述推荐根节点下遍历子节点，直至遍历到叶子节点；

确定叶子节点对应的主题为所述推荐主题。

在一种可选方式中，所述目标资源集包括多个主题资源子集；

在所述确定叶子节点对应的主题为所述推荐主题之后，所述方法还包括：

基于所述推荐主题对应的主题资源子集，从所述主题资源子集中随机选取资源向用户进行推荐，或者，按照所述主题资源子集中各资源的优先级顺序向用户进行推荐。

本发明实施例提供的一种资源推荐装置，包括：

决策树获取单元，用于当接收到用户针对目标资源集的推荐请求时，实时读取预先为所述目标资源集建立的决策树文件；

推荐概率确定单元，用于根据所述决策树文件，确定所述用户在所述决策树各个节点的推荐概率，其中，所述各个节点的推荐概率是基于各个节点的期望收益和所述用户在决策树的置信区间得到的；

推荐主题确定单元，用于根据所述各个节点的推荐概率，确定推荐主题。

在一种可选方式中，还包括：决策树建立单元；

所述决策树建立单元包括：

特征收集子单元，用于收集样本用户的特征候选集；

信息增益计算子单元，计算所述特征候选集中每个特征的信息熵和条件熵，并根据所述信息熵和条件熵计算得到每个特征的信息增益；

节点选取子单元，用于根据各个特征的信息增益的大小顺序以及与预设的最低信息增益阈值的比较结果，从所述特征候选集中按照顺序选取出各个特征作为决策树的各个节点；

决策树构建子单元，用于根据选取的各个特征构建出决策树，并计算每个节点的期望收益。

在一种可选方式中，还包括：

置信区间计算单元，用于计算每个样本用户对于决策树所有节点的探索置信区间；并根据用户反馈行为实时确定用户兴趣主题，实时更新所述探索置信区间，得到所述用户在决策树的置信区间。

在一种可选方式中，所述推荐概率确定单元具体用于：根据所述决策树文件，确定各个节点的期望收益，并读取所述用户在所述决策树的置信区间；根据所述期望收益与置信区间，计算所述用户在决策树每个节点的权重为；根据当前节点权重与所有节点权重之和，计算出当前节点的推荐概率。

在一种可选方式中，所述推荐主题确定单元具体用于：根据所述各个节点的推荐概率，确定推荐概率最高的节点为推荐根节点；在所述推荐根节点下遍历子节点，直至遍历到叶子节点；

确定叶子节点对应的主题为所述推荐主题。

在一种可选方式中，所述目标资源集包括多个主题资源子集；

所述装置还包括：

推荐执行单元，用于基于所述推荐主题对应的主题资源子集，从所述主题资源子集中随机选取资源向用户进行推荐，或者，按照所述主题资源子集中各资源的优先级顺序向用户进行推荐。

可见，本发明上述实施例提出的资源推荐方法，由于是基于决策树的各节点的期望收益，能够找到在全局范围内较为优质的资源进行推荐尝试，以较快的速度找到用户的兴趣点。

由于本发明实施例基于预先建立的决策树进行资源推荐，即使对于缺乏用户行为的新用户，也可以按照决策树叶子节点的主题进行资源推荐，从而将历史最为热门的资源推荐给新用户；当该新用户反馈操作行为之后，由于基于用户对决策树的置信区间方式，能够实时的获取用户对于推荐内容的反馈，并且及时的将用户的反馈信息作用到下一次的推荐结果，能够更快的构建出用户的兴趣画像，发现用户的兴趣。

附图说明

图1是本发明一个实施例提供的一种资源推荐方法流程图；

图2是本发明一个实施例提供的一种资源推荐方法中构建决策树流程图；

图3是本发明另一个实施例提供的一种资源推荐装置结构示意图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

参见图1，为本发明实施例提供的一种资源推荐方法流程图，该方法包括：

s101：当接收到用户针对目标资源集的推荐请求时，实时读取预先为目标资源集建立的决策树文件。

目标资源集是指包括多个目标资源的集合。例如，针对视频播放网站，目标资源集可以是数目众多的视频资源。如何在海量的视频资源中向用户进行个性化的推荐，特别是针对没用兴趣记录的全新用户，本发明实施例提出根据预先建立的决策树进行资源推荐。决策树文件是指包括决策树上有关各个节点相关信息(例如各个节点的期望收益和用户在决策树的置信区间)的文件。

s102：根据决策树文件，确定用户在决策树各个节点的推荐概率，其中，各个节点的推荐概率是基于各个节点的期望收益和用户在决策树的置信区间得到的。

广义而言，期望收益是代表特征重要程度的指标：一个特征能够为分类系统带来多少信息，带来的信息越多，该特征越重要。置信区间是指由样本统计量所构造的总体参数的估计区间，置信区间体现的是这个参数的真实值有一定概率落在测量结果的周围的程度，置信区间给出的是被测量参数的测量值的可信程度，即“一个概率”。本发明实施例中，决策树上某个节点的期望收益是代表该节点在整棵树的重要程度；用户在决策树的置信区间代表用户落入该决策树的概率。

在一种可选方式中，通过以下方式确定用户在决策树各个节点的推荐概率：

(1)根据决策树文件，确定各个节点的期望收益，并读取用户在决策树的置信区间；

(2)根据期望收益与置信区间，计算用户在决策树每个节点的权重；

(3)根据当前节点权重与所有节点权重之和，计算出当前节点的推荐概率。

s103：根据各个节点的推荐概率，确定推荐主题。

决策树是一种树形结构，由多个节点依照树形结构顺序建成的。在本发明实施例中，每个叶子节点代表一种推荐主题。在一种可选方式中，通过遍历到叶子节点确定推荐主题，从而在该推荐主题下向用户进行资源推荐。例如，通过如下步骤确定推荐主题：

(1)根据各个节点的推荐概率，确定推荐概率最高的节点为推荐根节点；

(2)在推荐根节点下遍历子节点，直至遍历到叶子节点；

(3)确定叶子节点对应的主题为推荐主题。

以视频资源为例，视频资源集中往往包括多个主题构成的主题资源子集。例如，电影视频资源集包括动作电影子集、爱情电影子集、喜剧电影子集等等。

在一种可选方式中，在确定叶子节点对应的主题为推荐主题之后，还可执行如下步骤：基于推荐主题对应的主题资源子集，从主题资源子集中随机选取资源向用户进行推荐，或者，按照主题资源子集中各资源的优先级顺序向用户进行推荐。

例如，对于电影视频资源而言，如果确定的推荐主题为“爱情”电影，则查找到“爱情”电影主题对应的主题资源子集：爱情电影子集，然后从爱情电影子集中随机或者按照电影优先级选取出一部或多部爱情主题的电影向用户进行推荐。其中，主题资源子集中各资源优先级可以按照播放次数、评分等因素进行排序。

本发明实施例在已有的决策树文件的基础上，对用户(特别是新用户)进行资源推荐。可以理解，在推荐之前需要建立该决策树。下面对决策树构建过程以及如何利用决策树进行预测进行详细的示例性介绍。

一、构建决策树

参见图2，建立决策树的过程包括s201-s204。

s201：收集样本用户的特征候选集。

为了建立决策树，需要收集已知兴趣偏好的样本用户的特征。这些特征信息是提前确定的，包括但不限于各个样本用户的用户属性特征(例如性别、年龄等)以及资源偏好特征(例如用户感兴趣的主题特征等)。

s202：计算特征候选集中每个特征的信息熵和条件熵，并根据信息熵和条件熵计算得到每个特征的信息增益。

如前所述，信息增益(informationgain)的含义是：一个特征能够为分类系统带来多少信息，带来的信息越多，该特征越重要。

(1)信息熵

类别c是变量，它可能的取值是c1，c2，……，cn，而每一个类别出现的概率是p(c1)，p(c2)，……，p(cn),此时分类系统的信息熵：

(2)条件熵

(3)信息增益

对于特征x的信息增益＝系统原收益固定x之后系统的收益ig(x)＝h(c)h(c|x)

s203：根据各个特征的信息增益的大小顺序以及与预设的最低信息增益阈值的比较结果，从特征候选集中按照顺序选取出各个特征作为决策树的各个节点。

具体的，s203可包括如下子步骤：

步骤a：从特征候选集中选择信息增益最大的第一特征做为根节点，并把第一特征从特征候选集中移除。

信息增益最大代表节点(特征)对整个系统贡献最大的，也就是对用户决策影响最大。选择信息增益最大的第一特征做为根节点，这样做的目的是保证越重要的特征越先探索(因为树的从上往下遍历的)。

步骤b：计算在第一特征下其他特征的信息增益，选取出信息增益最大的第二特征；

步骤c：判断第二特征的信息增益是否小于最低信息增益阈值，若是，将第二特征从所述特征候选集中移除；否则，将第二特征作为第一特征的子节点，再将第二特征从所述特征候选集中移除；

步骤d：循环执行步骤a至步骤c，直至特征候选集为空，从而顺序地选取出各个特征作为决策树的各个节点。

s204：根据选取的各个特征构建出决策树，并计算每个节点的期望收益。

计算决策树的每一个叶子节点的期望收益：

期望收益

其中：e_k代表第k个节点的期望收益，x_i表示特征(feature)的当前取值，y表示叶子节点所属支路的feature取值集合。

可见，简言之，构建决策树的过程就是：根据样本用户的特征，按照信息增益的值，排出优先级，从上而下建立一棵树，从而通过这个树来表征特征的重要性。

二、置信区间计算

置信区间上界(upperconfidencebound，ucb)：每次都选择置信区间最大的去尝试。

置信区间：

其中：为期望收益是标准差；t是总的探索次数；ti、t是当前节点被探索的次数是使用中，为了防止数据异常，对t和t都做了加1的平滑处理。

在构建出决策树之后，计算每个样本用户对于决策树所有节点的探索置信区间；根据用户反馈行为实时确定用户兴趣主题，实时更新探索置信区间，得到针对决策树各节点的置信区间。

例如，具体过程为：

(1)计算每个用户对于决策树所有节点的探索置信区间：

其中：置信区间值与收益正相关，与被探索次数负相关；所以倾向于探索收益较高的、被探索次数少的节点。

(2)根据用户的反馈行为实时更新资源偏好特征，实时更新用户对决策树各节点的置信区间。

三、在线推荐

(步骤1)加载决策树文件及各推荐主题对应的主题资源子集到内存。

(步骤2)实时读取用户兴趣中ucb得分(couchbase)；其中，对于新用户该得分为0。

(步骤3)层次遍历决策树：通过该层每个节点的权重w＝w＝e决策树+bucb，计算每个节点的概率(n为该层的节点数)。

(步骤4)根据节点的概率p随机一个节点，作为新数的根节点v。

(步骤5)重复上述步骤2-4，直到叶子节点，选出来的主题(topic)即是本轮的探索topic。

可见，本发明实施例提出的资源推荐方法，基于决策树，能够找到在全局范围内较为优质的特征进行推荐尝试，以较快的速度找到用户的兴趣点；使用ucb的方式能够实时的获取用户对于推荐内容的反馈，并且及时的将用户的反馈信息作用到下一次的推荐结果，能够更快的构建出用户的兴趣画像，发现用户的兴趣。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

参照图3，是本发明实施例提供的一种资源推荐装置结构示意图。该装置包括：

决策树获取单元301，用于当接收到用户针对目标资源集的推荐请求时，实时读取预先为所述目标资源集建立的决策树文件；

推荐概率确定单元302，用于根据所述决策树文件，确定所述用户在所述决策树各个节点的推荐概率，其中，所述各个节点的推荐概率是基于各个节点的期望收益和所述用户在决策树的置信区间得到的；

推荐主题确定单元303，用于根据所述各个节点的推荐概率，确定推荐主题。

在一种可选方式中，还包括：决策树建立单元304；

所述决策树建立单元304包括：

特征收集子单元3041，用于收集样本用户的特征候选集；

信息增益计算子单元3042，计算所述特征候选集中每个特征的信息熵和条件熵，并根据所述信息熵和条件熵计算得到每个特征的信息增益；

节点选取子单元3043，用于根据各个特征的信息增益的大小顺序以及与预设的最低信息增益阈值的比较结果，从所述特征候选集中按照顺序选取出各个特征作为决策树的各个节点；

决策树构建子单元3044，用于根据选取的各个特征构建出决策树，并计算每个节点的期望收益。

在一种可选方式中，还包括：

置信区间计算单元305，用于计算每个样本用户对于决策树所有节点的探索置信区间；并根据用户反馈行为实时确定用户兴趣主题，实时更新所述探索置信区间，得到所述用户在决策树的置信区间。

在一种可选方式中，所述推荐概率确定单元302具体用于：根据所述决策树文件，确定各个节点的期望收益，并读取所述用户在所述决策树的置信区间；根据所述期望收益与置信区间，计算所述用户在决策树每个节点的权重为；根据当前节点权重与所有节点权重之和，计算出当前节点的推荐概率。

在一种可选方式中，所述推荐主题确定单元303具体用于：根据所述各个节点的推荐概率，确定推荐概率最高的节点为推荐根节点；在所述推荐根节点下遍历子节点，直至遍历到叶子节点；

确定叶子节点对应的主题为所述推荐主题。

在一种可选方式中，所述目标资源集包括多个主题资源子集；

所述装置还包括：

推荐执行单元306，用于基于所述推荐主题对应的主题资源子集，从所述主题资源子集中随机选取资源向用户进行推荐，或者，按照所述主题资源子集中各资源的优先级顺序向用户进行推荐。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种关系型数据库的调度方法及系统，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：查强;宋华;王志华
技术所有人：北京奇艺世纪科技有限公司
我是此专利的发明人

上一篇：一种电磁炒货机用上料系统的制作方法
上一篇：一种易清理的制药用湿法混合制粒机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。