用于物品推荐的问题确定方法和装置与流程

文档序号:12464901阅读:214来源:国知局
用于物品推荐的问题确定方法和装置与流程

本公开涉及电子商务领域,尤其涉及一种用于物品推荐的问题确定方法和装置。



背景技术:

目前客户的个性化的定制已经成为一个技术热点,常见的例如为用户推荐用户感兴趣的物品。为了使推荐的物品符合用户的期望,通常需要在进行推荐之前充分了解用户的喜好,而通过问卷调查来获取用户喜好是一个比较有效的途径。问卷调查是让用户回答一些预先设置好的问题的一种调查方式,通过这种方式可以基于用户对每个问题作答的答案,来获取用户的喜好,从而可以根据用户的喜好来进行推荐。这些问题可以称之为引导问题。在现有技术中,通常会利用决策树算法对引导问题进行确定,而由此得到的上一个和下一个问题,只是考虑了如何选择区分度最好的物品来获取用户兴趣的最大信息量,而并未考虑上下层问题的相关性,通常用户在回答完上一个问题后,下一个引导问题会和上一个问题间有很大的跳跃性,用户体验差,导致很多用户放弃引导问题的回答。



技术实现要素:

本公开提供一种用于物品推荐的问题确定方法和装置,用以解决生成引导问题时上下级问题之间关联性低导致的问题之间有较大跳跃性的问题。

根据本公开实施例的第一方面,提供一种用于物品推荐的问题确定方法,所述方法包括:

根据上一引导问题的答案,利用预先建立的决策树确定所述上一引导问题的答案所指示的物品,所述决策树是根据物品总集合中物品的评分数据以及语义特征之间的关系建立的;

根据所述上一引导问题的答案所指示的物品获取当前的引导问题。

可选的,所述决策树的建立方法包括:

获取所述物品总集合中物品的评分数据,所述评分数据包括物品总集合中每个物品的评分;

根据所述物品总集合中物品的评分数据确定所述决策树的根节点,并将所述根节点作为上层节点;

提取所述上层节点的语义特征以及N个物品集合中的每个物品的语义特征,所述N个物品集合是根据所述物品总集合中每个物品的评分数据确定的,每个物品集合中包括一个或多个物品;

根据所述上层节点的语义特征以及所述N个物品集合中的每个物品的语义特征,确定所述N个物品集合中的每个物品集合对应的下层节点,得到所述N个物品集合所对应的N个下层节点;

将所述N个下层节点分别作为所述上层节点;

重复进行所述提取所述上层节点的语义特征以及N个物品集合中的每个物品的语义特征的步骤至所述将所述N个下层节点分别作为所述上层节点的步骤,直至确定第M层的节点,其中M为所述决策树的总层数;

根据第一层至所述第M层的节点,建立所述决策树。

可选的,所述根据所述物品总集合中物品的评分数据确定所述决策树的根节点,并将所述根节点作为上层节点,包括:

根据所述物品总集合中的每个物品的评分,对所述物品总集合中每个物品的评分进行分类;

计算所述物品总集合中的每个物品的每类评分的评分方差;

根据所述物品总集合中的每个物品的所有分类的评分方差,得到所述物品总集合中的每个物品的评分方差之和;

获取所述物品总集合中的评分方差之和的最小值所对应的物品,作为所述决策树的根节点。

可选的,所述根据所述上层节点的语义特征以及所述N个物品集合中的每个物品的语义特征,确定所述N个物品集合中的每个物品集合对应的下层节点,得到所述N个物品集合所对应的N个下层节点,包括:

获取所述上层节点的语义特征以及所述N个物品集合中的每个物品的语义特征;

确定所述上层节点的语义特征分别与所述N个物品集合中的每个物品的语义特征的语义相关度;

根据所述上层节点的语义特征与所述N个物品集合中的每个物品的语义特征的语义相关度,获取所述N个物品集合中的每个物品的区分度误差值;

根据所述N个物品集合中的每个物品的区分度误差值,获取每个物品集合中区分度误差值的最小值所对应的物品;

确定所述每个物品集合中的区分度误差值的最小值所对应的物品为所述每个物品集合对应的下层节点。

可选的,所述根据所述上层节点的语义特征与所述N个物品集合中的每个物品的语义特征的语义相关度,获取所述N个物品集合中的每个物品的区分度误差值,包括:通过利用区分度误差值公式,根据所述N个物品集合中的每个物品的评分方差确定所述N个物品集合中的每个物品的区分度误差值,所述区分度误差值公式包括:

Errt(i)=e2(t)–Wi*dis[TF(i,j)]

其中,i表示第一物品集合的第i个物品,j表示所述上层节点,所述第一物品集合为所述N个物品集合中的任一集合,Errt(i)表示所述第一物品集合的第i个物品的区分度误差值,e2(t)表示所述第一物品集合的第i个物品的评分方差,TF(i,j)表示所述上层节点的语义特征以及所述第一物品集合的第i个物品的语义特征,dis[TF(i,j)]表示所述上层节点的语义特征与所述第一物品集合的第i个物品的语义特征的语义相关度,Wi表示语义相关度的归一化权重值。

可选的,所述上层节点的语义特征与所述第一物品集合的第i个物品的语义特征的语义相关度的归一化权重值是根据所述第一物品集合的第i个物品的所有语义特征确定的。

可选的,所述方法还包括:

接收所述当前的引导问题的答案;

根据所述当前的引导问题的答案生成推荐信息。

可选的,其特征在于,所述根据所述当前的引导问题的答案生成推荐信息,还包括:

当所述当前的引导问题的答案为肯定回答时,选择与所述当前的引导问题所对应的节点类似的物品生成所述推荐信息;或者

当所述当前的引导问题的答案为否定回答或者不确定时,采用协同过滤算法获取所述推荐信息。

可选的,所述方法还包括:

根据所述当前的引导问题的答案,以及所述当前的引导问题之前已回答的一个或多个引导问题的答案,确定用户的兴趣图谱,所述兴趣图谱用于调整所述推荐信息中的物品顺序。

根据本公开实施例的第二方面,提供一种用于物品推荐的问题确定装置,所述装置包括:

物品确定模块,用于根据上一引导问题的答案,利用预先建立的决策树确定所述上一引导问题的答案所指示的物品,所述决策树是根据物品总集合中物品的评分数据以及语义特征之间的关系建立的;

引导问题获取模块,用于根据所述上一引导问题的答案所指示的物品获取当前的引导问题。

可选的,所述决策树的建立装置包括:

评分获取模块,用于获取所述物品总集合中物品的评分数据,所述评分数据包括物品总集合中每个物品的评分;

根节点确定模块,用于根据所述物品总集合中物品的评分数据确定所述决策树的根节点,并将所述根节点作为上层节点;

语义特征提取模块,用于提取所述上层节点的语义特征以及N个物品集合中的每个物品的语义特征,所述N个物品集合是根据所述物品总集合中每个物品的评分数据确定的,每个物品集合中包括一个或多个物品;

下层节点确定模块,用于根据所述上层节点的语义特征以及所述N个物品集合中的每个物品的语义特征,确定所述N个物品集合中的每个物品集合对应的下层节点,得到所述N个物品集合所对应的N个下层节点;

迭代模块,用于将所述N个下层节点分别作为所述上层节点;

循环模块,用于重复进行所述提取所述上层节点的语义特征以及N个物品集合中的每个物品的语义特征的步骤至所述将所述N个下层节点分别作为所述上层节点的步骤,直至确定第M层的节点,其中M为所述决策树的总层数;

决策树建立模块,用于根据第一层至所述第M层的节点,建立所述决策树。

可选的,所述根节点确定模块,包括:

分类子模块,用于根据所述物品总集合中的每个物品的评分,对所述物品总集合中每个物品的评分进行分类;

第一计算子模块,用于计算所述物品总集合中的每个物品的每类评分的评分方差;

第二计算子模块,用于根据所述物品总集合中的每个物品的所有分类的评分方差,得到所述物品总集合中的每个物品的评分方差之和;

根节点确定子模块,用于获取所述物品总集合中的评分方差之和的最小值所对应的物品,作为所述决策树的根节点。

可选的,所述下层节点确定模块,包括:

语义特征获取子模块,用于获取所述上层节点的语义特征以及所述N个物品集合中的每个物品的语义特征;

语义相关度确定子模块,用于确定所述上层节点的语义特征分别与所述N个物品集合中的每个物品的语义特征的语义相关度;

区分度误差值确定子模块,用于根据所述上层节点的语义特征与所述N个物品集合中的每个物品的语义特征的语义相关度,获取所述N个物品集合中的每个物品的区分度误差值;

最小值获取子模块,用于根据所述N个物品集合中的每个物品的区分度误差值,获取每个物品集合中区分度误差值的最小值所对应的物品;

下层节点确定子模块,用于确定所述每个物品集合中的区分度误差值的最小值所对应的物品为所述每个物品集合对应的下层节点。

可选的,所述区分度误差值确定子模块包括:通过利用区分度误差值公式,根据所述N个物品集合中的每个物品的评分方差确定所述N个物品集合中的每个物品的区分度误差值,所述区分度误差值公式包括:

Errt(i)=e2(t)–Wi*dis[TF(i,j)]

其中,i表示第一物品集合的第i个物品,j表示所述上层节点,所述第一物品集合为所述N个物品集合中的任一集合,Errt(i)表示所述第一物品集合的第i个物品的区分度误差值,e2(t)表示所述第一物品集合的第i个物品的评分方差,TF(i,j)表示所述上层节点的语义特征以及所述第一物品集合的第i个物品的语义特征,dis[TF(i,j)]表示所述上层节点的语义特征与所述第一物品集合的第i个物品的语义特征的语义相关度,Wi表示语义相关度的归一化权重值。

可选的,所述上层节点的语义特征与所述第一物品集合的第i个物品的语义特征的语义相关度的归一化权重值是根据所述第一物品集合的第i个物品的所有语义特征确定的。

可选的,所述装置还包括:

第一接收模块,用于接收所述当前的引导问题的答案;

第一推荐模块,用于根据所述当前的引导问题的答案生成推荐信息。

可选的,所述第一推荐模块,还用于:

当所述当前的引导问题的答案为肯定回答时,选择与所述当前的引导问题所对应的节点类似的物品生成所述推荐信息;或者

当所述当前的引导问题的答案为否定回答或者不确定时,采用协同过滤算法获取所述推荐信息。

可选的,所述装置还包括优化模块,所述优化模块:

用于根据所述当前的引导问题的答案,以及所述当前的引导问题之前已回答的一个或多个引导问题的答案,确定用户的兴趣图谱,所述兴趣图谱用于调整所述推荐信息中的物品顺序。

本公开的实施例提供的技术方案可以包括以下有益效果:

通过根据上一引导问题的答案,利用预先建立的决策树确定所述上一引导问题的答案所指示的物品;再根据所述上一引导问题的答案所指示的物品获取当前的引导问题。因此,本公开所提供的用于物品推荐的问题确定方法,能够解决生成引导问题时上下级问题之间关联性低导致的问题之间有较大跳跃性的问题,能够提高引导问题之间的关联性,提高答题用户的用户体验。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:

图1是根据一示例性实施例示出的一种用于物品推荐的问题确定方法的流程图;

图2是根据一示例性实施例示出的一种用于确定引导问题的决策树的建立方法的流程图;

图3是根据图2所示实施例示出的一种下层节点确定方法的流程图;

图4是根据一示例性实施例示出的另一种用于物品推荐的问题确定方法的流程图;

图5是根据一示例性实施例示出的一种用于物品推荐的问题确定装置的框图;

图6是根据图5所示实施例示出的一种决策树的建立装置的框图;

图7是根据图6所示实施例示出的一种根节点确定模块的框图;

图8是根据图6所示实施例示出的一种下层节点确定模块的框图;

图9是根据一示例性实施例示出的又一种用于物品推荐的问题确定装置的框图;

图10是根据一示例性实施例示出的又一种用于物品推荐的问题确定装置的框图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。

图1是根据一示例性实施例示出的一种用于物品推荐的问题确定方法的流程图,如图1所示,该用于物品推荐的问题确定方法可以包括以下步骤:

在步骤110中,根据上一引导问题的答案,利用预先建立的决策树确定上一引导问题的答案所指示的物品,该决策树是根据物品总集合中物品的评分数据以及语义特征之间的关系建立的。

其中,决策树的建立是后续进行下一引导问题的获取,以及物品推荐的依据,通过决策树的确立,克服了基于问题引导的推荐过程中可能会存在的冷启动问题,避免了由于没有数据依据,而无法实现对新用户的进行推荐的技术缺陷。现在通过使用下面实施例介绍本公开的决策树建立的方式,本公开是利用物品之间的语义特征的关联性来确定该决策树中作为每个节点的物品,因此建立了一个上下层节点之间具有语义关联性的决策树,因此决策树中的上下层节点之间不存在较大跳跃性,能够提高引导问题之间的关联性,以提高答题用户的用户体验。

另外,在本公开中各个实施例中的物品可以理解为一个名称,或者是包括一个名称以及与这个名称对应的属性信息的一个信息集合,其中该名称用于代指其对应的实际物品,该实际物品可以是实体物品,例如各种产品,也可以是虚拟物品,例如一部电影、一首歌等,或者也可以是某个人或动物,或者该名称也可以用于代指实际中的一类物品。

在步骤120中,根据上一引导问题的答案所指示的物品获取当前的引导问题。

示例地,在步骤110中所述的决策树是引导问题确定的基础,在获取上一引导问题的答案后,根据该答案可以通过决策树确定该答案指向的层以及在该层中对应的节点,从而作为该节点的物品就是上一引导问题的答案所指示的物品,从而能够根据该物品确定当前的引导问题(示例地,可以根据预先设置的引导问题与物品的关系,确定该物品对应的引导问题)。

例如,假设上一引导问题为“您喜欢青春类电影吗?”,且接收到的上一引导问题的答案为喜欢,则根据该答案确定在决策树的当前层对应的节点为电影《小时代》,则获取的当前的引导问题可以是以电影《小时代》为基础扩展的引导问题,例如:“您喜欢《小时代》这部电影么?”又或者“你觉得《小时代》好看么?”等等,具体的问题可以基于这部电影预先设置。可见,这样基于上述的决策树,由于上下层节点之间具有语义关联性,因此得到当前的引导问题与上一引导问题之间也具有关联性,同理,当前的引导问题与下一引导问题之间也具有关联性,从而能够提高答题用户的体验,为用户带来参与引导问题回答的兴趣。

综上所述,本公开实施例所提供的用于物品推荐的问题确定方法通过根据上一引导问题的答案,利用预先建立的决策树确定该上一引导问题的答案所指示的物品;再根据上一引导问题的答案所指示的物品获取当前的引导问题。因此,本公开所提供的用于物品推荐的问题确定方法,能够解决生成引导问题时上下级问题之间关联性低导致的问题之间有较大跳跃性的问题,能够提高引导问题之间的关联性,提高答题用户的用户体验。

图2是根据一示例性实施例示出的一种用于确定引导问题的决策树的建立方法的流程图,如图2所示,步骤110中所述的决策树的建立方法可以包括以下步骤:

在步骤111中,获取物品总集合中物品的评分数据,该评分数据包括物品总集合中每个物品的评分。

在步骤112中,根据物品总集合中物品的评分数据确定决策树的根节点,并将该根节点作为上层节点。

示例地,物品总集合可以理解为用于建立决策树的物品样本的集合,该物品总集合中物品的选取可以基于一些热门物品或者是用户的常用物品,或者是其他类型的物品,具体的可以根据实际需要来选取。物品总集合中物品的评分数据包括该物品总集合中的每个物品的评分,该物品总集合中的每个物品的评分可以是预先由用户打分得到的。

根据物品总集合中物品的评分数据确定决策树的根节点可以包括:首先根据物品总集合中的每个物品的评分,对物品总集合中每个物品的评分进行分类,该分类可以是一种模糊化的大类分类,比如,以物品为电影为例,用户的评分可以分为三大类:“喜欢”、“不喜欢”、“不知道”,分类可以按如下的规则:评分在7-10分的(满分为10分)为“喜欢”,评分在3-6分的为“不喜欢”,剩下的为“不知道”;之后计算物品总集合中的每个物品的每类评分的评分方差,并对于每个分类的类别下所有评分计算平均值,并计算该类别下的评分方差,例如用e2(tl)表示“喜欢”这个分类下的评分方差,用e2(th)表示“不喜欢”这个分类下的评分方差,用e2(tu)表示“不知道”这个分类下的评分方差,之后根据物品总集合中的每个物品的每个分类的评分方差,得到物品总集合中的每个物品的评分方差之和,最后获取物品总集合中的评分方差之和的最小值所对应的物品,作为决策树的根节点。例如,在计算得到了对于一部电影的评分分别在“喜欢”,“不喜欢”,“不知道”的三个分类的评分方差后,将三个分类的评分方差相加,即Errt(i)=e2(tl)+e2(th)+e2(tu),即可得到该电影的评分方差之和Errt(i),从而比较所有物品的评分方差之和,将该Errt(i)的最小值所对应的第i个物品作为所要建立的决策树的根节点,获取了决策树的根节点之后,可以以此根节点作为上层节点,扩展下层节点,以完成决策树的完整建立,即进行步骤113。

在步骤113中,提取上层节点的语义特征以及N个物品集合中的每个物品的语义特征,该N个物品集合是根据物品总集合中每个物品的评分确定的,每个物品集合中包括一个或多个物品。

示例地,在确定了上层节点后,决策树需扩展的下层节点不再是单一的,即除了根节点以外,之后的每层的叶子节点可以有多个,因此在筛选该上层节点对应的下层节点的时候,用于确定下层节点的物品集合也可以是多个。示例的,通过步骤101中所述的评分数据,可以确定多个物品集合。示例的,可以利用步骤112中获得的每个物品的每个分类的评分方差,通过设置阈值的方法,获取多个具有较小评分方差值的物品集合,例如获取了具有较小评分方差值的N个物品集合,然后对这N个物品集合进行步骤114,以便筛选出每个物品集合中作为下层节点的物品。

其中,如前文所述,本公开中的物品可以理解为一个名称,或者是包括一个名称以及与这个名称对应的属性信息的一个信息集合,其中该名称用于表示其所代指的实际物品,该实际物品可以是实体物品,例如各种产品,也可以是虚拟物品,例如一部电影、一首歌等,或者也可以是某个人或动物,或者该名称也可以表示其所代指的实际中的一类物品。因此,确定了上述的N个物品集合后,可以根据每个集合中每个物品的名称对应的属性信息来提取该物品的语义特征;或者,如果物品为名称,不包括对应的属性信息,则可以根据该名称来查找其对应的属性信息(可以从预先建立的数据库中查找,或者可以通过互联网查找),从而可以提取该物品的语义特征。

在步骤114中,根据上层节点的语义特征以及N个物品集合中的每个物品的语义特征,确定N个物品集合中的每个物品集合对应的下层节点,得到N个物品集合所对应的N个下层节点。

在步骤115中,将N个下层节点分别作为上层节点。

示例地,通过上一步骤中的利用语义特征的方法,确定了一个物品集合所对应的下层节点,由于步骤113中所确定的下层节点的物品集合一共有N个,因此需对这N个物品集合中的每个物品集合依次地以步骤114中的方法进行对应下层节点的选择,使得在N个物品集合中的每个物品集合中都选出一个可以作为下层节点的物品,得到对应的N个下层节点,以完成该决策树的在当前这一层的节点构建。之后用迭代的方式,将当前这一层作为新的上层,即将当前这一层的N个下层节点作为下一层的上层节点,并再次进行步骤113至115,并且以此类推,该决策树的后续的每一层中的叶子节点都采用上述的方法确定,以便继续进行该决策树的后续的叶子节点扩展,直至确定第M层的节点,其中M为决策树的总层数,从而就能够得到该决策树所需要的所有节点,可见该决策树是以根节点为基础,通过上下层节点间的语义特征作为相关性,逐步扩展成带有多个分叉和子节点的M层的决策树。

在步骤116中,根据第一层至第M层的节点,建立决策树。

综上所述,从步骤112确定的根节点开始,之后的步骤113至步骤115在根节点的基础上基于物品的语音特征对决策树的其他层节点进行了逐层扩展,直到获取到决策树所需的所有节点后,使得该决策树每层节点与其上下层节点间均具在语义上相互关联,因此利用该决策树确定的引导问题与其上一个引导问题或下一个引导问题之间具有关联性,从而能够提高答题用户的答题体验。

图3是根据图2所示实施例示出的一种下层节点确定方法的流程图,如图3所示,上述的步骤114所述的根据上层节点的语义特征以及N个物品集合中的每个物品的语义特征,确定N个物品集合中的每个物品集合对应的下层节点,得到N个物品集合所对应的N个下层节点可以包括以下步骤:

在步骤1141中,获取上层节点的语义特征以及N个物品集合中的每个物品的语义特征。

示例地,以物品为电影为例,电影的语义特征可以主要包括四类:导演,演员,类型和名称,以物品为电影《小时代》举例,对于电影《小时代》的语义特征提取为:导演为郭敬明,演员有陈学冬,杨幂等,类型属于青春类,名称是小时代,按照这样的方式对N个物品集合中的每个物品进行语义特征提取,用于下面的判断。

在步骤1142中,确定上层节点的语义特征分别与N个物品集合中的每个物品的语义特征的语义相关度。

示例地,根据步骤1141中确定的上层节点的语义特征以及N个物品集合中的所有物品的语义特征,获取其语义特征之间的语义相关度,示例的,可以定义语义特征为TF(i,j),用于确定其语义相关度,定义语义相关度为dis[TF(i,j)]。之后可以结合每个物品集合中的每个物品的评分,再进行步骤1143的判断,以获取每个物品集合中的每个物品的区分度误差值。

在步骤1143中,根据上层节点的语义特征与N个物品集合中的每个物品的语义特征的语义相关度,获取N个物品集合中的每个物品的区分度误差值。

示例地,可以通过利用以下区分度误差值公式,根据N个物品集合中的每个物品的评分方差确定N个物品集合中的每个物品的区分度误差值,该区分度误差值公式包括:

Errt(i)=e2(t)–Wi*dis[TF(i,j)]

其中,i表示第一物品集合的第i个物品,j表示上层节点,第一物品集合为N个物品集合中的任一集合,Errt(i)表示第一物品集合的第i个物品的区分度误差值,e2(t)表示第一物品集合的第i个物品的评分方差,TF(i,j)表示上层节点的语义特征以及第一物品集合的第i个物品的语义特征,dis[TF(i,j)]所述上层节点的语义特征与第一物品集合的第i个物品的语义特征的语义相关度,Wi表示语义相关度的归一化权重值。

在叶子节点的确认过程中,与确定根节点的方式不同的是,此时会考虑到上下层节点间的语义相关度,因此以第一物品集合为例,首先对第一物品集合中的物品的评分依次进行分类,并对每个分类下的评分进行方差计算,获取第一物品集合中的每个物品在所有类别的方差值之和,其具体方法与步骤112所述的方法相同,此处不再赘述。第一物品集合的第i个物品的区分度误差值是第一物品集合的第i个物品的评分方差之和减去上层节点的语义特征与第一物品集合的第i个物品的语义特征的语义相关度与语义相关度的归一化权重值之积。也就是说,在归一化权重值不变的情况下,上下层节点间语义特征之间的语义相关度越高,会导致其乘积越大,因此减法后的区分度误差值会更小;反之,则区分度误差值会更大,表明上下层的语义相关度更低。

此外,上述公式中的上层节点的语义特征与第一物品集合的第i个物品的语义特征的语义相关度的归一化权重值可以是根据该第一物品集合的第i个物品的所有语义特征确定。例如,物品的类别选择电影,并选择电影的名称、类型、导演以及主演数据作为语义特征进行提取,可以设置以上四个语义特征在语义相关度中所占的权重一样,也可以根据实际情况进行语义相关度的归一化权重值的调整,对于电影来说,用户通常所关心的主要是导演和主演,而电影的片名和类别则不是主要关心的因素,因此可以提高导演和主演在语义相关度中所占的权重,即调整语义相关度的归一化权重值。例如,可以将导演的权重调整到原本权重的4倍,而将演员的权重调整都原本权重的2倍,在此调整的基础上,获得一个更加贴合实际需求的语义相关度的归一化权重值,进而再进行上述公式的计算,使得语义相关度的值更加符合用户的实际情况,其区分度误差值将更加具有参考价值和实际针对性。因此,可针对不同的推荐的物品,依据该物品所属类别的特性灵活地进行所占权重的调整,进而提高推荐的物品符合用户兴趣的可能性,例如在餐饮类别的引导问题时,可以将口味和价位作为权重较高的语义特征,而环境和位置的权重则次之,实现更为符合实际情况的引导问题。

在步骤1144中,根据N个物品集合中的每个物品的区分度误差值,获取每个物品集合中区分度误差值的最小值所对应的物品。

在步骤1145中,确定每个物品集合中的区分度误差值的最小值所对应的物品为每个物品集合对应的下层节点。即可以理解为将每个物品集合中的区分度误差值的最小值所对应的物品确定为该物品集合中作为该上层节点的下层节点的物品。

图4是根据一示例性实施例示出的另一种用于物品推荐的问题确定方法的流程图,如图4所示,在图1所示方法的基础上还包括以下步骤:

在步骤130中,接收当前的引导问题的答案。

示例地,在步骤120中所确定的引导问题为“您喜欢《小时代》这部电影么?”,向用户发出这样的引导问题之后,等待用户针对该问题作出回答在获取到用户的答案后,可以根据该答案进行步骤140所述的判断。

在步骤140中,根据当前的引导问题的答案生成推荐信息。

示例地,在引导问题“您喜欢小时代这部电影么?”,用户对于该引导问题有三个可以选答案:“喜欢”,“不喜欢”以及“不知道”,再根据之前所建立的决策树来确定不同答案在该决策树所指向的物品,从而对该物品进行推荐,例如对于回答“喜欢”的用户,则推荐的是电影《致青春》,而回答“不喜欢”的用户的推荐为电影《中国合伙人》,而剩下的并未直接回答喜好的用户,可推荐的电影是《让子弹飞》。通过上述的方法不难看出,对于喜欢电影小时代的用户来讲,青春系列的电影应该符合其喜好,因此推荐为致青春,而不喜欢小时代的用户说明,所感兴趣的类别可能属于较为成熟的电影内容,中国合伙人是其适合的物品。另外,可以理解的是物品的推荐和下一引导问题的获取都是依据当前的引导问题的答案,即在根据用户的答案确定了某一物品时,既可以将该物品推荐给用户,也可以提出基于该物品生成的下一引导问题。例如,对于回答“不喜欢”的用户推荐电影《中国合伙人》,并生成下一引导问题为:“您喜欢中国合伙人这部电影么?”。

示例地,在获取当前的引导问题的答案后,根据所述当前的引导问题的答案生成推荐信息还可以包括:

当当前的引导问题的答案为肯定回答时,选择与当前的引导问题所对应的节点(即生成当前的引导问题所基于的那个物品)类似的物品生成推荐信息。其中,当用户对于当前的引导问题的回答为肯定回答,则说明用户可能喜欢或者感兴趣,从而可以根据该物品的语义特征,找出与该物品最为相似的物品进行推荐。

或者当当前的引导问题的答案为否定回答或者不确定时,采用协同过滤算法获取所述推荐信息。不同于之前的肯定回答,当用户对于引导问题的回答的答案为否定或者不能够清楚的直接辨别用户的喜好时,可以采取协同过滤算法,找出与该用户具有相同喜好的其他用户所选择的物品进行推荐,该协同过滤算法是通过不同用户间的相似度,选取类似喜好的物品进行推荐的方法。

其中,根据当前的引导问题的答案生成推荐信息可以理解为每获取一个引导问题的答案就根据该引导问题的答案生成推荐信息,或者也可以根据当前的引导问题的答案,以及当前的引导问题之前已回答的一个或多个引导问题的答案生成推荐信息。也就是说,该用于物品推荐的问题确定方法不再是用户必须回答完所有设计的引导问题后才会生成推荐信息的,而是可以在任一个引导问题之后都会有对应的推荐信息,从而避免了用户需要回答很多引导问题之后才能获得推荐信息的所导致的用户容易放弃答题的问题,每个问题都有相应的推荐信息可以很大程度的扩大推荐的范围和内容,提高用户的体验满意度。

进一步的,用户在回答了多个问题后,还可以根据当前的引导问题的答案,以及当前的引导问题之前已回答的一个或多个引导问题的答案,确定该用户的兴趣图谱,该兴趣图谱可以用于调整推荐信息中的物品顺序。其中,推荐的物品,可以两个以上,因此为用户提供推荐的物品时,可以利用采集到的多个引导问题的答案,建立针对单个用户的兴趣图谱,更好的优化推荐信息的物品顺序,使得最符合用户喜好的物品排在其他推荐物品之前,以实现更加贴合用户喜好的推荐,增加用户满意度。

综上所述,本公开实施例所提供的用于物品推荐的问题确定方法,通过根据上一引导问题的答案,利用预先建立的决策树确定所述上一引导问题的答案所指示的物品,而该决策树是根据物品总集合中物品的评分数据以及语义特征之间的关系建立的;再根据上一引导问题的答案所指示的物品获取当前的引导问题。因此,本公开所提供的用于物品推荐的问题确定方法,能够解决生成引导问题时上下级问题之间关联性低导致的问题之间有较大跳跃性的问题,能够提高引导问题之间的关联性,提高答题用户的用户体验。并且还可以根据引导问题的答案为用户推荐符合用户喜好的物品。

图5是根据一示例性实施例示出的一种用于物品推荐的问题确定装置的框图,该装置500可以用于执行图1-图4任一所述的方法。参见图5,该装置500包括:

物品确定模块5010,用于根据上一引导问题的答案,利用预先建立的决策树确定上一引导问题的答案所指示的物品,该决策树是根据物品总集合中物品的评分数据以及语义特征之间的关系建立的;

引导问题获取模块5020,用于根据上一引导问题的答案所指示的物品获取当前的引导问题。

可选的,图6是根据一示例性实施例示出的另一种用于物品推荐的问题确定装置的框图,参见图6,该装置500,还包括:

评分获取模块5030,用于获取物品总集合中物品的评分数据,该评分数据包括物品总集合中每个物品的评分;

根节点确定模块5040,用于根据物品总集合中物品的评分数据确定该决策树的根节点,并将根节点作为上层节点;

语义特征提取模块5050,用于提取上层节点的语义特征以及N个物品集合中的每个物品的语义特征,N个物品集合是根据物品总集合中每个物品的评分数据确定的,每个物品集合中包括一个或多个物品;

下层节点确定模块5060,用于根据上层节点的语义特征以及N个物品集合中的每个物品的语义特征,确定N个物品集合中的每个物品集合对应的下层节点,得到N个物品集合所对应的N个下层节点;

循环模块5070,用于将N个下层节点分别作为上层节点;

循环模块5070,还用于重复进行提取上层节点的语义特征以及N个物品集合中的每个物品的语义特征的步骤至将N个下层节点分别作为上层节点的步骤,直至确定第M层的节点,其中M为决策树的总层数;

决策树建立模块5080,用于根据第一层至第M层的节点,建立决策树。

可选的,图7是根据图6所示实施例示出的一种根节点确定模块的框图,参见图7,该根节点确定模块5040,包括:

分类子模块5041,用于根据物品总集合中的每个物品的评分,对物品总集合中每个物品的评分进行分类;

方差计算子模块5042,用于计算物品总集合中的每个物品的每类评分的评分方差;

方差和计算子模块5043,用于根据物品总集合中的每个物品的所有分类的评分方差,得到物品总集合中的每个物品的评分方差之和;

根节点确定子模块5044,用于获取物品总集合中的评分方差之和的最小值所对应的物品,作为决策树的根节点。

可选的,图8是根据图6所示实施例示出的一种下层节点确定模块的框图,参见图8,该下层节点确定模块5060,包括:

语义特征获取子模块5061,用于获取上层节点的语义特征以及N个物品集合中的每个物品的语义特征;

语义相关度确定子模块5062,用于确定上层节点的语义特征分别与N个物品集合中的每个物品的语义特征的语义相关度;

区分度误差值确定子模块5063,用于根据上层节点的语义特征与N个物品集合中的每个物品的语义特征的语义相关度,获取N个物品集合中的每个物品的区分度误差值;

物品确定子模块5064,用于根据N个物品集合中的每个物品的区分度误差值,获取每个物品集合中区分度误差值的最小值所对应的物品;

下层节点确定子模块5065,用于确定每个物品集合中的区分度误差值的最小值所对应的物品为每个物品集合对应的下层节点。

可选的,图8该装置中的区分度误差值确定子模块5063用于:通过利用区分度误差值公式,根据N个物品集合中的每个物品的评分方差确定N个物品集合中的每个物品的区分度误差值,区分度误差值公式包括:

Errt(i)=e2(t)–Wi*dis[TF(i,j)]

其中,i表示第一物品集合的第i个物品,j表示上层节点,第一物品集合为N个物品集合中的任一集合,Errt(i)表示第一物品集合的第i个物品的区分度误差值,e2(t)表示第一物品集合的第i个物品的评分方差,TF(i,j)表示上层节点的语义特征以及第一物品集合的第i个物品的语义特征,dis[TF(i,j)]表示上层节点的语义特征与第一物品集合的第i个物品的语义特征的语义相关度,Wi表示语义相关度的归一化权重值。

可选的,上层节点的语义特征与第一物品集合的第i个物品的语义特征的语义相关度的归一化权重值是根据第一物品集合的第i个物品的所有语义特征确定的。

可选的,图9是根据一示例性实施例示出的又一种用于物品推荐的问题确定装置的框图,参见图9,该装置500还包括:

答案接收模块5090,用于接收当前的引导问题的答案;

推荐模块5100,用于根据当前的引导问题的答案生成推荐信息。

可选的,推荐模块5100,还用于:

当当前的引导问题的答案为肯定回答时,选择与当前的引导问题所对应的节点类似的物品生成推荐信息;或者

当当前的引导问题的答案为否定回答或者不确定时,采用协同过滤算法获取推荐信息。

可选的,图10是根据一示例性实施例示出的又一种用于物品推荐的问题确定装置的框图,参见图10,该定装置还包括:

确定模块5110,用于根据当前的引导问题的答案,以及当前的引导问题之前已回答的一个或多个引导问题的答案,确定用户的兴趣图谱,兴趣图谱用于调整推荐信息中的物品顺序。

综上所述,本公开实施例所提供的用于物品推荐的问题确定装置,通过根据上一引导问题的答案,利用预先建立的决策树确定所述上一引导问题的答案所指示的物品,而该决策树是根据物品总集合中物品的评分数据以及语义特征之间的关系建立的;再根据上一引导问题的答案所指示的物品获取当前的引导问题。因此,本公开所提供的用于物品推荐的问题确定方法,能够解决生成引导问题时上下级问题之间关联性低导致的问题之间有较大跳跃性的问题,能够提高引导问题之间的关联性,提高答题用户的用户体验。并且还可以根据引导问题的答案为用户推荐符合用户喜好的物品。

以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。

此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1