一种内容排序方法以及相关设备与流程

文档序号:36183345发布日期:2023-11-29 20:20阅读:37来源:国知局
一种内容排序方法以及相关设备与流程

本技术涉及计算机,具体涉及一种内容排序方法以及相关设备。


背景技术:

1、内容推荐领域涉及到内容排序的问题,比如,在订阅号信息流场景中,一条消息有多个价值分数进行描述。如,由点击率预估模型给出的点击分数(pctr),代表被点击的概率;由阅读时长预估模型给出的时长分数(preadtime),代表被长时间阅读的概率;由消息群发时间、曝光时间和消息类目计算得到的时效分数,代表时效性(ptimebonus)。消息的最终排序分数,由这些不同的价值分数,通过特定的融合公式进行组合而得到,该公式称为价值公式。例如,score=w1*pctr+w2*preadtime+w3*ptimebonus,其中w1,w2,w3为组合参数。

2、上述价值公式的组合参数,需要基于搜索算法确定具体的取值。目前,在订阅号信息流场景中,通常采用的搜索算法主要包括随机搜索算法和进化搜索算法。

3、其中,随机搜索算法(random search)是最直观而易用的搜索算法。随机搜索算法对于给定的搜索空间,遍历其中每个组合参数,评估其各项指标,最后通过人工设定的规则选出其中的最优点。随机搜索算法依赖人工的挑选(或人工设计的规则),选出坐标系右上方红色的点,认定为最优的组合参数。

4、其中,进化搜索算法是一种组合优化算法。相比于随机搜索算法穷举式地评估所有组合参数的效果,进化搜索算法从初始参数出发,根据定义的奖赏值确定参数的扰动方向,迭代式地收敛到一个较好的组合参数,能够避免在效果较差的组合参数空间中进行探索,减少较多无效的计算。

5、无论随机搜索还是进化搜索,搜索算法的核心环节都是对指定的数据集d和给定的参数组合w,作出评估和挑选。当需要搜索的数据集和参数组合数据量较大的话,需要进行多次搜索,每次搜索都需要耗费大量时间,在进行订阅号信息流等内容的排序时,效率较低。


技术实现思路

1、本技术实施例提供一种内容排序方法以及相关设备,相关设备可以包括内容排序装置、电子设备、计算机可读存储介质和计算机程序产品,可以提高内容排序的效率。

2、本技术实施例提供一种内容排序方法,包括:

3、获取历史内容数据流以及待评估的候选参数,所述历史内容数据流包括多个历史内容样本序列,所述历史内容样本序列包括多个内容样本,所述内容样本携带多种价值分数,以及用于表示所述内容样本是否被点击的点击标签;

4、将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上,各所述执行器包含内容样本子集和候选参数子集;

5、从所述候选参数子集中选取多组候选参数组合,基于所述执行器并行计算各所述候选参数组合对应的候选融合分数;根据所述点击标签和所述候选融合分数,计算候选参数组合对应的奖励值;

6、从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合,根据所述优选参数组合对待排序的内容数据进行排序。

7、相应的,本技术实施例提供一种内容排序装置,包括:

8、获取单元,用于获取历史内容数据流以及待评估的候选参数,所述历史内容数据流包括多个历史内容样本序列,所述历史内容样本序列包括多个内容样本,所述内容样本携带多种价值分数,以及用于表示所述内容样本是否被点击的点击标签;

9、分配单元,用于将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上,各所述执行器包含内容样本子集和候选参数子集;

10、分数计算单元,用于从所述候选参数子集中选取多组候选参数组合,基于所述执行器并行计算各所述候选参数组合对应的候选融合分数;奖励计算单元,用于根据所述点击标签和所述候选融合分数,计算候选参数组合对应的奖励值;

11、排序单元,用于从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合,根据所述优选参数组合对待排序的内容数据进行排序。

12、可选的,在本技术的一些实施例中,所述分配单元可以包括第一分配子单元和第二分配子单元,如下:

13、第一分配子单元,用于确定第一并发度,并基于所述第一并发度将各所述候选参数映射到执行器上,所述执行器包含候选参数子集;

14、第二分配子单元,用于确定第二并发度,并基于所述第二并发度将各所述历史内容样本序列映射到执行器上,所述执行器包含内容样本子集。

15、可选的,在本技术的一些实施例中,所述分数计算单元还可以包括遍历子单元、第一选取子单元、第二选取子单元和分数计算子单元,如下:

16、遍历子单元,用于遍历所述候选参数子集中的候选参数,并遍历所述内容样本子集中的内容样本;

17、第一选取子单元,用于根据所述内容样本的属性信息,从所述点击分数、所述时长分数和所述时效分数中选取目标价值分数;

18、第二选取子单元,用于从所述候选参数子集中选取与所述目标价值分数数量对应的候选参数进行组合,得到多组候选参数组合;

19、分数计算子单元,用于基于预设融合公式、所述目标价值分数和候选参数组合,计算所述内容样本对应的候选融合分数。

20、可选的,在本技术的一些实施例中,奖励计算单元包括子指标计算子单元、总指标计算子单元和奖励计算子单元,如下:

21、子指标计算子单元,用于根据各执行器对应的所述候选融合分数与点击标签,计算所述内容样本子集的子消费指标;

22、总指标计算子单元,用于根据各执行器对应的子消费指标以及各执行器包含的历史内容样本序列的数量,确定所述历史内容数据流的总消费指标;

23、奖励计算子单元,用于根据所述总消费指标相较于预设指标基线的提升幅度,确定候选参数组合对应的奖励值。

24、本技术实施例提供的一种电子设备,包括处理器和存储器,所述存储器存储有多条指令,所述处理器加载所述指令,以执行本技术实施例提供的内容排序方法中的步骤。

25、本技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现本技术实施例提供的内容排序方法中的步骤。

26、此外,本技术实施例还提供一种计算机程序产品,包括计算机程序或指令,该计算机程序或指令被处理器执行时实现本技术实施例提供的内容排序方法中的步骤。

27、本技术实施例提供了一种内容排序方法以及相关设备,可以获取历史内容数据流以及待评估的候选参数,所述历史内容数据流包括多个历史内容样本序列,所述历史内容样本序列包括多个内容样本,所述内容样本携带多种价值分数,以及用于表示所述内容样本是否被点击的点击标签;将所述历史内容样本序列以及所述候选参数分配到多个并发运行的执行器上,各所述执行器包含内容样本子集和候选参数子集;从所述候选参数子集中选取多组候选参数组合,基于所述执行器并行计算各所述候选参数组合对应的候选融合分数;根据所述点击标签和所述候选融合分数,计算候选参数组合对应的奖励值;从所述候选参数组合中选取奖励值最大的参数组合作为优选参数组合,根据所述优选参数组合对待排序的内容数据进行排序。本技术采用并发运行的执行器,对每一个执行器分配一组候选参数子集和一组内容样本子集,从而可以使执行器同时对多组内容样本子集搜索优选参数组合,降低了搜索过程的耗时,提高了在单位时间内搜索到更好效果的公式的机会。应用在订阅流消息排序场景中时,可以提升用户的消费时长,提高用户的点击率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1