一种多维度的评论审核方法、装置、电子设备及存储介质与流程

文档序号:37365249发布日期:2024-03-22 10:18阅读:13来源:国知局
一种多维度的评论审核方法、装置、电子设备及存储介质与流程

本发明属于数据处理,具体涉及一种多维度的评论审核方法、装置、电子设备及存储介质。


背景技术:

1、目前,用户评论广泛存在于新闻资讯和互联网内容等平台,其在丰富了平台社区互动性的同时,也带来了大量的评论审核工作;其中,在实际应用时,传统的评论审核方式为人工审核,其存在以下不足:人工对于优质评论的定义过于主观,难以形成统一化的、流程化的高效审核流程,且大量的审核工作又会造成审核效率过低,从而使优质评论难以在第一时间发布;基于此,如何提供一种既能够保证评论审核质量的可靠性,又能提高审核效率的评论审核方法,已成为一个亟待解决的问题。


技术实现思路

1、本发明的目的是提供一种多维度的评论审核方法、装置、电子设备及存储介质,用以解决现有技术采用人工审核所存在的审核质量低以及效率较低的问题。

2、为了实现上述目的,本发明采用以下技术方案:

3、第一方面,提供了一种多维度的评论审核方法,包括:

4、获取各个待审核评论以及历史评论数据集,其中,所述历史评论数据集中包含有处于各个待审核评论发布前的所有已发布的评论;

5、基于所述历史评论数据集,对各个待审核评论进行重复度检测处理,以得到各个待审核评论的重复度检测结果;

6、对各个待审核评论进行文本丰富性检测处理以及时效性检测处理,以分别得到各个待审核评论的文本丰富性检测结果和时效性检测结果;

7、对各个待审核评论进行情感识别处理,得到情感识别结果;

8、基于各个待审核评论的重复度检测结果、文本丰富性检测结果、时效性检测结果以及情感识别结果,生成各个待审核评论的审核结果,以便基于各个待审核评论的审核结果,从各个待审核评论中筛选出优质评论。

9、基于上述公开的内容,本发明从多个维度来进行评论审核,其中,重复度是检测待审核评论的新颖性,文本丰富性是检测待审核评论的内容是否单一;情感识别则是检测待审核评论的情感积极性(如表达的是正面还是负面的情感);而时效性则是衡量该待审核评论的发布时效;如此,从前述四个维度来进行评论审核,可量化评论质量,从而保证评论质量的稳定性和优质性,同时,整个过程无需人工参与,因此,可极大地提高评论审核效率,从而使优质评论能够在第一时间发布;基于此,相比于传统技术,本发明可在保证审核质量的可靠性的同时,提高审核效率,非常适用于在评论审核领域的大规模应用与推广。

10、在一个可能的设计中,基于所述历史评论数据集,对各个待审核评论进行重复度检测处理,以得到各个待审核评论的重复度检测结果,包括:

11、对于任一待审核评论,计算出所述任一待审核评论与所述历史评论数据集中每个历史评论之间的编辑距离以及文本相似度;

12、获取所述任一待审核评论的语义向量,并计算出所述任一待审核评论的语义向量,与各个历史评论的语义向量之间的余弦相似度;

13、基于所述任一待审核评论与每个历史评论之间的编辑距离和文本相似度,以及所述任一待审核评论的语义向量与各个历史评论的语义向量之间的余弦相似度,确定出所述任一待审核评论的重复度检测结果。

14、在一个可能的设计中,计算出所述任一待审核评论与所述历史评论数据集中每个历史评论之间的编辑距离,包括:

15、对于所述历史评论数据集中的任一历史评论,基于所述任一历史评论和所述任一待审核评论,构建出编辑距离矩阵,其中,所述编辑距离矩阵中的行数为k+1,列数为h+1,且k表示所述任一待审核评论的文本长度,h为所述任一历史评论的文本长度;

16、初始化所述编辑距离矩阵,将所述编辑距离矩阵中第一行元素的值依次设置为0至k,以及将所述编辑距离矩阵中的第一列元素的值依次设置为0至h,以得到初始化矩阵;

17、以所述初始化矩阵中的第二行为起点,对所述初始化矩阵进行逐行填充处理,以得到填充后的矩阵,其中,对于所述初始化矩阵中第a行第b列的元素,计算出将所述任一待审核评论中前a个字符转换为所述任一历史评论中前b个字符所需的最小代价,并将所述最小代价作为第a行第b列元素的填充值,且2≤a≤k+1,1≤b≤h+1;

18、将所述填充后的矩阵中的第k+1行第h+1列的元素的值,作为所述任一待审核评论与所述任一历史评论之间的编辑距离。

19、在一个可能的设计中,对各个待审核评论进行文本丰富性检测处理,以得到各个待审核评论的文本丰富性检测结果,包括:

20、对于任一待审核评论,基于所述任一待审核评论的字符数量,计算出所述任一待审核评论的文本长度评分;

21、对所述任一待审核评论进行词语识别处理,得出所述任一待审核评论中属于规定词语的词语数量,并基于所述词语数量,计算出所述任一待审核评论的词汇丰富度;

22、对所述任一待审核评论进行实体种类识别,得到实体种类数目;

23、根据所述实体种类数目,计算出所述任一待审核评论的实体丰富度;

24、基于所述文本长度评分、所述词汇丰富度以及所述实体丰富度,计算出所述任一待审核评论的文本丰富性检测结果。

25、在一个可能的设计中,基于所述任一待审核评论的字符数量,计算出所述任一待审核评论的文本长度评分,包括:

26、计算出所述字符数量与最小字符数之间的第一差值,以及计算出最大字符数与最小字符数之间的第二差值,并将所述第一差值与所述第二差值之间的比值,作为所述文本长度评分;

27、其中,基于所述词语数量,计算出所述任一待审核评论的词汇丰富度,包括:

28、计算出所述词语数量与最小规定词语数之间的第三差值,以及计算出最大规定词语数与最小规定词语数之间的第四差值;

29、将所述第三差值与所述第四差值之间的比值,作为所述词汇丰富度。

30、在一个可能的设计中,对各个待审核评论进行时效性检测处理,以得到各个待审核评论的时效性检测结果,包括:

31、对于任一待审核评论,计算出所述任一待审核评论与目标对象之间的发布时间差,其中,所述目标对象为所述任一待审核评论对应的评论对象;

32、按照如下公式(1),将所述发布时间差进行映射处理,得到映射值;

33、(1);

34、上述公式(1)中,表示所述映射值,表示控制参数,表示发布时间差;

35、将所述映射值,作为所述任一待审核评论的时效性检测结果。

36、在一个可能的设计中,对各个待审核评论进行情感识别处理,得到情感识别结果,包括:

37、获取训练后的情感识别模型;

38、对于任一待审核评论,将所述任一待审核评论输入至所述情感识别模型,以得到所述任一待审核评论的至少一个情感极性映射值;

39、基于所述至少一个情感极性映射值,得到所述任一待审核评论的情感识别结果。

40、第二方面,提供了一种多维度的评论审核装置,包括:

41、数据获取单元,用于获取各个待审核评论以及历史评论数据集,其中,所述历史评论数据集中包含有处于各个待审核评论发布前的所有已发布的评论;

42、第一检测单元,用于基于所述历史评论数据集,对各个待审核评论进行重复度检测处理,以得到各个待审核评论的重复度检测结果;

43、第二检测单元,用于对各个待审核评论进行文本丰富性检测处理以及时效性检测处理,以分别得到各个待审核评论的文本丰富性检测结果和时效性检测结果;

44、第三检测单元,用于对各个待审核评论进行情感识别处理,得到情感识别结果;

45、审核单元,用于基于各个待审核评论的重复度检测结果、文本丰富性检测结果、时效性检测结果以及情感识别结果,生成各个待审核评论的审核结果,以便基于各个待审核评论的审核结果,从各个待审核评论中筛选出优质评论。

46、第三方面,提供了另一种多维度的评论审核装置,以装置为电子设备为例,包括依次通信相连的存储器、处理器和收发器,其中,所述存储器用于存储计算机程序,所述收发器用于收发消息,所述处理器用于读取所述计算机程序,执行如第一方面或第一方面中任意一种可能设计的所述多维度的评论审核方法。

47、第四方面,提供了一种存储介质,存储介质上存储有指令,当所述指令在计算机上运行时,执行如第一方面或第一方面中任意一种可能设计的所述多维度的评论审核方法。

48、第五方面,提供了一种包含指令的计算机程序产品,当指令在计算机上运行时,使计算机执行如第一方面或第一方面中任意一种可能设计的所述多维度的评论审核方法。

49、有益效果:

50、(1)本发明从多个维度来进行评论审核,其中,重复度是检测待审核评论的新颖性,文本丰富性是检测待审核评论的内容是否单一;情感识别则是检测待审核评论的情感积极性(如表达的是正面还是负面的情感);而时效性则是衡量该待审核评论的发布时效;如此,从前述四个维度来进行评论审核,可量化评论质量,从而保证评论质量的稳定性和优质性,同时,整个过程无需人工参与,因此,可极大地提高评论审核效率,从而使优质评论能够在第一时间发布;基于此,相比于传统技术,本发明可在保证审核质量的可靠性的同时,提高审核效率,非常适用于在评论审核领域的大规模应用与推广。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1