本技术涉及计算机,特别是涉及一种异常评论处理方法、计算机设备、存储介质和计算机程序产品。
背景技术:
1、随着互联网的普及,越来越多的用户愿意在互联网上针对音乐、影视剧、小说等作品发表评论;而一个健康的评论生态,不仅有助于用户之间的交流,还有助于创作者创作出更优秀的作品。
2、相关技术中,大多采用基于纯文本内容识别的方法对评论文本进行检测,例如根据关键词库从内容角度判定单条评论是否异常,进而针对异常评论采取对应的处理措施。但实际上,除了恶意评论以外,异常评论还包括大量内容一致或内容相似的重复评论和广告评论。因此,基于纯文本内容识别的异常评论处理方法会导致评论区中仍然存在大量异常评论,后续还需要对评论区进行人为审核,降低了异常评论处理的效率。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高处理效率的异常评论处理方法、计算机设备、计算机可读存储介质和计算机程序产品。
2、对歌曲的待检测评论进行聚类处理,得到所述歌曲对应的评论集;
3、确认所述歌曲对应的评论集的评论聚集信息,根据所述歌曲对应的评论集的评论聚集信息,确认所述歌曲的评论聚集信息;所述评论集的评论聚集信息用于表征所述评论集中的评论的整体聚集程度;
4、根据所述歌曲的评论聚集信息,以及所述歌曲的歌曲类型,对所述歌曲进行排序;
5、对排序后的歌曲进行对应的异常评论处理。
6、在其中一个实施例中,所述确认所述歌曲对应的评论集的评论聚集信息,根据所述歌曲对应的评论集的评论聚集信息,确认所述歌曲的评论聚集信息,包括:
7、对所述歌曲对应的评论集中的评论,进行文本去重处理,得到所述评论集的目标评论,以及对所述评论集中的评论的发布用户,进行用户去重处理,得到所述评论集的目标用户;
8、根据所述评论集的目标评论与目标用户,确认所述评论集的评论聚集信息;
9、对所述歌曲的评论集的评论聚集信息进行融合处理,得到所述歌曲的评论聚集信息。
10、在其中一个实施例中,所述对所述歌曲的评论集的评论聚集信息进行融合处理,得到所述歌曲的评论聚集信息,包括:
11、从所述歌曲的评论集中,识别出对应的评论聚集信息满足预设评论聚集信息条件的目标评论集;
12、对所述目标评论集的评论聚集信息进行融合处理,得到所述歌曲的评论聚集信息。
13、在其中一个实施例中,所述根据所述歌曲的评论聚集信息,以及所述歌曲的歌曲类型,对所述歌曲进行排序,包括:
14、从所述歌曲中,识别出对应的歌曲类型为异常歌曲的第一歌曲,以及识别出对应的歌曲类型为正常歌曲的第二歌曲;所述第一歌曲为对应的待检测评论中,内容异常评论的评论数量满足预设阈值的歌曲;
15、按照所述第一歌曲的评论聚集信息从高到低的顺序,对所述第一歌曲进行排序,以及按照所述第二歌曲的评论聚集信息从高到低的顺序,对所述第二歌曲进行排序;
16、根据排序后的第一歌曲与排序后的第二歌曲,得到所述排序后的歌曲;所述排序后的第一歌曲均排列在所述排序后的第二歌曲前面。
17、在其中一个实施例中,在对歌曲的待检测评论进行聚类处理,得到所述歌曲对应的评论集之前,还包括:
18、获取歌曲应用程序上的评论在预设特征指标下的指标信息;所述预设特征指标至少包括评论特征指标与用户特征指标;
19、从所述评论中,确认出对应的指标信息满足预设异常指标条件的评论,作为所述待检测评论。
20、在其中一个实施例中,所述评论特征指标至少包括评论数量指标与有效评论指标;
21、所述获取歌曲应用程序上的评论在预设特征指标下的指标信息,包括:
22、获取所述评论对应的歌曲在第一预设时间段内的第一评论数量信息与歌曲播放数量信息,以及所述评论对应的歌曲在第二预设时间段内的第二评论数量信息;所述第一预设时间段小于所述第二预设时间段;
23、根据所述第一评论数量信息与所述第二评论数量信息,确认所述评论在所述评论数量指标下的评论数量信息,以及根据所述第一评论数量信息与所述歌曲播放数量信息,确认所述评论在所述有效评论指标下的有效评论信息;
24、将所述评论数量信息与所述有效评论信息,确认为所述评论在所述评论特征指标下的指标信息。
25、在其中一个实施例中,所述获取歌曲应用程序上的评论在预设特征指标下的指标信息,还包括:
26、确认所述评论的发布用户;
27、获取所述发布用户的历史行为信息;
28、根据所述发布用户的历史行为信息,确认所述发布用户在所述用户特征指标下的指标信息。
29、在其中一个实施例中,所述歌曲的歌曲类型,通过以下方式得到:
30、对所述歌曲的待检测评论进行内容分类处理,得到所述待检测评论的评论类型;
31、在所述歌曲的待检测评论中,对应的评论类型为内容异常评论的评论数量满足预设阈值的情况下,将所述歌曲的歌曲类型确认为异常歌曲。
32、第二方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
33、对歌曲的待检测评论进行聚类处理,得到所述歌曲对应的评论集;
34、确认所述歌曲对应的评论集的评论聚集信息,根据所述歌曲对应的评论集的评论聚集信息,确认所述歌曲的评论聚集信息;所述评论集的评论聚集信息用于表征所述评论集中的评论的整体聚集程度;
35、根据所述歌曲的评论聚集信息,以及所述歌曲的歌曲类型,对所述歌曲进行排序;
36、对排序后的歌曲进行对应的异常评论处理。
37、第三方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
38、对歌曲的待检测评论进行聚类处理,得到所述歌曲对应的评论集;
39、确认所述歌曲对应的评论集的评论聚集信息,根据所述歌曲对应的评论集的评论聚集信息,确认所述歌曲的评论聚集信息;所述评论集的评论聚集信息用于表征所述评论集中的评论的整体聚集程度;
40、根据所述歌曲的评论聚集信息,以及所述歌曲的歌曲类型,对所述歌曲进行排序;
41、对排序后的歌曲进行对应的异常评论处理。
42、第四方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
43、对歌曲的待检测评论进行聚类处理,得到所述歌曲对应的评论集;
44、确认所述歌曲对应的评论集的评论聚集信息,根据所述歌曲对应的评论集的评论聚集信息,确认所述歌曲的评论聚集信息;所述评论集的评论聚集信息用于表征所述评论集中的评论的整体聚集程度;
45、根据所述歌曲的评论聚集信息,以及所述歌曲的歌曲类型,对所述歌曲进行排序;
46、对排序后的歌曲进行对应的异常评论处理。
47、上述异常评论处理方法、计算机设备、存储介质和计算机程序产品,首先对歌曲的待检测评论进行聚类处理,得到歌曲对应的评论集;然后确认歌曲对应的评论集的评论聚集信息,根据歌曲对应的评论集的评论聚集信息,确认歌曲的评论聚集信息;评论集的评论聚集信息用于表征评论集中的评论的整体聚集程度;接着根据歌曲的评论聚集信息,以及歌曲的歌曲类型,对歌曲进行排序;最后对排序后的歌曲进行对应的异常评论处理。基于以上过程的异常评论处理方法,通过聚类能够基于文本内容得到歌曲的各个评论集,又根据歌曲的各个评论集的评论聚集情况反映歌曲的评论聚集情况,接着再根据歌曲的评论聚集情况和歌曲的类型,对歌曲进行排序,从而实现优先对存在恶意评论、重复评论或广告评论的歌曲进行相对应的处理;这样,就不需要在纯文本内容识别之后引入对评论区的人工审核,从而提高了异常评论处理的效率。