一种识别排行榜作弊的方法和装置与流程

文档序号：12120966阅读：268来源：国知局

本发明涉及计算机技术领域，特别涉及一种识别视频排行榜作弊的方法和装置。

背景技术：

随着视频技术和网络技术的飞速发展，网络视频得到了快速的推广，成为了人们生活中最常用的娱乐方式之一。

一般提供网络视频的网站或应用程序的服务器会提供排行榜的功能，基于每个网络视频的播放数、评论数、分享数、点赞数、送礼数进行评分，并基于分值高低，在网站或应用程序的页面中，对网络视频进行排序展示。用户可以基于网络视频的排序，选择优质的网络视频进行观看。

有些用户会使用某些机器人软件，模拟不同用户进行播放、评论、分享、点赞等操作，进而将网络视频的评分刷高。这样，某些劣质的网络视频就会进入排行榜，甚至位于排行榜的前列，影响排行榜的准确性。一般技术人员会通过人工观看网络视频的方式，逐一确认每个网络视频是否为排行榜作弊的网络视频。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：

通过人工观看网络视频的方式比较耗时，识别排行榜作弊的效率较低。

技术实现要素：

为了解决现有技术的问题，本发明实施例提供了一种识别排行榜作弊的方法和装置。所述技术方案如下：

第一方面，提供了一种识别排行榜作弊的方法，所述方法包括：

获取展示信息排行榜中的第一展示信息的各评论信息；

在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息；

确定所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例；

根据所述比例，识别所述第一展示信息是否为排行榜作弊的展示信息。

可选的，所述获取展示信息排行榜中的第一展示信息的各评论信息，包括：

当达到预设的作弊检测周期时，获取展示信息排行榜中的第一展示信息的各评论信息；或者，

当接收到作弊检测指令时，获取展示信息排行榜中的第一展示信息的各评论信息；或者，

当在单位时长内第一展示信息的播放数、评论数、分享数、点赞数中的至少一项数值，与上一个单位时长内的数值的差值超过预设阈值时，获取展示信息排行榜中的所述第一展示信息的各评论信息。

这样，可以提高作弊检测的及时性。

可选的，所述在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息，包括：

基于模糊匹配和/或分词匹配，在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息。

这样，提供了查询差评信息的多种方式。

可选的，所述根据所述比例，识别所述第一展示信息是否为排行榜作弊的展示信息，包括：

确定发布所述第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目；

根据所述比例，以及所述被判定为排行榜作弊的展示信息的数目，识别所述第一展示信息是否为排行榜作弊的展示信息。

这样，可以参考历史作弊情况，使识别结果更加准确。

可选的，所述根据所述比例，以及所述被判定为排行榜作弊的展示信息的数目，识别所述第一展示信息是否为排行榜作弊的展示信息，包括：

根据所述比例，所述比例对应的第一预设加权系数，所述被判定为排行榜作弊的展示信息的数目，以及所述被判定为排行榜作弊的展示信息的数目对应的第二预设加权系数，确定所述第一展示信息的作弊加权值；

根据所述第一展示信息的作弊加权值，识别所述第一展示信息是否为排行榜作弊的展示信息。

这样，可以更精确的调节不同因素对作弊可能性的影响，使识别结果更加准确。

可选的，所述根据所述第一展示信息的作弊加权值，识别所述第一展示信息是否为排行榜作弊的展示信息，包括：

如果所述作弊加权值小于预设阈值，则判定所述第一展示信息不是排行榜作弊的展示信息；

如果所述作弊加权值大于或等于预设阈值，则判定所述第一展示信息是排行榜作弊的展示信息。

可选的，所述方法还包括：

如果所述第一展示信息为排行榜作弊的展示信息，则将所述第一展示信息，从所述展示信息排行榜中删除。

这样，将作弊的展示信息剔除，可以使排行榜的准确度更高。

第二方面，提供了一种识别排行榜作弊的装置，所述装置包括：

获取模块，用于获取展示信息排行榜中的第一展示信息的各评论信息；

差评确定模块，用于在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息；

比例确定模块，用于所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例；

识别模块，用于根据所述比例，识别所述第一展示信息是否为排行榜作弊的展示信息。

可选的，所述获取模块，用于：

当达到预设的作弊检测周期时，获取展示信息排行榜中的第一展示信息的各评论信息；或者，

当接收到作弊检测指令时，获取展示信息排行榜中的第一展示信息的各评论信息；或者，

可选的，所述差评确定模块，用于：

基于模糊匹配和/或分词匹配，在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息。

可选的，所述识别模块，用于：

确定发布所述第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目；

根据所述比例，以及所述被判定为排行榜作弊的展示信息的数目，识别所述第一展示信息是否为排行榜作弊的展示信息。

可选的，所述识别模块，用于：

根据所述第一展示信息的作弊加权值，识别所述第一展示信息是否为排行榜作弊的展示信息。

可选的，所述识别模块，用于：

如果所述作弊加权值小于预设阈值，则判定所述第一展示信息不是排行榜作弊的展示信息；

如果所述作弊加权值大于或等于预设阈值，则判定所述第一展示信息是排行榜作弊的展示信息。

可选的，所述装置还包括：

删除模块，用于如果所述第一展示信息为排行榜作弊的展示信息，则将所述第一展示信息，从所述展示信息排行榜中删除。

本发明实施例提供的技术方案带来的有益效果是：

本发明实施例中，获取展示信息排行榜中的第一展示信息的各评论信息，在第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息，确定包含至少一个预设的差评相关词的评论信息的数目在第一展示信息的各评论信息的总数目中所占的比例，根据该比例，识别第一展示信息是否为排行榜作弊的展示信息。因为作弊的展示信息的内容一般较为劣质，所以用户的评论中差评会比较多，进而，基于上述处理，可以自动识别排行榜作弊的网络视频，从而，可以提高识别排行榜作弊的效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种识别排行榜作弊的方法的流程示意图；

图2是本发明实施例提供的一种识别排行榜作弊的方法的流程示意图；

图3是本发明实施例提供的一种识别排行榜作弊的方法的流程示意图；

图4是本发明实施例提供的一种识别排行榜作弊的装置的结构示意图；

图5是本发明实施例提供的一种服务器的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。

本发明实施例提供了一种识别排行榜作弊的方法，该方法可以由网络侧的服务器实现。其中，该服务器可以是网络视频应用程序的后台服务器，或者视频网站的网站服务器。服务器可以包括处理器、存储器、收发器等部件。处理器，可以为CPU(Central Processing Unit，中央处理单元)等，可以用于获取展示信息排行榜中展示信息的评论信息，确定包含至少一个预设的差评相关词的评论信息，确定差评信息在评论信息中的比例，识别排行榜作弊，等处理。存储器，可以为RAM(Random Access Memory，随机存取存储器)，Flash(闪存)等，可以用于存储接收到的数据、处理过程所需的数据、处理过程中生成的数据等，如展示信息排行榜、展示信息、评论信息、差评相关词、比例值等。收发器，可以用于与终端进行数据传输，例如将展示信息排行榜发送给终端，可以包括天线、匹配电路、调制解调器等。

如图1所示，该方法的处理流程可以包括如下的步骤：

步骤101，获取展示信息排行榜中的第一展示信息的各评论信息。

其中，展示信息可以是视频信息、音频信息、图片信息、文字信息等等，本实施例以录播的视频信息为例进行方案的详细说明，其它情况与之类似，本实施例不再累述。第一展示信息可以是展示信息排行榜中的任一展示信息。

在实施中，用户可以通过其终端开启网络视频的应用程序，在应用程序中可以显示有大量的网络视频的选项，供用户选择。用户可以选择自己喜欢的网络视频进行播放，而且可以在观看的过程中对网络视频进行评论、分享、点赞，还可以对网络视频的发布账户赠送礼物。服务器则可以对每个网络视频的播放数、评论数、分享数、点赞数、送礼数等进行统计。基于统计数值对每个网络视频进行评分，并基于评分对网络视频进行排名，将排名最前的预设数目(如100)个网络视频设置在展示信息排行榜(即视频排行榜)中。对于展示信息排行榜中的任一展示信息，服务器可以获取该展示信息(即第一展示信息)的所有评论信息。服务器可以对展示信息排行榜中的部分或全部展示信息进行本实施例流程的处理。

可选的，可以为步骤101的处理设置相应的触发条件，触发条件可以多种多样，以下给出了其中几种可行的方式：

方式一，当达到预设的作弊检测周期时，获取展示信息排行榜中的第一展示信息的各评论信息。

在实施中，技术人员可以预先设置作弊检测周期，如1小时，作弊检测周期用于触发对排行榜作弊进行检测。每经过一个作弊检测周期，服务器则可以对展示信息排行榜中的部分或全部展示信息进行本实施例流程的处理。

方式二，当接收到作弊检测指令时，获取展示信息排行榜中的第一展示信息的各评论信息。

在实施中，技术人员可以通过控制终端向服务器发送作弊检测指令，服务器接收到作弊检测指令，则可以对展示信息排行榜中的部分或全部展示信息进行本实施例流程的处理。

方式三，当在单位时长内第一展示信息的播放数、评论数、分享数、点赞数中的至少一项数值，与上一个单位时长内的数值的差值超过预设阈值时，获取展示信息排行榜中的第一展示信息的各评论信息。

在实施中，技术人员可以预先设置一个单位时长(如1小时或5小时)，用于示信息的播放数、评论数、分享数、点赞数的单位时长统计。服务器可以按照该单位时长对每个展示信息的播放数、评论数、分享数、点赞数进行统计(可以统计这些数值中的一项或多项数值)，统计每个单位时长中的播放数、评论数、分享数、点赞数、送礼数。对于任一展示信息(以第一展示信息为例)，服务器每统计完一个单位时长，可以将该单位时长内统计的数据与上一个单位时长内统计的数据进行比较，如果某一项数据(如播放数、评论数、分享数或点赞数等)的增长值(即当前单位时长内的数值与上一个单位时长内的数值的差值)超过预设阈值，则可以判定该项数据出现了突增，有可能是某人通过非法程序(如机器人程序)在刷该项数据(如播放数)。此时，服务器可以触发对第一展示信息进行本实施例流程的处理。

步骤102，在第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息。

其中，差评相关词是用于判定评论信息为差评信息的词语，如垃圾、差劲、难看等。评论信息中如果包含差评相关词，则可以被认为是差评信息。

在实施中，技术人员可以预先在服务器中建立差评相关词库，其中存储有大量技术人员预先设置的差评相关词。服务器在获取第一展示信息的所有评论信息后，对于每个评论信息，可以将其内容与差评相关词库中的各差评相关词进行匹配判断，确定出包含一个或多个差评相关词的评论信息，这样的评论信息可称为差评信息。如果某评论信息不包含任何一个差评相关词，则不认为该评论信息为差评信息。

可选的，进行匹配查询的方式可以多种多样，相应的上述处理可以为：基于模糊匹配和/或分词匹配，在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息。

在实施中，模糊匹配的方式可以是，对于差评相关词A，如果A中的每个文字都包含于某评论信息中，则判定该评论信息与差评相关词A匹配，即该评论信息包含差评相关词A。分词匹配的方式可以是，对评论信息进行分词，确定其中包含的所有词语，然后将所有词语分别与差评相关词库中的所有差评相关词进行匹配判定，如果差评相关词B与评论信息中的某个词语相匹配，则确定评论信息与该差评相关词B相匹配，即该评论信息包含差评相关词B。

步骤103，确定包含至少一个预设的差评相关词的评论信息的数目在第一展示信息的各评论信息的总数目中所占的比例。

在实施中，对于第一展示信息的所有评论信息，服务器可以确定其中包含至少一个预设的差评相关词的评论信息的数目(可称作第一数目)。同时，服务器还可以确定第一展示信息的所有评论信息的总数目(可称作第二数目)。进而，服务器可以计算第一数目与第二数目的比值，即得到包含至少一个预设的差评相关词的评论信息的数目在第一展示信息的各评论信息的总数目中所占的比例。

步骤104，根据该比例，识别第一展示信息是否为排行榜作弊的展示信息。

在实施中，服务器可以基于上述步骤确定的比例，来识别第一展示信息是否为排行榜作弊的展示信息。服务器可以先根据该比例，确定第一展示信息是否为疑似的排行榜作弊的展示信息，如果是，则对第一展示信息进行标记，技术人员看到第一展示信息的标记后，可以通过控制终端对第一展示信息进行播放，观看第一展示信息后，如果技术人员判定第一展示信息为排行榜作弊的展示信息，可以点击确认作弊的按键，服务器则可以确定并记录第一展示信息为排行榜作弊的展示信息。如果技术人员判定第一展示信息不是排行榜作弊的展示信息，可以点击取消作弊的按键，服务器则可以确定并记录第一展示信息不是排行榜作弊的展示信息。

可选的，还可以基于第一展示信息所属的账户的历史作弊情况，来识别第一展示信息是否为排行榜作弊的展示信息，相应的处理可以如图2所示，可以包括如下步骤：

步骤1041，确定发布第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目。

在实施中，服务器可以确定发布第一展示信息的账户，进而确定该账户之前发布的其它展示信息中，有没有排行榜作弊的展示信息，以及排行榜作弊的展示信息的数目。

步骤1042，根据上述比例，以及被判定为排行榜作弊的展示信息的数目，识别第一展示信息是否为排行榜作弊的展示信息。

可选的，可以采用加权分值的方法来识别作弊，相应的，如图3所示，步骤1042的处理可以包括如下步骤：

步骤1042a，根据上述比例，比例对应的第一预设加权系数，被判定为排行榜作弊的展示信息的数目，以及被判定为排行榜作弊的展示信息的数目对应的第二预设加权系数，确定第一展示信息的作弊加权值。

其中，作弊加权值是用于反映展示信息存在排行榜作弊的可能性的参数，作弊加权值越大，则可能性越大，作弊加权值越小，则可能性越小。

在实施中，技术人员可以在服务器预先设置比例对应的加权系数(即第一预设加权系数，可记做a)，以及被判定为排行榜作弊的展示信息的数目对应的加权系数(即第二预设加权系数，可记做b)。当服务器确定比例的数值(可记做M)，以及被判定为排行榜作弊的展示信息的数目的数值(可记做N)后，可以基于公式P＝M*a+N*b，计算作弊加权值P。

步骤1042b，根据第一展示信息的作弊加权值，识别第一展示信息是否为排行榜作弊的展示信息。

在实施例中，该步骤的处理方式可以多种多样，以下给出了几种可行的方式：

方式一，如果作弊加权值小于预设阈值，则判定第一展示信息不是排行榜作弊的展示信息；如果作弊加权值大于或等于预设阈值，则标记所述第一展示信息为疑似的排行榜作弊的展示信息，当接收到第一展示信息的确认作弊指令时，确定并记录第一展示信息是排行榜作弊的展示信息，当接收到第一展示信息的取消作弊指令时，确定第一展示信息不是排行榜作弊的展示信息。

在实施中，技术人员如果发现第一展示信息被标记为疑似的排行榜作弊的展示信息，则可以播放第一展示信息，经过观看，技术人员如果确定第一展示信息是比较优质的展示信息，即不存在排行榜作弊，则可以点击取消作弊的按键，触发取消作弊指令，如果确定第一展示信息是比较劣质的展示信息，即存在排行榜作弊，则可以点击确认作弊的按键，触发确认作弊指令。

方式二，如果作弊加权值小于预设阈值，则判定第一展示信息不是排行榜作弊的展示信息；如果作弊加权值大于或等于预设阈值，则判定第一展示信息是排行榜作弊的展示信息。

这种方式可以由服务器自动判断作弊，不需要人工参与。

可选的，在步骤104之后，还可以进行如下处理：

如果第一展示信息为排行榜作弊的展示信息，则将第一展示信息，从展示信息排行榜中删除。

在实施中，如果服务器根据上述比例，判定第一展示信息为排行榜作弊的展示信息，则可以将第一展示信息，从展示信息排行榜中删除。用户在应用程序中的展示信息排行榜中，则不会在看到第一展示信息。

基于相同的技术构思，本发明实施例还提供了一种识别排行榜作弊的装置，该装置可以是上述实施例中的服务器，如图4所示，该装置可以包括：

获取模块410，用于获取展示信息排行榜中的第一展示信息的各评论信息；

差评确定模块420，用于在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息；

比例确定模块430，用于所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例；

识别模块440，用于根据所述比例，识别所述第一展示信息是否为排行榜作弊的展示信息。

可选的，所述获取模块410，用于：

当达到预设的作弊检测周期时，获取展示信息排行榜中的第一展示信息的各评论信息；或者，

当接收到作弊检测指令时，获取展示信息排行榜中的第一展示信息的各评论信息；

可选的，所述差评确定模块420，用于：

基于模糊匹配和/或分词匹配，在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息。

可选的，所述识别模块440，用于：

确定发布所述第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目；

根据所述比例，以及所述被判定为排行榜作弊的展示信息的数目，识别所述第一展示信息是否为排行榜作弊的展示信息。

可选的，所述识别模块440，用于：

根据所述第一展示信息的作弊加权值，识别所述第一展示信息是否为排行榜作弊的展示信息。

可选的，所述识别模块440，用于：

如果所述作弊加权值小于预设阈值，则判定所述第一展示信息不是排行榜作弊的展示信息；

如果所述作弊加权值大于或等于预设阈值，则判定所述第一展示信息是排行榜作弊的展示信息。

可选的，所述装置还包括：

删除模块450，用于如果所述第一展示信息为排行榜作弊的展示信息，则将所述第一展示信息，从所述展示信息排行榜中删除。

需要说明的是：上述实施例提供的获取歌曲信息的装置在获取歌曲信息时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的获取歌曲信息的装置与获取歌曲信息的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。

图5是本发明实施例提供的服务器的结构示意图。该服务器1900可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上中央处理器(central processing units，CPU)1922(例如，一个或一个以上处理器)和存储器1932，一个或一个以上存储应用程序1942或数据1944的存储介质1930(例如一个或一个以上海量存储设备)。其中，存储器1932和存储介质1930可以是短暂存储或持久存储。存储在存储介质1930的程序可以包括一个或一个以上模块(图示没标出)，每个模块可以包括对服务器中的一系列指令操作。更进一步地，中央处理器1922可以设置为与存储介质1930通信，在服务器1900上执行存储介质1930中的一系列指令操作。

服务器1900还可以包括一个或一个以上电源1926，一个或一个以上有线或无线网络接口1950，一个或一个以上输入输出接口1958，一个或一个以上键盘1956，和/或，一个或一个以上操作系统1941，例如Windows ServerTM，Mac OS XTM，UnixTM，LinuxTM，FreeBSDTM等等。

服务器1900可以包括有存储器，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器中，且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令：

获取展示信息排行榜中的第一展示信息的各评论信息；

在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息；

确定所述包含至少一个预设的差评相关词的评论信息的数目在所述第一展示信息的各评论信息的总数目中所占的比例；

根据所述比例，识别所述第一展示信息是否为排行榜作弊的展示信息。

可选的，所述获取展示信息排行榜中的第一展示信息的各评论信息，包括：

当达到预设的作弊检测周期时，获取展示信息排行榜中的第一展示信息的各评论信息；或者，

当接收到作弊检测指令时，获取展示信息排行榜中的第一展示信息的各评论信息；

可选的，所述在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息，包括：

基于模糊匹配和/或分词匹配，在所述第一展示信息的各评论信息中，确定包含至少一个预设的差评相关词的评论信息。

可选的，所述根据所述比例，识别所述第一展示信息是否为排行榜作弊的展示信息，包括：

确定发布所述第一展示信息的账户的其它展示信息中被判定为排行榜作弊的展示信息的数目；

根据所述比例，以及所述被判定为排行榜作弊的展示信息的数目，识别所述第一展示信息是否为排行榜作弊的展示信息。

可选的，所述根据所述比例，以及所述被判定为排行榜作弊的展示信息的数目，识别所述第一展示信息是否为排行榜作弊的展示信息，包括：

根据所述第一展示信息的作弊加权值，识别所述第一展示信息是否为排行榜作弊的展示信息。

可选的，所述根据所述第一展示信息的作弊加权值，识别所述第一展示信息是否为排行榜作弊的展示信息，包括：

如果所述作弊加权值小于预设阈值，则判定所述第一展示信息不是排行榜作弊的展示信息；

如果所述作弊加权值大于或等于预设阈值，则判定所述第一展示信息是排行榜作弊的展示信息。

可选的，所述方法还包括：

如果所述第一展示信息为排行榜作弊的展示信息，则将所述第一展示信息，从所述展示信息排行榜中删除。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。

以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周林军;
技术所有人：广州酷狗计算机科技有限公司;
我是此专利的发明人

上一篇：电容导针铆接装置的制作方法
上一篇：光掩模坯的缺陷检查方法、分选方法和制备方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。