一种视频搜索作弊处理方法及装置与流程

文档序号:15558079发布日期:2018-09-29 01:35阅读:159来源:国知局

本发明涉及网络作弊处理技术领域,特别是涉及一种视频搜索作弊处理方法及装置。



背景技术:

在使用搜索引擎进行视频搜索时,用户通常倾向于点击搜索结果页面中排序靠前的视频,而某些用户为了使自己发布的视频在搜索结果页面中的排序靠前,会采用作弊的方式欺骗搜索引擎和服务器,以达到自己的不良目的。这其中,利用自动引用通知(pingback)进行作弊不仅非常普遍而且难以防范。

pingback是用来自动通知内容被引用情况的一种手段。具体来说,对于用户每次通过搜索引擎进行的视频搜索操作,搜索引擎都会返回与搜索相关的视频,用户可以点击感兴趣的视频观看,在用户点击视频的过程中,服务器会自动得到包含视频标识的pingback,根据对pingback中视频标识的分析,可以得到用户点击权重较高的视频,进而将该点击权重较高的视频在页面中调整到排序靠前的位置;基于pingback的作弊用户,通过频繁搜索、点击某些视频,使得服务器得到的针对该视频的pingback数量较大,达到提升该视频的点击权重,恶意迷惑服务器对搜索引擎中视频搜索结果排序调整的不良目的。

然而,本领域技术人员在研究上述技术方案的过程中发现,对于作弊用户通过pingback进行作弊的方式,现有技术中没有相应的方法来处理,使得搜索引擎处理作弊的准确率无法保证。



技术实现要素:

鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种视频搜索作弊处理方法及装置。

根据本发明的第一方面,提供了一种视频搜索作弊处理方法,所述方法包括:

在数据库中获取预设时间内的多个自动引用通知,其中,每个所述自动引用通知对应有用户标识;

分别确定每个所述用户标识对应的自动引用通知的数量;

将所述数量满足预设作弊条件的用户标识所对应的自动引用通知,确定为作弊自动引用通知;其中,所述预设作弊条件包括:大于预设阈值;

对所述作弊自动引用通知进行无效处理。

根据本发明的第二方面,提供了一种视频搜索作弊处理装置,所述装置包括:

自动引用通知获取模块,用于在数据库中获取预设时间内的多个自动引用通知,其中,每个所述自动引用通知对应有用户标识;

数量确定模块,用于分别确定每个所述用户标识对应的自动引用通知的数量;

作弊自动引用通知确定模块,用于将所述数量满足预设作弊条件的用户标识所对应的自动引用通知,确定为作弊自动引用通知;其中,所述预设作弊条件包括:大于预设阈值;

无效处理模块,用于对所述作弊自动引用通知进行无效处理。

本发明实施例包括以下优点:本发明实施例首先在数据库中获取预设时间内的多个自动引用通知,由于该自动引用通知中包含用户标识,因此,可以根据每个用户标识对应的自动引用通知的数量,分析出每个用户在预设时间进行的点击视频搜索结果次数,将该数量满足预设作弊条件的用户标识所对应的自动引用通知确定为作弊引用通知,其中,预设作弊条件可以包括大于预设阈值,并对作弊自动引用通知进行无效处理,则该作弊自动引用通知在后续的视频搜索结果排序中无效,从而消除作弊自动引用通知对视频搜索结果排序的干扰,提高处理作弊用户的准确率。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述技术方案和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1是本发明实施例提供的一种视频搜索作弊处理方法的流程图;

图2是本发明实施例提供的一种视频搜索作弊处理方法的具体流程图;

图3是本发明实施例提供的一种视频搜索作弊处理装置的框图;

图4是本发明实施例提供的一种视频搜索作弊处理装置的具体框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

应当理解,此处所描述的具体实施例仅用以解释本发明,仅仅是本发明一部分实施例,而不是全部的实施例,并不用于限定本发明。

实施例一

参照图1,示出了一种视频搜索作弊处理方法的流程图,具体可以包括如下步骤:

步骤101:在数据库中获取预设时间内的多个自动引用通知,其中,每个所述自动引用通知对应有用户标识。

本发明实施例可以应用于服务器端,该服务器端可以是web(worldwideweb,万维网)服务器,也可以是其他形式的服务器,本发明实施例对此不做具体限制。

具体应用中,服务器可以在夜间用户访问量较少的情况下,对数据库中的自动引用通知进行视频搜索作弊处理的操作,以提升处理效率并降低服务器白天运行时的负载;服务器也可以在接收到用户的视频搜索请求后,依据用户的视频搜索请求,对数据库中的自动引用通知进行视频搜索作弊处理的操作,本发明实施例对进行本发明的具体时机不作限制。

本发明实施例的自动引用通知,是根据用户对搜索引擎、网站、应用等的视频或视频链接的点击产生,因此每个自动引用通知会对应有操作用户的用户标识、用户所点击视频的视频标识、以及产生该自动引用通知时的时间标识等;其中,用户标识可以是用户注册的账号、手机号、用户设备识别号等,本发明实施例对此不作限制。

具体应用中,可以在数据库中、磁盘、内存或其他存储自动引用通知的地方获取预设时间内的多个自动引用通知,本发明实施例对此不作具体限定。

获取预设时间内的多个自动引用通知的方法具体可以是:在存储有与视频搜索相关的自动引用通知的数据库中,依据自动引用通知的时间标识,将时间标识落入到预设时间内的自动引用通知进行筛选,得到预设时间内的多个自动引用通知。

可以理解,用户对视频的兴趣会随着时间的不同而发生变化,对于较接近当前时间的用户行为,能比较准确的反馈用户的实际兴趣,并且作弊用户的作弊行为往往是在较短时间内提升某些视频的点击量,因此,在数据库中获取预设时间内的多个自动引用通知时,该预设时间可以是距离当前时间较接近的一段时间,例如一天、一周、一月等等,从而达到通过处理较少量用户自动通知,为用户提供较准确视频推荐的效果;当然,也可以根据实际情况设定预设时间,本发明实施例对预设时间的具体时长不作限制。

步骤102:分别确定每个所述用户标识对应的自动引用通知的数量。

具体应用中,分别确定每个用户标识对应的自动引用通知的数量的方法可以是:分别筛选出具有相同用户标识的自动引用通知,将具有相同用户标识的自动引用通知作为一个集合,分别统计每个集合中自动引用通知的数量,进而得到每个用户标识对应的自动引用通知的数量。

优选地,分别确定每个用户标识对应的自动引用通知的数量的方法还可以是:将预设时间划分成时间片,例如该预设时间是一小时,则可以该预设时间划分成60个一分钟的时间片,然后分别统计每个用户标识在各个时间片中存在的个数,具体统计方法见如下公式:

公式(1)中,num表示某个用户标识在该一小时内对应的自动引用通知的数量,z表示时间片的区间,actioni如果在第i个时间片中有操作则取值为1,否则取值为0。

步骤103:将所述数量满足预设作弊条件的用户标识所对应的自动引用通知,确定为作弊自动引用通知;其中,所述预设作弊条件包括:大于预设阈值。

实际应用中,视频往往具有一定的时长,正常用户在搜索视频后,打开相关的视频至少需要观看一段时间才会进行下一次的视频搜索或点击,而作弊用户为了增加某一个或多个视频的点击率,会频繁对某一个或多个视频进行搜索、点击操作,通过上述正常用户与作弊用户观看视频的特征,可以确定出预设作弊条件。

例如,将预设作弊条件确定为:大于预设阈值,则数量大于预设阈值的用户标识可以认为是作弊用户标识。优选的,该预设阈值可以根据正常用户观看视频时的平均切换次数确定,比如,正常用户在观看视频时,在一小时内的点击切换视频的平均次数是50次,则可以将预设阈值设置为50以上的任意值,此时,在预设时间内对应自动引用通知数量大于50的用户标识,可以认为是作弊用户标识。

具体应用中,可以对作弊用户标识和正常用户标识进行标记,例如将作弊用户标识标记为1,正常用户标识标记为0,如下公式:

公式(2)中,cheat表示用户标识的标记,α标识预设阈值。

根据确定出的作弊用户标识,服务器可以将作弊用户标识对应的自动引用通知确定为作弊自动引用通知。

步骤104:对所述作弊自动引用通知进行无效处理。

实际应用中,自动引用通知通常具有状态标识,例如“有效”、“无效”等,在对作弊自动引用通知进行无效处理时,可以是将作弊自动引用通知的状态标识设置为“无效”,使得服务器根据自动引用通知重新对视频搜索结果排序时,无效的自动引用通知不具有参考价值。

优选地,本发明实施例中,对作弊自动引用通知进行无效处理还可以是:在数据库中将作弊自动引用通知删除,则服务器根据自动引用通知重新对视频搜索结果排序时,没有作弊自动引用通知的参与。

综上所述,本发明实施例首先在数据库中获取预设时间内的多个自动引用通知,由于该自动引用通知中包含用户标识,因此,可以根据每个用户标识对应的自动引用通知的数量,分析出每个用户在预设时间进行的点击视频搜索结果次数,将该数量满足预设作弊条件的用户标识所对应的自动引用通知确定为作弊引用通知,其中,预设作弊条件可以包括:大于预设阈值,并对作弊自动引用通知进行无效处理,则该作弊自动引用通知在后续的视频搜索结果排序中无效,从而消除作弊自动引用通知对视频搜索结果排序的干扰,提高处理作弊用户的准确率。

实施例二

参照图2,示出了一种视频搜索作弊处理方法的具体流程图,具体可以包括如下步骤:

步骤201:分别获取预设时间内各视频标识对应的多个自动引用通知;其中,每个所述自动引用通知对应有用户标识、视频标识。

本发明实施例中,服务器对数据库中预设时间内的多个自动引用通知,采用依次对各视频标识对应的自动引用通知进行视频搜索处理的方式。

具体来说,对于具体的某一个视频,正常用户往往是搜索观看后就关闭,即使重复观看,点击该视频的次数也较为有限;而作弊用户为了增加该视频的点击率,则通常会频繁对该视频进行搜索点击操作。因此,服务器在进行视频搜索作弊处理时,可以对数据库中预设时间内的多个自动引用通知,按照视频标识的不同,依次进行视频搜索作弊处理。

具体应用中,在数据库中分别获取预设时间内各个视频标识对应的多个自动引用通知方法可以是,先在数据库中获取预设时间内的多个自动引用通知,再从该预设时间内的多个自动引用通知中,分别获取各个视频标识对应的多个自动引用通知。

优选地,在数据库中分别获取预设时间内各个视频标识对应的多个自动引用通知方法还可以是,先分别获取各个视频标识对应的多个自动引用通知,再分别在各视频标识对应的多个自动引用通知中获取预设时间内的多个自动引用通知。本发明实施例对在数据库中分别获取预设时间内各个视频标识对应的多个自动引用通知的具体方法不做限制。

步骤202:将具有相同视频标识的多个自动引用通知确定为一个自动引用通知集。

步骤203:分别确定各所述自动引用通知集中,每个所述用户标识对应的自动引用通知的数量。

具体应用中,在分别获取到预设时间内各个视频标识对应的多个自动引用通知后,将具有相同视频标识的多个自动引用通知确定为一个自动引用通知集,则实现了将预设时间内的多个自动引用通知按照视频标识进行重新组合。

在确定至少一个自动引用通知集后,分别在各自动引用通知集中,确定每个用户标识对应的自动引用通知的数量,则可以依据后续步骤分别确定各自动引用通知集中的作弊自动引用通知及有效自动引用通知。

步骤204:将所述数量大于预设阈值的用户标识所对应的自动引用通知,确定为作弊自动引用通知;其中,所述预设作弊条件包括:大于预设阈值。

步骤205:对所述作弊自动引用通知进行无效处理。

优选地,对所述作弊自动引用通知进行无效处理的具体方法可以是:将所述作弊自动引用通知的状态标识设置为无效;也可以是:将所述作弊自动引用通知在所述数据库中删除。

步骤206:将所述数量满足预设作弊条件的用户标识确定为作弊用户标识。

步骤207:当获取到所述作弊用户标识的新增自动引用通知时,将所述新增自动引用通知确定为作弊自动引用通知。

本发明实施例中,在对数据库中原始存储的自动引用通知进行视频搜索作弊处理时,除了对作弊自动引用通知进行无效处理之外,还将作弊用户标识进行标志,则当该作弊用户标识对应的用户再次点击视频产生新增的自动引用通知时,可以自动将新增的自动引用通知确定为作弊自动引用通知,使得当确定某个或某些用户标识为作弊用户标识后,服务器后续不需要针对该用户标识再次进行视频搜索作弊处理,提高了服务器进行视频搜索作弊处理的效率,并且达到了自动对作弊用户进行屏蔽的效果。

步骤208:将所述数量不满足所述预设作弊条件的用户标识所对应的自动引用通知,确定为有效自动引用通知。

具体应用中,该确定自动引用通知为有效自动引用通知的方式,可以与对作弊自动引用通知进行无效处理的方法相适配。具体来说,以步骤205中将所述作弊自动引用通知的状态标识设置为无效的方式为例,则确定为有效自动引用通知的方式可以是,将有效自动引用通知的状态标识设置为有效;以步骤205中将所述作弊自动引用通知在所述数据库中删除的方式为例,则可以自动将未被删除的自动引用通知确定为有效自动引用通知。

本发明实施例中,确定出有效的自动引用通知后,则服务器根据自动引用通知重新对视频搜索结果排序时,可以只根据有效自动引用通知进行排序。

步骤209:当接收到用户的视频搜索请求时,依据所述有效自动引用通知对所述视频搜索请求对应的视频搜索结果进行排序。

具体应用中,用户进行视频搜索时,通常是在搜索引擎的输入框中输入搜索关键字,然后点击搜索按钮,发出视频搜索请求,该视频搜索请求中携带着上述搜索关键字信息。

本发明实施例中,当接收到用户的视频搜索请求时,服务器可以依据搜索关键字,在数据库中获取视频标识中对应有该搜索关键字的有效自动引用通知,然后依据各视频标识对应的有效的自动引用通知的数量,按照有效自动引用通知数量越多,该视频标识对应的视频在视频搜索结果排序越靠前的方式进行排序。

举例来说,例如,用户在搜索引擎的输入框中输入搜索关键字“美人鱼”后点击搜索按钮,该“美人鱼”可以对应着周星驰导演的《美人鱼》,也可以对应着欧美童话《美人鱼》,则服务器可以在数据库中获取周星驰导演的《美人鱼》所对应的有效自动引用通知,以及欧美童话《美人鱼》所对应的有效自动引用通知,进而将对应的有效自动引用通知数量大的《美人鱼》视频排序在靠前的位置。

步骤210:将排序后的视频搜索结果返回给用户。

具体应用中,排序后的视频搜索结果可以在搜索引擎的搜索结果页面中进行展示,用户可以在搜索结果页面中点击感兴趣的视频进行观看。

综上所述,本发明实施例首先在数据库中分别获取预设时间内具有相同视频标识的多个自动引用通知,由于该自动引用通知中包含用户标识,因此,可以根据每个用户标识对应的自动引用通知的数量,分析出每个用户在预设时间进行的点击视频搜索结果次数,将该数量满足预设作弊条件的用户标识所对应的自动引用通知确定为作弊引用通知,将该数量不满足预设作弊条件的用户标识所对应的自动引用通知确定为有效自动引用通知,其中,预设作弊条件可以包括:大于预设阈值,对作弊自动引用通知进行无效处理,则该作弊自动引用通知在后续的视频搜索结果排序中无效,从而消除作弊自动引用通知对视频搜索结果排序的干扰,提高处理作弊用户的准确率。当接收到用户的视频搜索请求后,可以根据有效自动引用通知对视频搜索结果进行排序,从而返回给用户真正想要的内容,提升用户体验,增加用户黏度。

需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

实施例三

参照图3,示出了一种视频搜索作弊处理装置的框图,该装置具体可以包括:

自动引用通知获取模块310,用于获取预设时间内的多个自动引用通知,其中,每个所述自动引用通知对应有用户标识。

数量确定模块320,用于分别确定每个所述用户标识对应的自动引用通知的数量。

作弊自动引用通知确定模块330,用于将所述数量满足预设作弊条件的用户标识所对应的自动引用通知,确定为作弊自动引用通知;其中,所述预设作弊条件包括:大于预设阈值。

无效处理模块340,用于对所述作弊自动引用通知进行无效处理。

优选的,参照图4,在图3的基础上示出了一种视频搜索作弊处理装置的具体框图。

所述装置的自动引用通知获取模块310包括:

自动引用通知获取子模块3101,用于分别获取预设时间内各视频标识对应的多个自动引用通知。

优选的,所述装置的数量确定模块320包括:

自动引用通知集确定子模块3201,用于将具有相同视频标识的多个自动引用通知确定为一个自动引用通知集。

数量确定子模块3202,用于分别确定各所述自动引用通知集中,每个所述用户标识对应的自动引用通知的数量。

优选的,所述无效处理模块340包括:

第一无效处理子模块,用于将所述作弊自动引用通知的状态标识设置为无效。

第二无效处理子模块,用于将所述作弊自动引用通知在所述数据库中删除。

优选的,所述装置还包括:

有效自动引用通知确定模块350,用于将所述数量不满足所述预设作弊条件的用户标识所对应的自动引用通知,确定为有效自动引用通知。

作弊用户标识确定模块360,用于将所述数量满足预设作弊条件的用户标识确定为作弊用户标识。

新增自动引用通知处理模块370,用于当获取到所述作弊用户标识的新增自动引用通知时,将所述新增自动引用通知确定为作弊自动引用通知。

排序模块380,用于当接收到用户的视频搜索请求时,依据所述有效自动引用通知对所述视频搜索请求对应的视频搜索结果进行排序。

结果返回模块390,用于将排序后的视频搜索结果返回给用户。

本发明实施例包括以下优点:本发明实施例首先通过自动引用通知获取模块310在数据库中获取预设时间内的多个自动引用通知,由于该自动引用通知中包含用户标识,因此,数量确定模块320可以根据每个用户标识对应的自动引用通知的数量,分析出每个用户在预设时间进行的点击视频搜索结果次数,由作弊自动引用通知确定模块330将该数量满足预设作弊条件的用户标识所对应的自动引用通知确定为作弊引用通知,无效处理模块340对作弊自动引用通知进行无效处理,则该作弊自动引用通知在后续的视频搜索结果排序中无效,从而消除作弊自动引用通知对视频搜索结果排序的干扰,提高处理作弊用户的准确率。

对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

在一个典型的配置中,所述计算机设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非持续性的电脑可读媒体(transitorymedia),如调制的数据信号和载波。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程视频搜索作弊处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程视频搜索作弊处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程视频搜索作弊处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程视频搜索作弊处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种视频搜索作弊处理方法和一种视频搜索作弊处理装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1