一种刷量工具检测方法和装置与流程

文档序号:12375940阅读:208来源:国知局
一种刷量工具检测方法和装置与流程
本发明涉及通信领域,尤其涉及一种刷量工具检测方法和装置。
背景技术
:渠道可以通过为内容提供商(ContentProvider,CP)引入用户,而向CP收取一定的费用,收取费用的多少与该渠道引入的用户数量相关,一般有两种方式:一种是每有一个用户注册了游戏账号或应用账号后,CP付给渠道一个费用;另一种是每有一个用户联网登录了游戏或应用,CP付给渠道一个费用。可以称通过某个渠道引入的用户为这个渠道的渠道用户。所有可以为应用(Application,APP)获取用户的平台都可以称为渠道,该应用可以为PC端应用,也可以为手机应用,例如一个拥有手机应用的用户,能够进行手游或其他应用流量分发的公司就是一个渠道。然而其中存在一些刷量和制造假用户行为的作弊渠道,通过使用刷量工具生成虚假新用户来骗取CP的推广费用。这类刷量工具可以随机或基于已有用户数据文件,生成移动设备国际识别码(InternationalMobileEquipmentIdentity,IMEI)、国际移动用户识别码((InternationalMobileSubscriberIdentificationNumber,IMSI)、MAC地址、屏幕分辨率、机型、SIM卡号、手机号、运营商编号或名称、手机操作系统(OS)版本等各种参数,每个不同的IMEI代表一个新的用户。鉴于当前的刷量工具可以自动生成各种硬件接入环境参数,CP为了检测出这些渠道中使用了刷量工具的作弊渠道,主要通过检测当前渠道下的这些硬件属性的分布是否正常,来判别当前渠道下是否使用了刷量工具。同时还可以检测IMSI、MAC地址的聚集情况,如果当前渠道下有很多用户的MAC地址或IMSI都一样,则当前渠道可能使用了自动刷量工具。然而,基于硬件接入环境属性的分布是否正常来检测刷量工具,有一定的局限性:好的刷量工具在生成硬件接入环境属性时,会基于各个属性真实情况下的分布来生成,即所生成的渠道用户集合在手机OS版本、机型等属性分布上,与正常渠道的属性分布一致。同样,刷量工具可以生成随机的MAC 地址、IMSI等属性,即保持这些属性的变化。因此,导致CP难以准确的检测出渠道中的作弊渠道。技术实现要素:本发明实施例提供了一种刷量工具检测方法和装置,用于根据用户IP检测出渠道中的作弊渠道。一种刷量工具检测方法,包括:记录预置时长内的第一对应关系,所述第一对应关系表示通过渠道访问的用户与所述用户接入的IP地址的对应关系;根据记录的所述第一对应关系,确定特定渠道下的第二对应关系,所述第二对应关系表示用户与省份信息的对应关系,所述省份信息基于所述IP地址获取;根据所述第二对应关系,统计所述特定渠道下的跨省用户数量,其中,若一个用户对应至少2个不同的省份信息,则该用户为跨省用户;确定跨省相关比值,所述跨省相关比值表示所述跨省用户数量与其他类型用户数量的比值;根据所述跨省相关比值,确定所述特定渠道是否使用了刷量工具。一种刷量工具检测装置,包括:记录模块,用于记录预置时长内的第一对应关系,所述第一对应关系表示通过渠道访问的用户与所述用户接入的IP地址的对应关系;第一确定模块,用于根据所述记录模块记录的所述第一对应关系,确定特定渠道下的第二对应关系,所述第二对应关系表示用户与省份信息的对应关系,所述省份信息基于所述IP地址获取;第一统计模块,用于根据所述第一确定模块确定的第二对应关系,统计所述特定渠道下的跨省用户数量,其中,若一个用户对应至少2个不同的省份信息,则该用户为跨省用户;第二确定模块,用于确定跨省相关比值,所述跨省相关比值表示所述第一统计模块统计的跨省用户数量与其他类型用户数量的比值;第三确定模块,用于根据所述第二确定模块确定的跨省相关比值,确定 所述特定渠道是否使用了刷量工具。从以上技术方案可以看出,本发明实施例具有以下优点:本发明实施例中,先根据预置时长内记录的表示通过渠道访问的用户与该用户接入的IP地址的第一对应关系,确定表示特定渠道下用户与省份信息的第二对应关系,再根据该第二对应关系,统计该特定渠道下的跨省用户数量。由于专业的刷量公司会使用代理IP或者VPN等动态IP技术,获得跨省IP地址资源库,从而使得虚假新用户的接入IP地址来自全国多个省,如果一个渠道下对应至少两个省份信息的跨省用户在各种类型的用户数量中占比较多,则当前渠道可能使用了IP动态处理,即可以认为当前渠道可能使用了刷量工具,因此,本发明实施例中根据跨省用户数量确定跨省相关比值,再根据跨省相关比值来确定该特定渠道是否使用了刷量工具,实现了根据用户IP对渠道中的作弊渠道的检测,不再受到刷量工具生成的各种硬件接入环境参数的局限,提高了检测出使用刷量工具的作弊渠道的概率。附图说明图1为本发明实施例中刷量工具检测方法一个流程示意图;图2为本发明实施例中刷量工具检测方法另一个流程示意图;图3为本发明实施例中刷量工具检测装置一个结构示意图;图4为本发明实施例中刷量工具检测装置另一个结构示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。此处在本发明的描述中使用的术语是用于描述特定实施例的目的并且不旨在作为对本发明的限制。术语“IP”为InternetProtocol的缩写,是为计算机网络相互连接进行通信而设计的协议。任何厂家生产的计算机系统,只要遵守IP协议就可以与因 特网互连互通。IP地址实际上是32位二进制数,为了便于记忆就分为四段,每段八位,中间用小数点隔开。每段八位的二进制数转成十进制,大小为0至255。术语“IP2数据”指IP地址的前2段,前2端相同的IP地址一般属于同一个地域,比如省或地级市。本发明实施例中,一个IP2数据唯一对应一个省份信息,而一个省份信息可以对应至少一个IP2数据。请参阅图1,本发明实施例中刷量工具检测方法一个实施例包括:101、记录预置时长内的第一对应关系,所述第一对应关系表示通过渠道访问的用户与所述用户接入的IP地址的对应关系;本步骤中,预置时长内,有用户通过渠道访问CP提供的应用时,刷量工具检测装置记录访问的该用户与该用户接入的IP地址的对应关系,作为第一对应关系。可以理解的是,在该预置时长内的每个用户的每次访问,都可以记录有一条相应的第一对应关系。例如,一条记录为(用户A,a1.b1.c1.d1)。102、根据记录的所述第一对应关系,确定特定渠道下的第二对应关系,所述第二对应关系表示用户与省份信息的对应关系;其中,省份信息可以基于IP地址获取。本步骤中,该刷量工具检测装置根据记录的第一对应关系,可以基于其中用户接入的IP地址,获取该IP地址对应的省份信息,将其中特定渠道下的第一对应关系转换为用户与省份信息的对应关系,作为该特定渠道下的第二对应关系:例如将(用户A,a1.b1.c1.d1)转换为(用户A,省份1)。可以理解的是,由于多个IP地址可能对应一个省份信息,因此,多条第一对应关系转换成的第二对应关系可能相同,将相同的第二对应关系算作同一条记录。可以理解的是,该特定渠道可以为接入用户的所有渠道中的任一个渠道,可以同时在该第二对应关系中加入各渠道的标识;该特定渠道也可以为指定待检测的渠道,或者待查询渠道列表中当前检测渠道等,此处不作限定。103、根据所述第二对应关系,统计所述特定渠道下的跨省用户数量;其中,若一个用户对应至少2个不同的省份信息,则该用户为跨省用户;本步骤中,若确定的第二对应关系中同一个用户对应至少两个不同的省份信息的记录,则该用户为跨省用户,可以统计确定的第二对应关系中的这 样的跨省用户的数量作为该特定渠道下的跨省用户数量。例如若有(用户B,省份3)和(用户B,省份6)这样的记录,则确定该用户B为跨省用户。104、确定跨省相关比值,所述跨省相关比值表示所述跨省用户数量与其他类型用户数量的比值;本步骤中,刷量工具检测装置统计出该特定渠道下跨省用户数量时,还可以统计其他类型用户的数量,例如在该特定渠道下预置时长内新增用户的数量,或使用不同的IP2数据访问的用户的数量等,然后确定该跨省用户数量相对于其他类型用户数量的比值,作为跨省相关比值。由于专业的刷量公司会使用代理IP或者VPN等动态IP技术,获得跨省IP地址资源库,从而使得虚假新用户的接入IP地址来自全国多个省,因此表示跨省用户数量与其他类型用户数量比值的跨省相关比值的大小能反映出该特定渠道使用刷量工具的可能性。例如,若该特定渠道下跨省用户数量占该特定渠道引入的用户数量的比值过大,则该特定渠道有很大的可能使用了刷量工具。可以理解的是,由于其他类型用户的种类可以为多种,因此本步骤中也可以确定出多种跨省相关比值,此处不作限定。105、根据所述跨省相关比值,确定所述特定渠道是否使用了刷量工具。刷量工具检测装置确定跨省相关比例后,可以根据该跨省相关比例确定该特定渠道是否使用了刷量工具。例如,当该跨省相关比例大于一定阈值时,确定该特定渠道使用了刷量工具。若有多种跨省相关比值,还可以根据实际情况采用不同的判定阈值以及不同的判定顺序,此处不作限定。本发明实施例中,先根据预置时长内记录的表示通过渠道访问的用户与该用户接入的IP地址的第一对应关系,确定表示特定渠道下用户与省份信息的第二对应关系,再根据该第二对应关系,统计该特定渠道下的跨省用户数量。由于专业的刷量公司会使用代理IP或者VPN等动态IP技术,获得跨省IP地址资源库,从而使得虚假新用户的接入IP地址来自全国多个省,如果一个渠道下对应至少两个省份信息的跨省用户在各种类型的用户数量中占比较多,则当前渠道可能使用了IP动态处理,即可以认为当前渠道可能使用了刷量工具,因此,本发明实施例中根据跨省用户数量确定跨省相关比值,再根 据跨省相关比值来确定该特定渠道是否使用了刷量工具,实现了根据用户IP对渠道中的作弊渠道的检测,不再受到刷量工具生成的各种硬件接入环境参数的局限,提高了检测出使用刷量工具的作弊渠道的概率。上面实施例中,确定跨省相关比值,在实际应用中,其他类型用户的种类可以为多种,因此跨省相关比值也有很多种,下面对本发明实施例中刷量工具检测方法进行具体描述:请参阅图2,本发明实施例中刷量工具检测方法另一个实施例包括:201、记录预置时长内的第一对应关系,所述第一对应关系表示通过渠道访问的用户与所述用户接入的IP地址的对应关系;本步骤中,预置时长内,有用户通过渠道访问CP提供的应用时,刷量工具检测装置记录访问的该用户与该用户接入的IP地址的对应关系,作为第一对应关系。可以理解的是,在该预置时长内的每个用户的每次访问,都可以记录有一条相应的第一对应关系。例如,一条记录为(用户A,a1.b1.c1.d1)。202、根据记录的所述第一对应关系,确定特定渠道下的第二对应关系,所述第二对应关系表示用户与省份信息的对应关系;其中,省份信息可以基于IP地址获取。本步骤中,该刷量工具检测装置根据记录的第一对应关系,可以基于其中用户接入的IP地址,获取该IP地址对应的省份信息,将其中特定渠道下的第一对应关系转换为用户与省份信息的对应关系,作为该特定渠道下的第二对应关系:例如将(用户A,a1.b1.c1.d1)转换为(用户A,省份1)。可以理解的是,由于多个IP地址可能对应一个省份信息,因此,多条第一对应关系转换成的第二对应关系可能相同,将相同的第二对应关系算作同一条记录。可以理解的是,该特定渠道可以为接入用户的所有渠道中的任一个渠道,可以同时在该第二对应关系中加入各渠道的标识;该特定渠道也可以为指定待检测的渠道,或者待查询渠道列表中当前检测渠道等,此处不作限定。203、根据所述第二对应关系,统计所述特定渠道下的跨省用户数量;其中,若一个用户对应至少2个不同的省份信息,则该用户为跨省用户;本步骤中,若确定的第二对应关系中同一个用户对应至少两个不同的省份信息的记录,则该用户为跨省用户,可以统计确定的第二对应关系中的这 样的跨省用户的数量作为该特定渠道下的跨省用户数量。例如若有(用户B,省份3)和(用户B,省份6)这样的记录,则确定该用户B为跨省用户。204、确定所述预置时长内所述特定渠道下记录的用户中的新增用户总数量;本步骤中,根据预置时长内记录的第一对应关系,刷量工具检测装置能确定该特定渠道下记录的用户中的新增用户总数量,其中,新增用户总数量为上述其他类型用户数量中的一种。可选的,该刷量工具检测装置能将记录的第一对应关系中的用户与该预置时长前数据库中已注册的用户进行匹配,依次确定其中的新增用户,从而累计出该第一对应关系中记录的用户中的新增用户总数量。205、根据记录的所述第一对应关系,确定特定渠道下的第三对应关系,所述第三对应关系表示用户与IP2数据的对应关系;其中,所述IP2数据为所述IP地址的前两段,所述IP地址由四段组成;本步骤中,该刷量工具检测装置根据记录的第一对应关系,可以取记录的每个IP地址的前两段形成IP2数据,则可以将其中特定渠道下的第一对应关系转换为用户与IP2数据的对应关系,作为该特定渠道下的第三对应关系:例如将(用户A,a1.b1.c1.d1)转换为(用户A,IP2i)。可以理解的是,用户接入的多个IP地址可能具有同样的IP2数据,因此,多条第一对应关系转换成的第三对应关系可能相同,将相同的第三对应关系算作同一条记录。可以理解的是,由于第一对应关系和第三对应关系都与用户相关,因此,在实际应用中,对于第二对应关系中省份信息和第三对应关系中IP2数据相对应的,也可以采用同一条记录进行标识。例如对第二对应关系(用户A,省份1),和第三对应关系(用户A,IP2i),其中省份1和IP2i都是根据同一个IP地址得到,它们相互对应,可以将其采用(用户A,IP2i,省份1)的形式,以一条对应关系进行记录,在实际应用中,在该对应关系中,还可以加入渠道标识等,当然,也可以将各个对应关系分开记录,此处不作限定。206、所述装置根据所述第三对应关系统计多次访问的用户数量,其中, 多次访问的用户表示对应至少2个不同的IP2数据的用户;本步骤中,刷量工具检测装置将该第三对应关系中,对应至少两个不同的IP2数据的用户作为多次访问的用户,统计该多次访问的用户数量,其中,多次访问的用户数量为上述其他类型用户数量中的另一种。例如,若确定的第三对应关系中存在(用户C,IP2k),(用户C,IP2j)的记录,则表示该用户C对应至少两个IP2数据,则可以确定该用户C为多次访问的用户。207、所述装置确定在所述特定渠道下的可疑IP2数据,其中,若在确定的所述第三对应关系中,一个IP2数据对应的新增用户的数量大于预置用户阈值,则该IP2数据为可疑IP2数据;本步骤中,刷量工具检测装置确定第三对应关系中的可疑IP2数据,具体的,若一个IP2数据对应的用户中,新增用户的数量大于预置用户阈值,则该IP2数据为可疑IP2数据。例如,若一个IP2数据对应有500个用户,其中有400个是新增用户,预置用户阈值是300,则该新增用户数量400大于预置用户阈值300,刷量工具检测装置确定该IP2数据为可疑IP2数据。208、所述装置确定可疑跨省用户数量,其中,若一个跨省用户对应的全部IP2数据中,有超过预置百分比的可疑IP2数据,则该跨省用户为可疑跨省用户;本步骤中,刷量工具检测装置根据确定的可疑IP2数据和第三对应关系,确定可疑跨省用户数量,其中,可疑跨省用户数量为上述其他类型用户数量中的另一种。若一个跨省用户对应的全部IP2数据中,有超过预置百分比的可疑IP2数据,则该跨省用户为可疑跨省用户。例如根据第二对应关系确定的一个跨省用户,对应有10条IP2数据的记录,该10条记录的10个IP2数据中,有8个是确定的可疑IP2数据,则可疑IP2数据的占比是80%,超出预置百分比40%,则该刷量工具检测装置确定该跨省用户为可疑跨省用户。可以理解的是,步骤204至步骤208中确定了三种其他类型的用户数量,分别由步骤204确定了新增用户总数量,由步骤205和步骤206确定了多次 访问的用户数量,由步骤205、步骤207和步骤208确定了可疑跨省用户数量,在实际应用中,根据确定跨省相关比值的需求,上述确定各种类型的用户数量的步骤可以同时存在,也可以只存在确定其中某一种,或者某几种其他类型的用户数量的步骤,此处不作限定。例如,若确定跨省相关比值时,不需要确定新增用户总数量,则步骤204可以不存在,同理,若只需要确定可疑跨省用户数量,则步骤204至步骤208中可以只存在步骤205、207和208,此处不作限定。209、计算第一比值,所述第一比值为所述跨省用户数量与所述新增用户总数量的比值,该第一比值为一种跨省相关比值。本步骤中,该第一比值为一种跨省相关比值,具体为所述跨省用户数量与所述新增用户总数量的比值。若一个渠道下很高比例的新增用户都是跨省用户,则该渠道可能使用了多个省的IP地址作为出口,即该渠道可能使用了刷量工具。210、计算第二比值,所述第二比值为所述跨省用户数量与所述多次访问的用户数量的比值,该第二比值为另一种跨省相关比值。本步骤中,该第二比值为另一种跨省相关比值,具体为所述跨省用户数量与所述多次访问的用户数量的比值。若一个渠道下多次访问的用户中很高比例的都是跨省用户,则该渠道可能使用了多个省的IP地址作为出口,即该渠道可能使用了刷量工具。211、计算第三比值,所述第三比值为所述可疑跨省用户数量与所述跨省用户数量的比值,该第三比值为另一种跨省相关比值。本步骤中,该第三比值为另一种跨省相关比值,具体为所述可疑跨省用户数量与所述跨省用户数量的比值。若一个渠道下的跨省用户中,很多用户使用了可疑IP2数据,则该渠道可能使用了多个省的IP地址作为出口,即该渠道可能使用了刷量工具。可以理解的是,步骤209至步骤211分别确定了三种跨省相关比值,在实际应用中,根据判定渠道是否使用刷量工具的需求,可以使用上述全部的跨省相关比值,也可以只是用其中的几种或者一种,此处不作限定。若该跨省相关比值不使用,则相应的确定该跨省相关比值的步骤可以不存在,同时, 确定相应的其他类型的用户数量的步骤也可以不存在。例如,若在判定时不需要使用第一比值,则步骤209可以不存在,同时,为步骤209提供新增用户总数量的步骤204也可以不存在;同理,若判定时只需要使用第二比值,则步骤209至步骤211中可以只存在步骤210,同时,步骤204至步骤208中可以只存在为步骤210提供多次访问的用户数量的步骤205和步骤206,此处不作限定。需要说明的是,在实际应用中,除了使用上述三种跨省相关比值,还可以确定另外的有效的其他类型的用户数量,相应使用其他的跨省相关比值进行判定,此处不作限定。212、根据所述跨省相关比值,确定所述特定渠道是否使用了刷量工具本步骤中,根据实际需求,有多种不同的方式根据跨省相关比值来确定该特定渠道是否使用了刷量工具:可选的,作为本发明实施例中刷量工具检测方法另一个实施例,当确定所述第一比值大于预置第一阈值时,确定所述特定渠道使用了刷量工具;或,当确定所述第二比值大于预置第二阈值时,确定所述特定渠道使用了刷量工具;或,当确定所述第三比值大于预置第三阈值时,确定所述特定渠道使用了刷量工具。即只选取其中一种跨省相关比值来确定该特定渠道是否使用了刷量工具。可选的,作为本发明实施例中刷量工具检测方法另一个实施例,当确定所述第一比值大于预置第一阈值时,确定所述特定渠道使用了刷量工具;和,当确定所述第二比值大于预置第二阈值时,确定所述特定渠道使用了刷量工具;和,当确定所述第三比值大于预置第三阈值时,确定所述特定渠道使用了刷量工具。即选取三种跨省相关比值来确定该特定渠道是否使用了刷量工具,且只需要三种中任一种满足预置条件即确定该特定渠道使用了刷量工具。可选的,作为本发明实施例中刷量工具检测方法另一个实施例,当确定所述第一比值大于预置第一阈值时,且,当确定所述第二比值大于预置第二阈值时,且,当确定所述第三比值大于预置第三阈值时,确定所述特定渠道 使用了刷量工具。即选取三种跨省相关比值来确定该特定渠道是否使用了刷量工具,且只有三种全部满足预置条件时,才确定该特定渠道使用了刷量工具。可以理解的是,还可以有其他更多的组合确定方式,此处不作限定。根据步骤212使用的跨省相关比值的不同,上述步骤中有的相关步骤可以存在也可以不存在,此处不作限定。本发明实施例中,除了跨省用户数量外,可以确定多种不同的其他类型的用户数量,从而得到多种跨省相关比值,根据这多种跨省相关比值来确定该特定渠道是否使用了刷量工具,采用这种方式,能获得渠道作弊更加直接的证据,基于IP地址变化的分析,可以发现渠道使用跨省IP地址资源库提供网络出口的情况,能更好的识别出刷量工具的使用。可以理解的是,本发明刷量工具检测方法还可以结合现有的基于硬件属性分布的检测方法同时使用,此处不作限定。为便于理解,下面以一具体应用场景对本发明实施例中刷量工具检测方法进行具体描述:刷量工具检测装置记录一天内通过特定渠道A接入的用户以及用户接入的IP地址的对应关系,总共得到500条记录,例如,其中一条记录为(xiaoming,113.90.202.62);该刷量工具检测装置获取500条记录中,每个IP地址对应的省份信息,得到第二对应关系(用户与省份信息的对应关系),并取每个IP地址的前两段形成IP2数据,得到第三对应关系(用户与IP2数据的对应关系),例如将该记录转换为(xiaoming,113.90,广东省),由于同一个用户的多个IP地址可能对应同一个省份信息和同一个IP2数据,例如,另一条记录(xiaoming,113.90.203.112)也转换为(xiaoming,113.90,广东省),因此转换之后的记录数目会减少,假设转换后的记录条数变成了350条;该刷量工具检测装置根据该350条包含有第二对应关系和第三对应关系的记录,确定该预置时长内特定渠道A下如下类型的用户数量:1、新增用户总数量;2、多次访问的用户数量:如果同一个用户在该350条记录中对应有至少 两个不同的IP2数据,则该用户为多次访问的用户。例如若还存在一条记录(xiaoming,113.93,广东省),则该用户xiaoming为多次访问的用户;3、跨省用户的数量:如果一个用户对应至少两个省份信息,则该用户为跨省用户。例如若存在记录(xiaoqing,111.75,江西省),(xiaoqing,111.83,广东省),则该用户xiaoqing为跨省用户;4、可疑跨省用户数量:如果一个跨省用户使用的多个IP2数据中有超过预置百分比(例如60%)的IP2数据属于可疑IP2数据,则该跨省用户为可疑用户,其中,当前渠道下一个IP2数据下新增用户数量大于预置用户数目(例如50),则该IP2数据为可疑IP2数据。例如,若记录中IP2数据113.93下新增用户的数目超过预置用户数目50个,则确定该IP2数据113.93为可疑IP2数据,同时可以确定其他的可疑IP2数据。若一个跨省用户xiaohuang在该350条记录中对应10个IP2数据,其中有70%(即7个)IP2数据为可疑IP2数据,则该用户xiaohuang为可以跨省用户。该刷量工具检测装置确定记录的特定渠道A下的350条记录中,存在的上述各种类型的用户数量如下表1所示:表1用户类型数量新增用户总数量100多次访问的用户数量80跨省用户的数量70可疑跨省用户数量60该刷量工具检测装置基于上述各种类型的用户数量,确定跨省相关比例,设确定的各跨省相关比例如下表2所示:表2比值种类计算方式比值第一比值跨省用户的数量/新增用户总数量0.8第二比值跨省用户的数量/多次访问的用户数量0.7第三比值可疑跨省用户数量/跨省用户的数量0.6第一种情况:该刷量工具检测装置确定第一比值0.8大于预置第一阈值 0.6,且第二比值0.7大于预置第二阈值0.5,且第三比值0.6大于预置第三阈值0.4,该刷量检测装置确定该特定渠道A使用了刷量工具;第二种情况:该刷量工具检测装置确定第一比值0.8大于预置第一阈值0.6,确定该特定渠道A使用了刷量工具;或,该刷量工具检测装置确定第二比值0.7大于预置第二阈值0.5,确定该特定渠道A使用了刷量工具;或,该刷量工具检测装置确定第三比值0.6大于预置第三阈值0.4,确定该特定渠道A使用了刷量工具。可以理解的是,根据判定选择的跨省相关比例的不同,组合方式的不同,以及设定的预置第一阈值,预置第二阈值,预置第三阈值取值的分别不同,还可以有更多的情况,此处不作限定。下面对本发明实施例中刷量工具检测装置进行描述:请参阅图3,本发明实施例中刷量工具检测装置一个实施例包括:记录模块301,用于记录预置时长内的第一对应关系,所述第一对应关系表示通过渠道访问的用户与所述用户接入的IP地址的对应关系;第一确定模块302,用于根据所述记录模块301记录的所述第一对应关系,确定特定渠道下的第二对应关系,所述第二对应关系表示用户与省份信息的对应关系,所述省份信息基于所述IP地址获取;第一统计模块303,用于根据所述第一确定模块302确定的第二对应关系,统计所述特定渠道下的跨省用户数量,其中,若一个用户对应至少2个不同的省份信息,则该用户为跨省用户;第二确定模块304,用于确定跨省相关比值,所述跨省相关比值表示所述第一统计模块303统计的跨省用户数量与其他类型用户数量的比值;第三确定模块305,用于根据所述第二确定模块304确定的跨省相关比值,确定所述特定渠道是否使用了刷量工具。本发明实施例中,第一确定模块302,先根据预置时长内记录的表示通过渠道访问的用户与该用户接入的IP地址的第一对应关系,确定表示特定渠道下用户与省份信息的第二对应关系,第一统计模块303再根据该第二对应关系,统计该特定渠道下的跨省用户数量。由于专业的刷量公司会使用代理IP 或者VPN等动态IP技术,获得跨省IP地址资源库,从而使得虚假新用户的接入IP地址来自全国多个省,如果一个渠道下对应至少两个省份信息的跨省用户在各种类型的用户数量中占比较多,则当前渠道可能使用了IP动态处理,即可以认为当前渠道可能使用了刷量工具,因此,本发明实施例中第二确定模块304根据跨省用户数量确定跨省相关比值,第三确定模块305再根据跨省相关比值来确定该特定渠道是否使用了刷量工具,实现了根据用户IP对渠道中的作弊渠道的检测,不再受到刷量工具生成的各种硬件接入环境参数的局限,提高了检测出使用刷量工具的作弊渠道的概率。上面实施例中,第二确定模块304确定跨省相关比值,在实际应用中,其他类型用户的种类可以为多种,因此跨省相关比值也有很多种,下面对本发明实施例中刷量工具检测装置进行具体描述:请参阅图4,本发明实施例中刷量工具检测装置另一个实施例包括:记录模块401,用于记录预置时长内的第一对应关系,所述第一对应关系表示通过渠道访问的用户与所述用户接入的IP地址的对应关系;第一确定模块402,用于根据所述记录模块401记录的所述第一对应关系,确定特定渠道下的第二对应关系,所述第二对应关系表示用户与省份信息的对应关系,所述省份信息基于所述IP地址获取;第一统计模块403,用于根据所述第一确定模块402确定的第二对应关系,统计所述特定渠道下的跨省用户数量,其中,若一个用户对应至少2个不同的省份信息,则该用户为跨省用户;第二确定模块404,用于确定跨省相关比值,所述跨省相关比值表示所述第一统计模块403统计的跨省用户数量与其他类型用户数量的比值;第三确定模块405,用于根据所述第二确定模块404确定的跨省相关比值,确定所述特定渠道是否使用了刷量工具;可选的,本发明实施例中,该刷量工具检测装置还可以包括:第四确定模块406,用于确定所述预置时长内所述特定渠道下记录的用户中的新增用户总数量;所述第二确定模块404具体可以包括:第一计算单元4041,用于计算第一比值,所述第一比值为所述第一统计 模块403统计的跨省用户数量与所述第四确定模块406确定的新增用户总数量的比值;可选的,本发明实施例中,该刷量工具检测装置还可以包括:第五确定模块407,用于根据所述记录模块401记录的所述第一对应关系,确定特定渠道下的第三对应关系,所述第三对应关系表示用户与IP2数据的对应关系,所述IP2数据为所述IP地址的前两段,所述IP地址由四段组成;第二统计模块408,用于根据所述第五确定模块407确定的第三对应关系统计多次访问的用户数量,其中,多次访问的用户表示对应至少2个不同的IP2数据的用户;所述第二确定模块404还包括:第二计算单元4042,用于计算第二比值,所述第二比值为所述第一统计模块403统计的跨省用户数量与所述第二统计模块408统计的多次访问的用户数量的比值;可选的,本发明实施例中,该刷量工具检测装置还可以包括:第六确定模块409,用于确定在所述特定渠道下的可疑IP2数据,其中,若在确定的所述第三对应关系中,一个IP2数据对应的新增用户的数量大于预置用户阈值,则该IP2数据为可疑IP2数据;第七确定模块410,用于确定可疑跨省用户数量,其中,若一个跨省用户对应全部IP2数据中,有超过预置百分比的可疑IP2数据,则该跨省用户为可疑跨省用户;所述第二确定模块404还包括:第三计算单元4043,用于计算第三比值,所述第三比值为所述第七确定模块410确定的可疑跨省用户数量与所述第一统计模块403统计的跨省用户数量的比值;可选的,本发明实施例中,所述第三确定模块405具体可以包括:第一确定单元4051,用于当确定所述第一计算单元4041计算的第一比值大于预置第一阈值时,确定所述特定渠道使用了刷量工具;和/或,第二确定单元4052,用于当确定所述第二计算单元4042计算的第二比值大于预置第二阈值时,确定所述特定渠道使用了刷量工具;和/或,第三确定单元4053,用于当确定所述第三计算单元4043计算的第三比值大于预置第三阈值时,确定所述特定渠道使用了刷量工具。可选的,作为本发明实施例中另一个刷量工具检测装置另一个实施例,上述第三确定模块405具体可以用于,当确定所述第一计算单元4041计算的第一比值大于预置第一阈值,且确定所述第二计算单元4042计算的第二比值大于预置第二阈值,且确定所述第三计算单元4043计算的第三比值大于预置第三阈值时,确定所述特定渠道使用了刷量工具。可以理解的是,第三确定模块405中还可以采用其他的确定单元的组合,此处不作限定,且根据第三确定模块405中使用的跨省相关比例的不同,上述各模块中没有被使用到的部分也可以不存在,此处不作限定。本发明实施例中,除了跨省用户数量外,第四确定模块406、第二统计模块408与第七确定模块410可以确定多种不同的其他类型的用户数量,第二确定模块404从而得到多种跨省相关比值,第三确定模块405根据这多种跨省相关比值来确定该特定渠道是否使用了刷量工具,采用这种方式,能获得渠道作弊更加直接的证据,基于IP地址变化的分析,可以发现渠道使用跨省IP地址资源库提供网络出口的情况,能更好的识别出刷量工具的使用。为了便于理解上述实施例,下面以上述刷量工具检测装置各个模块在一个具体应用场景中的交互过程进行说明:记录模块401记录一天内通过特定渠道A接入的用户以及用户接入的IP地址的对应关系,总共得到500条记录,例如,其中一条记录为(xiaoming,113.90.202.62);第一确定模块402获取500条记录中,每个IP地址对应的省份信息,得到第二对应关系(用户与省份信息的对应关系),第五确定模块407取每个IP地址的前两段形成IP2数据,得到第三对应关系(用户与IP2数据的对应关系),例如将该记录转换为(xiaoming,113.90,广东省),由于同一个用户的多个IP地址可能对应同一个省份信息和同一个IP2数据,例如,另一条记录(xiaoming,113.90.203.112)也转换为(xiaoming,113.90,广东省),因此转换之后的记录数目会减少,假设转换后的记录条数变成了350条;第一统计模块403、第四确定模块406、第二统计模块408、第六确定模 块409以及第七确定模块410根据该350条包含有第二对应关系和第三对应关系的记录,确定该预置时长内特定渠道A下如下类型的用户数量:1、第四确定模块406确定新增用户总数量;2、第二统计模块408确定多次访问的用户数量:如果同一个用户在该350条记录中对应有至少两个不同的IP2数据,则该用户为多次访问的用户。例如若还存在一条记录(xiaoming,113.93,广东省),则该用户xiaoming为多次访问的用户;3、第一统计模块403确定跨省用户的数量:如果一个用户对应至少两个省份信息,则该用户为跨省用户。例如若存在记录(xiaoqing,111.75,江西省),(xiaoqing,111.83,广东省),则该用户xiaoqing为跨省用户;4、第六确定模块409和第七确定模块410确定可疑跨省用户数量:如果一个跨省用户使用的多个IP2数据中有超过预置百分比(例如60%)的IP2数据属于可疑IP2数据,则该跨省用户为可疑用户,其中,当前渠道下一个IP2数据下新增用户数量大于预置用户数目(例如50),则该IP2数据为可疑IP2数据。例如,若记录中IP2数据113.93下新增用户的数目超过预置用户数目50个,则确定该IP2数据113.93为可疑IP2数据,同时可以确定其他的可疑IP2数据。若一个跨省用户xiaohuang在该350条记录中对应10个IP2数据,其中有70%(即7个)IP2数据为可疑IP2数据,则该用户xiaohuang为可以跨省用户。第一统计模块403、第四确定模块406、第二统计模块408、第六确定模块409以及第七确定模块410确定记录的特定渠道A下的350条记录中,存在的上述各种类型的用户数量如上表1所示;第二确定模块404基于上述各种类型的用户数量,确定跨省相关比例,设确定的各跨省相关比例如上表2所示;其中,第一计算单元4041计算第一比值,第二计算单元4042计算第二比值,第三计算单元4043计算第三比值;第一种情况:当确定第一比值0.8大于预置第一阈值0.6,第一确定单元4051确定该特定渠道A使用了刷量工具;且当确定第二比值0.7大于预置第二阈值0.5,第二确定单元4052确定该特定渠道A使用了刷量工具;且当确定第三比值0.6大于预置第三阈值0.4,第三确定单元4053确定该特定渠道A 使用了刷量工具。第二种情况:当确定第一比值0.8大于预置第一阈值0.6,第一确定单元4051确定该特定渠道A使用了刷量工具;或,当确定第二比值0.7大于预置第二阈值0.5,第二确定单元4052确定确定该特定渠道A使用了刷量工具;或,当确定第三比值0.6大于预置第三阈值0.4,第三确定单元4053确定确定该特定渠道A使用了刷量工具。可以理解的是,根据第三确定模块405判定选择的跨省相关比例的不同,组合方式的不同,以及设定的预置第一阈值,预置第二阈值,预置第三阈值取值的分别不同,还可以有更多的情况,此处不作限定。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售 或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1