应用程序的刷量识别方法、装置与流程

文档序号：11251687阅读：359来源：国知局

本申请涉及移动互联网技术领域，尤其涉及应用程序的刷量识别方法、装置。

背景技术：

随着移动互联网技术的发展，各种基于该移动互联网的移动端应用程序层出不穷，为人们的工作和学习带来诸多便利。但同时，对应用程序的下载刷量现象也随之产生，即，应用程序开发者或恶意利益相关者通过刷下载量或更新量，甚至伪造下载、更新，造成相应应用程序很受欢迎的假象，从中获取利益。

现有应用应用程序的刷量行为识别方法虽然很多，但都或多或少存在一些缺点。其中一种识别方法为：通过对应用程序或者提供各种应用程序的渠道的群体下载行为进行监控及分析，判断相应群体是否存在刷量行为；具体的，如果分析发现同一开发者开发的多个应用程序出现非常接近的下载趋势，或者某应用程序在多个省份和地域的下载量一样或非常接近，或者某应用程序某段时间的下载量和卸载量几乎一致，等等，都可以判定存在刷量行为。但这种方法是针对群体的分析，所以无法针对某个用户甚至某个下载行为，做出是否刷量的判断。现有另一种识别方法，通过获取阈值时间段内各个用户操作应用程序的操作数据，分析出每个用户是否存在多次下载同一应用程序的刷量行为；但这种方法只能识别出同一个用户的反复刷量行为，如果恶意用户通过不断虚拟新的设备伪装成初次下载来进行刷量，该方法将完全失效。

因此，如何准确识别各类应用程序刷量行为，已成为本领域技术人员亟需解决的问题。

技术实现要素：

为克服相关技术中存在的问题，本申请提供一种应用程序的反刷量方法、装置。

本申请第一方面，提供一种应用程序的刷量识别方法，包括：

获取每次用户操作行为发生时相应移动终端中各个传感器的状态采样值；

根据所述状态采样值计算所述用户操作行为的可信度；

判断所述用户操作行为的可信度是否在预设范围内，如果是，则判定所述用户操作行为为刷量行为。

结合第一方面，在第一方面第一种可行的实施方式中，获取每次用户操作行为发生时相应的移动终端中各个传感器的状态采样值，包括：

在发生用户操作行为时，获取相应移动终端中各个传感器的可访问状态；

对于可访问状态为允许访问的传感器，按照预设采样周期对其状态值进行采样得到对应的状态采样值。

结合第一方面，或者第一方面第一种可行的实施方式，在第一方面第二种可行的实施方式中，在根据所述状态采样值计算所述用户操作行为的可信度之前，所述方法还包括：

获取状态值正样本和状态值负样本，并根据所述状态值正样本和状态值负样本进行训练，确定预设神经网络模型的模型参数。

结合第一方面第二种可行的实施方式，在第一方面第三种可行的实施方式中，根据所述状态采样值计算所述用户操作行为的可信度，包括：

根据所述状态采样值计算各个传感器的采样值标准差；

根据所述采样值标准差生成对应于所述用户操作行为的特征向量；

将所述特征向量输入预设神经网络模型，并根据所述预设神经网络模型的模型参数计算所述用户操作行为的可信度。

结合第一方面，或者第一方面第一种可行的实施方式，在第一方面第四种可行的实施方式中，所述方法还包括：

在获取到所述状态采样值后，将所述状态采样值与对应的传感器标识码和移动终端标识码以打点日志的形式进行存储。

本申请第二方面，提供一种应用程序的刷量识别装置，包括：

数据采样单元，用于获取每次用户操作行为发生时相应移动终端中各个传感器的状态采样值；

数据处理单元，用于根据所述状态采样值计算所述用户操作行为的可信度；

刷量识别单元，用于判断所述用户操作行为的可信度是否在预设范围内，如果是，则判定所述用户操作行为为刷量行为。

结合第二方面，在第二方面第一种可行的实施方式中，所述数据采样单元包括：

访问状态确定模块，用于在发生用户操作行为时，获取相应移动终端中各个传感器的可访问状态；

数据采样模块，用于对于可访问状态为允许访问的传感器，按照预设采样周期对其状态值进行采样得到对应的状态采样值。

结合第二方面，或者第二方面第一种可行的实施方式，在第二方面第二种可行的实施方式中，所述装置还包括：

模型训练单元，用于获取状态值正样本和状态值负样本，并根据所述状态值正样本和状态值负样本进行训练，确定预设神经网络模型的模型参数。

结合第二方面第二种可行的实施方式，在第二方面第三种可行的实施方式中，所述数据处理单元包括：

标准差计算模块，用于根据所述状态采样值计算各个传感器的采样值标准差；

特征向量生成模块，用于根据所述采样值标准差生成对应于所述用户操作行为的特征向量；

可信度计算模块，用于将所述特征向量生成单元生成的特征向量输入预设神经网络模型，并根据所述预设神经网络模型的模型参数计算所述用户操作行为的可信度。

结合第二方面，或者第二方面第一种可行的实施方式，在第二方面第四种可行的实施方式中，所述装置还包括：

打点记录单元，用于在获取到所述状态采样值后，将所述状态采样值与对应的传感器标识码和移动终端标识码以打点日志的形式进行存储。

由以上技术方案可知，本申请实施例通过获取每次用户操作行为发生时相应的移动终端各个传感器的状态采样值，进而根据各个传感器的状态采样值计算该用操作行为的可信度，如果该可信度在预设范围内，则判定相应的用户操作行为是刷量行为。可见，相对于现有技术，上述刷量识别方法颗粒度更细，可以具体到对某个群体的某个用户的某个操作行为进行识别，且不被恶意用户伪装的操作行为所欺骗，能有效应对伪装成单次或少量下载的欺诈刷量行为；且不需要用户的历史操作信息，不需要用户的账户信息，具有识别准确率高，反刷量能力好的优点。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是本申请实施例提供的一种应用程序的反刷量方法的流程图。

图2是本申请实施例提供的另一种应用程序的反刷量方法的流程图。

图3是本申请实施例提供的一种应用程序的反刷量装置的结构框图。

图4是本申请实施例提供的一种应用程序的反刷量装置在实际应用中的配置框图；

图5是本申请实施例提供的另一种应用程序的反刷量装置的结构框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

为解决准确识别各类刷量行为的问题，申请人对现有刷量操作方式进行的研究总结，发现其可以概括为如下两种：(1)通过虚拟机，用软件模拟出一个或者多个移动终端，并通过这些虚拟出的移动终端进行刷量作弊；(2)通过在真实移动终端上，用软件虚拟出用户的操作行为进行刷量作弊；进而将上述刷量操作与在真实移动终端上的实际操作进行比较，发现主要区别在于，真实移动终端上的实际操作，不可避免地会人为造成移动终端抖动(如，位置变化、放置形态变化等)，即使是很微小的抖动也可以被移动终端中内置的各种高灵敏度传感器(如，加速度计、陀螺仪、磁力计、方位传感器等)感应到；而上述第一种刷量操作不存在真是的移动终端，故也不存在可以感应抖动的传感器，第二种刷量操作虽然通过真实的移动终端实现，但由于其是通过软件模拟用户操作行为，故不会导致移动终端的抖动，相应的也不会对传感器造成影响。

基于以上发现，本申请提供一种基于移动终端传感器的刷量识别方法。图1为本申请一个实施例提供的方法流程图。参照图1，该方法包括以下步骤。

s11、获取每次用户操作行为发生时相应的移动终端中各个传感器状态采样值。

s12、根据所述状态采样值计算所述用户操作行为的可信度。

s13、判断所述用户操作行为的可信度是否在预设范围内，如果是，则判定所述用户操作行为为刷量行为。

移动终端中内置的传感器感应到移动终端抖动后的直接表现为其状态值的变化，即，移动终端静置时，其传感器的状态值固定不变，或者仅存在传感器自身的误差变化，当移动终端发生抖动时，传感器的状态值才会发生较大变化。而对于上述第一种刷量操作，由于其是通过软件在虚拟机中虚拟得到的移动终端，故其不存在传感器，或者其也可以同时虚拟出传感器，但状态值始终为固定值，而对于第二种刷量操作，虽然其在真实的移动终端上实现，但由于其操作过程也是通过软件虚拟的，不需要用户手持操作移动终端，故不会造成移动终端的抖动，移动终端的传感器也就不会感应到变化，传感器的状态值也会保持在一定范围内，不会发生较大变化。有鉴于此，本申请实施例通过获取每次用户操作行为发生时相应的移动终端各个传感器的状态采样值，进而以获取到的各个传感器的状态采样值为变量值，计算该用户操作行为的可信度，根据该可信度即可判定相应的用户操作行为是刷量行为还是用户实际操作行为。

其中，上述预设范围具体可以根据实际情况而定；假设可信度的取值范围为[0,1]，且设定可信度取值越小，表明相应的用户操作行为是刷量行为的可能性越大，进而可以设定上述预设范围为[0,0.8)，即当可行度小于0.8时，即判定相应的用户操作行为为刷量行为。

由以上技术方案可知，本申请实施例通过获取每次用户操作行为发生时相应的移动终端各个传感器的状态采样值，进而根据各个传感器的状态采样值计算该用操作行为的可信度，如果该可行度在预设范围内，则判定相应的用户操作行为是刷量行为。可见，相对于现有技术，上述刷量识别方法颗粒度更细，可以具体到对某个群体的某个用户的某个操作行为进行识别，且不被恶意用户伪装的操作行为所欺骗，能有效应对伪装成单次或少量下载的欺诈刷量行为；且不需要用户的历史操作信息，不需要用户的账户信息，具有识别准确率高，反刷量能力好的优点。

在本申请一个可行的实施例中，上述步骤s11中获取状态采样值的过程，具体可以包括：

s111、在发生用户操作行为时，获取相应移动终端中各个传感器的可访问状态；

s112、对于可访问状态为允许访问的传感器，按照预设采样周期对其状态值进行采样得到对应的状态采样值。

具体的，可以对移动终端进行实时监听，当监听到移动终端发生用户操作行为时，尝试访问各个传感器的设备信息，如果能访问该传感器的设备信息，则标记该传感器的可访问状态为“1”，即允许访问，否则标记为“0”，即不允许访问。

对可访问状态标记为“1”的传感器，可以在预设时间段内按照预设采样周期对其状态值进行采样，例如：在监听到用户操作行为的随后1秒(预设时间段)内，以100毫秒的时间间隔(预设采用周期)，对该传感器的状态值进行采样，得到对应的状态采样值。而对可访问状态标记为“0”的传感器，则不获取其状态采样值(因不可访问，故无法对其状态值进行采样)。

在本申请一个可行的实施例中，为便于利用状态采样值进行综合分析计算，上述刷量识别方法还可以包括：

s11’、在获取到所述状态采样值后，将所述状态采样值与对应的传感器标识码和移动终端标识码以打点日志的形式进行存储。

根据上述步骤s111和s112所述的采样方法，上述打点日志的存储内容可以包括：每次用户操作行为对应的移动终端标识码(如手机序列号(internationalmobileequipmentidentity，imei)等)、各个传感器对应的传感器标识码、可访问状态及状态采样值，具体可参考下表所示(表中具体数据仅为一种可行性示例，实际数据不限于此)：

每个预设采样周期采样一次，则存储一条打点记录；由于存在多个传感器，故每条打点记录依次存储每个传感器的标识码、可访问状态及采样值，例如，可以将加速度计(即accelerometer，以缩略形式acc作为其标识码)作为第一传感器、陀螺仪(即gyroscope，以缩略形式gy作为其标识码)作为第二传感器……，然后按顺序将各个传感器的标识码、可访问状态和采样值记录于上表中。

可选的，实时或定时将打点日志上传至服务器，并通过服务器继续执行上述步骤s12和s13，实现对每个用户操作行为的统一进行分析识别。

参照图2，在本申请一个可行的实施例中，在步骤s12之前，上述刷量识别方法还包括以下步骤：

s14、获取状态值正样本和状态值负样本，并根据所述状态值正样本和状态值负样本进行训练，确定预设神经网络模型的模型参数。

本实施例中，可以预先选取适量的正样本打点记录和负样本打点记录，也即所述状态值正样本和状态值负样本，将其输入预设神经网络模型进行学习训练，采用梯度下降法确定各个模型参数。该预设神经网络模型相当于一个关于传感器采样值标准差的非线性函数，模型参数则相当于构成该非线性函数中的各个参量，该非线性函数的计算结果即为相应用户操作行为的可信度。

相应的，步骤s12具体可以包括：

s121、根据所述状态采样值计算各个传感器的采样值标准差；

s122、根据所述采样值标准差生成对应于所述用户操作行为的特征向量；

s123、将所述特征向量输入预设神经网络模型，并根据所述预设神经网络模型的模型参数计算所述用户操作行为的可信度。

其中，特征向量的每个维度代表一种参数；实际应用中，每个传感器的采样值可以包括x轴、y轴和z轴三个方向的数值，故每个传感器在特征向量中的参数至少可以包括：该传感器在x轴、y轴和z轴三个方向上的标准差；还可以在特征向量中记录各个传感器的可访问状态标记(“1”或“0”)。

例如，对于加速度计，其参数可以包括：加速度计可访问标识(acc_v)、加速度计x方向标准差(acc_std_x)、加速度计y方向标准差(acc_std_y)、加速度计z方向标准差(acc_std_z)。

如果加速度计的可访问状态为允许访问，则：

acc_v＝1；

acc_std_x＝加速度计x方向采样值的标准差；

acc_std_y＝加速度计y方向采样值的标准差；

acc_std_z＝加速度计z方向采样值的标准差。

如果加速度计的可访问状态为不允许访问，则其所有参数值都相应记为0，即：

acc_v＝0；

acc_std_x＝0；

acc_std_y＝0；

acc_std_z＝0。

同理，对于陀螺仪，其参数可以包括：陀螺仪可访问标识(gy_v)、陀螺仪x方向标准差(gy_std_x)、陀螺仪y方向标准差(gy_std_y)、陀螺仪z方向标准差(gy_std_z)。

对于磁力计(即magnetometer)，其参数可以包括：磁力计可访问标识(mag_v)、磁力计x方向标准差(mag_std_x)、磁力计y方向标准差(mag_std_y)、磁力计z方向标准差(mag_std_z)。

对于方位传感器(即orientationsensor)，其参数可以包括：方位传感器可访问标识(ori_v)、方位传感器x方向标准差(ori_std_x)、方位传感器y方向标准差 (ori_std_y)、方位传感器z方向标准差(ori_std_z)。

其中，以加速度计x方向为例，假设针对某个用户操作行为，在加速度计x方向上各个采样周期得到的状态采样值为xi，(其中，i＝1,2,…,n，n为采样周期总个数)，则其标准差计算公式为其中，为x方向上所有状态采样值的平均值，计算公式为同理，加速度计其他方向、以及其他传感器各个方向采样值的标准差计算过程可以参照上述加速度计x方向上的计算过程，此处不再赘述。

基于以上各个传感器参数，可以得到相应的特征向量：

vt＝[acc_v,acc_std_x,acc_std_y,acc_std_z,gy_v,gy_std_x,gy_std_y,gy_std_z,mag_std_x,mag_std_y,mag_std_z,ori_v,ori_std_x,ori_std_y,ori_std_z]。

将步骤s122转化得到的特征向量输入步骤s14训练得到的预设神经网络模型，即将所述特征向量作为变量值输入上述非线性函数，解析该非线性函数得到对应的函数计算结果，该函数计算结果即为步骤s11获取到的状态采样值对应的用户操作行为的可信度。

由以上步骤可知，本申请实施例将获取到的状态采样值最终转化为用户操作行为的特征向量，并通过神经网络模型来确定该特征向量对应的用户操作行为的可信度，进而可以根据该可行度判断该用户操作行为是否为刷量行为，整个识别过程可以完全采用计算机进行分析处理，可以提高识别效率；同时，上述预设神经网络模型的模型参数由大量样本数据训练得到的，可以保证识别准确率。

可选的，在步骤s13得到识别结果，判定某个用户操作行为为刷量行为后，还可以进一步根据打点日志确定该用户操作行为对应的标识码和移动设备标识码等信息，以便于对相关设备或用户进行警告或限制，避免其继续进行刷量。

另外，本申请实施例还提供了一种计算机存储介质，例如可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等；该计算机存储介质中存储有程序，当所述存储介质中的程序由相应处理器执行时，使得该处理器能够执行上述方法实施例中记载的部分或全部步骤。

相应于上述应用程序的刷量识别方法，本申请实施例还提供了一种应用程序的刷量识别装置。图3为该装置的一种结构框图，具体包括：数据采样单元100、数据处理单元200和刷量识别单元300。

其中，该数据采样单元100用于，获取每次用户操作行为发生时相应移动终端中各个传感器的状态采样值。

该数据处理单元200用于，根据所述状态采样值计算所述用户操作行为的可信度。

该刷量识别单元300用于，判断所述用户操作行为的可信度是否在预设范围内，如果是，则判定所述用户操作行为为刷量行为。

由以上装置结构可知，本申请实施例通过获取每次用户操作行为发生时相应的移动终端各个传感器的状态采样值，进而根据各个传感器的状态采样值计算该用操作行为的可信度，如果该可信度在预设范围内，则判定相应的用户操作行为是刷量行为。可见，相对于现有技术，上述刷量识别方法颗粒度更细，可以具体到对某个群体的某个用户的某个操作行为进行识别，且不被恶意用户伪装的操作行为所欺骗，能有效应对伪装成单次或少量下载的欺诈刷量行为；且不需要用户的历史操作信息，不需要用户的账户信息，具有识别准确率高，反刷量能力好的优点。

在本申请一个可行的实施例中，上述应用程序的刷量识别装置在实际应用中的配置方式如图4所示，上述数据采样单元1001可以直接设置在移动终端中，数据处理单元200和刷量识别单元300设置于服务器中；数据采样单元100实时或定时将用户操作行为对应的状态采样值上传至服务器，进而有服务器中的数据处理单元200和刷量识别单元300对每个移动终端或每个用户对应的每次操作行为进行识别。

在本申请一个可行的实施例中，上述数据采样单元100具体可以包括：

访问状态确定模块，用于在发生用户操作行为时，获取相应移动终端中各个传感器的可访问状态；

数据采样模块，用于对于可访问状态为允许访问的传感器，按照预设采样周期对其状态值进行采样得到对应的状态采样值。

进一步的，上述刷量识别装置还可以包括：打点记录单元。

该打点记录单元具体可以与数据采样单元共同设置于移动终端中，用于在数据采样单元获取到所述状态采样值后，将所述状态采样值与对应的传感器标识码和移动终端标识码以打点日志的形式进行存储。

参照图5，在本申请一个可行的实施例中，上述装置还可以包括：

模型训练单元400，用于获取状态值正样本和状态值负样本，并根据所述状态值正样本和状态值负样本进行训练，确定预设神经网络模型的模型参数。

具体的，该模型训练单元400可以与上述数据处理单元200和刷量识别单元300共同设置于服务器中。

相应的，数据处理单元200可以包括：

标准差计算模块201，用于根据所述状态采样值计算各个传感器的采样值标准差；

特征向量生成模块202，用于根据所述采样值标准差生成对应于所述用户操作行为的特征向量；

可信度计算模块203，用于将所述特征向量生成单元生成的特征向量输入预设神经网络模型，并根据所述预设神经网络模型的模型参数计算所述用户操作行为的可信度。

其中，采样值标准差的计算方式可参照上文方法实施例，此处不再赘述。

本申请实施例将获取到的状态采样值最终转化为用户操作行为的特征向量，进而通过基于大量样本数据训练得到的预设神经网络模型以上述特征向量为输入计算得到相应用户操作行为的可信度，基于该可信度实现对用户操作行为的识别，确定其是否为刷量行为，可以提高识别效率和准确率。

关于上述实施例中的装置，其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄振
技术所有人：广州市动景计算机科技有限公司
我是此专利的发明人

上一篇：一种商品生产包装过程信息追踪方法、服务器及系统与流程
上一篇：异常交易数据的获取方法和装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。