应用程序的反作弊方法及装置与流程

文档序号:14176375阅读:671来源:国知局
应用程序的反作弊方法及装置与流程

本发明涉及网络安全技术领域,特别是涉及一种应用程序的反作弊方法及装置。



背景技术:

随着信息技术的不断发展,各种各样的应用程序随之出现。应用程序开发者通常会进行应用程序推广,使得用户在看到应用程序推广后安装使用应用程序,以吸引更多的用户数。为了用户数,或者为了给投资者看应用程序的相应数据,或者为了获取一些非法数据,以获取更多经济利益,一些开发者会采用作弊方式推广或者使用应用程序,这样的应用程序可以称为作弊应用程序。例如,通过刷机方式刷取假的用户数,数据流量等。为了保证应用程序市场正常运行,需要严厉打击应用程序作弊的行为。

目前,主要采用人工方式识别作弊应用程序,并对所述应用程序进行反作弊处理。然而,涉及作弊的应用程序数量巨多,且技术人员的精力有限,通过上述方式反应用程序作弊,会造成应用程序的反作弊效率和精确度较低。



技术实现要素:

有鉴于此,本发明提供一种应用程序的反作弊方法及装置,主要目的在于能够提升应用程序的反作弊效率和精确度。

依据本发明第一方面,提供了一种应用程序的反作弊方法,包括:

利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;

将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的;

若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

依据本发明第二方面,提供了一种应用程序检测装置,包括:

词向量处理单元,用于利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;

识别单元,用于将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的;

反作弊处理单元,还用于若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

依据本发明第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:

利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;

将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的;

若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

依据本发明第四方面,提供了一种应用程序的反作弊装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:

利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;

将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的;

若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

本发明提供一种应用程序的反作弊方法及装置,与目前采用人工方式识别作弊应用程序,并对所述应用程序进行反作弊处理相比,本发明能够利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到。与此同时,在识别出所述应用程序为作弊应用程序时,能够利用预设反作弊规则对所述应用程序进行反作弊处理,从而能够实现自动进行应用程序的反作弊,进而能够提升应用程序的反作弊的效率和精确度。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的一种应用程序的反作弊方法流程图;

图2示出了本发明实施例提供的另一种应用程序的反作弊方法流程图;

图3示出了本发明实施例提供的一种作弊识别模型的训练方法流程图;

图4示出了本发明实施例提供的一种应用程序的反作弊装置的结构示意图;

图5示出了本发明实施例提供的另一种应用程序的反作弊装置的结构示意图;

图6示出了本发明实施例提供的一种应用程序的反作弊装置的实体结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

如背景技术所述,目前主要采用人工方式识别作弊应用程序,并对所述应用程序进行反作弊处理。然而,涉及作弊的应用程序数量巨多,且技术人员的精力有限,通过上述方式反应用程序作弊,会造成应用程序的反作弊效率较低。

为了解决上述技术问题,本发明实施例提供了一种应用程序的反作弊方法,如图1所示,所述方法包括:

101、利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量。

其中,所述应用程序的词向量能够表示所述应用程序,利用所述预设词向量模型对应用程序进行词向量处理的过程可以包括如下步骤:

1、对所述应用程序进行分词处理,以提取所述应用程序对应的关键词。所采用的分词方法可以为基于字符串匹配的分词方法、基于理解的分词方法、基于统计的分词方法,这些分词方法都具有较高的分词准确率和快速的分词系统,能够自动过滤掉中间词、助词、连词、感叹词等停顿词、保留名词、动词、形容词等指定词性的词,并将指定词性的词作为候选关键词。

2、在所述预设词向量模型中查找关键词对应的词向量,预设词向量模型包括关键词的词向量。所述预设词向量模型可以为通过word2vec训练得到的,word2vec可以为一种生成词向量的神经网络模型,即在训练所述模型时,将词语作输入、输出一个低维度的词向量表示这个词语,然后用反向传播的方法不断优化参数。通过word2vec可以训练能够表示应用程序语义关系的词向量。

102、将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序。

其中,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的。所述样本应用程序对应的样本词向量可以为通过步骤101所描述的方式获取的,所述预设机器学习算法可以为卷积神经网络模型或者预设逻辑斯特回归拟合算法。所述作弊识别模型可以通过离线方式自动训练的,训练的作弊识别模型可以称为作弊识别的离线模型,而在识别所述应用程序是否为作弊应用程序时,可以通过在线方式识别,通过离线方式自动训练作弊识别模型,能够避免占用较多的网络资源,从而能够提升作弊应用程序的识别速度,进而能够提升作弊应用程序的识别效率。

对于本发明实施例,所述作弊识别模型可以为基于非线性函数实现的,具体地,所述作弊识别模型可以包括输入层、隐藏层和输出层,输入层对应于输入的词向量,所述隐藏层用于根据词向量和作弊标注对输入的词向量计算;所述输出层用于将计算得到的判断结果进行输出,所述隐藏层即为利用非线性函数对输入的作弊识别模型进行计算的层。

需要说明是,在将所述词向量输入到所述作弊识别模型进行匹配,所述作弊识别模型将所述词向量与样本词向量进行匹配,若输入的词向量与作弊标注对应的样本词向量的相似度较高,则可以确定输入的词向量所表示的应用程序与作弊应用程序相似度较高,则将输入的词向量所表示的应用程序也确定为作弊应用程序。

103、若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

其中,所述预设反作弊规则可以为通过清理、拦截、加入黑名单实现反作弊的规则。通过对所述应用程序进行反作弊处理,能够应用程序市场的正常运行,从而保证应用程序提供商的合法权益。

本发明实施例提供的一种应用程序的反作弊方法,与目前采用人工方式识别作弊应用程序,并对所述应用程序进行反作弊处理相比,本发明实施例能够利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到。与此同时,在识别出所述应用程序为作弊应用程序时,能够利用预设反作弊规则对所述应用程序进行反作弊处理,从而能够实现自动进行应用程序的反作弊,进而能够提升应用程序的反作弊的效率和精确度。

进一步的,为了更好的说明上述应用程序的反作弊的过程,作为对上述实施例的细化和扩展,本发明实施例提供了另一种应用程序的反作弊方法,如图2所示,但不限于此,具体如下所示:

201、通过训练的用户画像获取应用程序安装列表。

其中,用户画像可以包括用户标识和每个用户标识对应的安装应用程序,例如,用户标识1对应100个安装应用程序、用户标识2对应200个安装应用程序,通过用户画像即可以获取应用程序安装列表。在训练作弊识别模式时,每个用户对应的安装应用程序可以作为一条训练数据。

202、对所述应用程序安装列表进行数据清洗,得到样本应用程序。

需要说明的是,对所述应用程序安装列表进行数据清洗的过程可以为根据格式对应用程序进行筛选,保留符合预设格式的应用程序,删除不符合预设格式的应用程序,从而可以获取用户训练作弊识别模型的样本应用程序。

203、利用所述预设词向量模型对所述样本应用程序进行词向量处理,得到所述样本应用程序对应的样本词向量。

需要说明的是,得到所述样本应用程序对应的样本词向量的具体过程可以如步骤101所描述的,本发明实施例在此不进行限定。在获取样本词向量时,还可以利用上下文的方式,将所述样本应用程序用样本词向量进行表示。利用上下文的方式获取样本词向量,能够提升样本词向量的召回率,进而提升所述作弊识别模型的训练效果。

204、利用预设聚类算法和种子作弊词向量,对所述样本词向量进行分类。

其中,所述预设聚类算法可以为kmeans聚类算法,当采用kmeans聚类算法对所述样本词向量进行分类时,可以根据每个样本词向量设置中心点,根据每个样本词向量与中心点的距离,将样本词向量划分到相应的类别中,例如,可以得到类别1、类别2…类别n,所述样本词向量中存在与种子作弊词向量为同一类别的词向量。此外,通过kmeans聚类算法对所述样本词向量进行分类,能够提升所述样本词向量的分类效果,进而能够提升反作弊效果。

对于本发明实施例,为了确定种子作弊词向量,所述步骤204之前,所述方法还包括:将反编译代码的、破解通讯协议的、或者安装虚拟机的应用程序,确定为种子作弊应用程序;利用所述预设词向量模型对所述种子作弊应用程序进行词向量处理,得到所述种子作弊词向量。用户可以通过反编译应用程序的代码、破解应用程序的通讯协议、或者通过安装虚拟机的方式进行应用程序作弊,例如,安装的虚拟机可以为xposed虚拟机,可以将这些应用程序确定为作弊应用程序。因此,可以将已知的作弊应用程序作为种子作弊应用程序,然后通过种子作弊应用程序获取更多的样本作弊应用程序,进而训练作弊识别模型。

205、对与所述种子作弊词向量归属于同一类别的样本词向量进行标注,得到作弊标注。

需要说明的是,对所述样本词向量进行标注的方式可以为半自动方式,即先通过自动方式对所述样本词向量进行标注,然后再通过人工方式审核标注结果是否正确,通过半自动方式进行标注不仅可以提升标注效率,而且可以保证标注准确性,避免识别作弊应用程序出现错误的情况。

206、利用预设机器学习算法对所述样本词向量和所述作弊标注进行训练,得到所述作弊识别模型。

对于本发明实施例,为了得到所述作弊识别模型,所述步骤206具体可以包括:对所述样本词向量和所述作弊标注进行抽样处理;将抽样后的样本词向量和作弊标注拆分为训练集和测试集;利用预设逻辑斯特回归拟合算法对所述训练集进行训练,得到训练模型;利用所述测试集验证所述训练模型的效果直到满足预设条件,得到所述作弊识别模型。通过利用预设逻辑斯特回归拟合算法对所述训练集进行训练,能够提升训练模型的识别效率,通过利用所述测试集验证所述训练模型的效果直到满足预设条件,能够进一步提升所述作弊识别模型的识别精确度。其中,所述预设条件可以为根据用户需要进行设置,例如,测试数据结果可以如下所示:

需要说明的是,步骤201-206训练所述作弊识别模块的过程,还可以如图3所示,为了进一步地提升所述作弊识别模型的识别准确性,在训练作弊识别模型时,还可以对样本词向量进行dev处理,然后根据dev处理结果和预设逻辑斯特回归拟合算法,对训练集进行过度拟合训练,然后根据利用测试集对过度拟合训练的模型进行测试,直到所述作弊识别模型满足预设条件。

207、利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量。

208、将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序。

对于本发明实施例,为了识别所述应用程序是否为作弊应用程序,所述步骤208具体可以为:将所述词向量输入到所述作弊识别模型进行匹配;确定所述词向量与作弊标注对应的样本词向量之间的相似度是否大于或者等于预设相似度阈值;若是,则确定所述应用程序为作弊应用程序;若否,则确定所述应用程序为非作弊应用程序。其中,所述预设相似度阈值可以为0.8,0.9。例如,若预设相似度阈值可为0.8,所述词向量与作弊标注对应的样本词向量之间的相似度大于0.8,则可以确定所述词向量所表示的应用程序为作弊应用程序,否则为非作弊应用程序。

需要说明的是,词向量之间的相似度可以通过词向量之间的余弦距离表示,所述确定所述词向量与作弊标注对应的样本词向量之间的相似度是否大于或者等于预设相似度阈值的过程具体可以包括:确定所述词向量与作弊标注对应的样本词向量之间的余弦距离是否小于或者等于预设余弦距离。其中,所述预设余弦距离可以根据用户需求进行设置,例如,所述预设余弦距离可以为0.8,0.9等。所述余弦距离具体可以通过如下公式但不限于如下公式计算:

其中,θ表示词向量之间的夹角,x1k表示n维的所述词向量的特征值,x2k表示n维的样本词向量的特征值,n表示词向量空间的维度。通过计算词向量之间的距离,可以表示词与词之间的相似度。

需要说明的是,通过作弊识别模型,识别出的作弊应用程序可以如下所示:一种撸羊毛专员工具(net.bing.jun)、间谍软件(com.aiqidi.nemo)、函数测试软件(com.andriod.csdfunction)、超级权限管理软件(eu.chainfire.supersu)、…、修改手机型号软件(com.cyjh.mobileanjian)等。

209、若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

其中,所述预设反作弊规则可以为通过清理、拦截、加入黑名单实现反作弊的规则,所述步骤209具体可以为:通过对所述应用程序进行清理、拦截或者加入到黑名单,实现所述应用程序的反作弊。

本发明实施例提供的另一种应用程序的反作弊方法,与目前采用人工方式识别作弊应用程序,并对所述应用程序进行反作弊处理相比,本发明实施例能够利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到。与此同时,在识别出所述应用程序为作弊应用程序时,能够利用预设反作弊规则对所述应用程序进行反作弊处理,从而能够实现自动进行应用程序的反作弊,进而能够提升应用程序的反作弊的效率和精确度。

进一步地,作为图1的具体实现,本发明实施例提供了一种应用程序的反作弊装置,如图4所示,所述装置包括:词向量处理单元31、识别单元32、反作弊处理单元33。

所述词向量处理单元31,可以用于利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量。所述词向量处理单元31是本装置中利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量的主要功能模块。其中,所述预设词向量模型可以为word2vec模型。通过word2vec可以训练能够表示应用程序语义关系的词向量。

所述识别单元32,可以用于将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的。所述识别单元32是本装置中将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序的主要功能模块,也是核心模块。其中,所述预设机器学习算法为卷积神经网络算法。

所述反作弊处理单元33,还可以用于若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。所述反作弊处理单元33是本装置中利用预设反作弊规则对所述应用程序进行反作弊处理的主要功能模块。

对于本发明实施例,为了训练所述作弊模型,如图5所示,所述装置还包括:获取单元34、清洗单元35、分类单元36、标注单元37、训练单元38。

所述获取单元34,可以用于通过训练的用户画像获取应用程序安装列表。所述获取单元34是本装置中通过训练的用户画像获取应用程序安装列表的主要功能模块。

所述清洗单元35,用于对所述应用程序安装列表进行数据清洗,得到样本应用程序。所述清洗单元35是本装置中对所述应用程序安装列表进行数据清洗,得到样本应用程序的主要功能模块。

所述词向量处理单元31,还可以用于利用所述预设词向量模型对所述样本应用程序进行词向量处理,得到所述样本应用程序对应的样本词向量。

所述分类单元36,可以用于利用预设聚类算法和种子作弊词向量,对所述样本词向量进行分类。所述分类单元36是本装置中利用预设聚类算法和种子作弊词向量,对所述样本词向量进行分类的主要功能模块。

所述标注单元37,可以用于对与所述种子作弊词向量归属于同一类别的样本词向量进行标注,得到作弊标注。所述标注单元37是本装置中对与所述种子作弊词向量归属于同一类别的样本词向量进行标注,得到作弊标注的主要功能模块。

所述训练单元38,可以用于利用预设机器学习算法对所述样本词向量和所述作弊标注进行训练,得到所述作弊识别模型。所述训练单元38是本装置中利用预设机器学习算法对所述样本词向量和所述作弊标注进行训练,得到所述作弊识别模型的主要功能模块。

所述训练单元38,具体可以用于对所述样本词向量和所述作弊标注进行抽样处理;将抽样后的样本词向量和作弊标注拆分为训练集和测试集;利用预设逻辑斯特回归拟合算法对所述训练集进行训练,得到训练模型;利用所述测试集验证所述训练模型的效果直到满足预设条件,得到所述作弊识别模型。

对于本发明实施例,为了获取种子作弊词向量,所述装置还包括:确定单元39。

所述确定单元39,可以用于将反编译代码的、破解通讯协议的、或者安装虚拟机的应用程序,确定为种子作弊应用程序。

所述词向量处理单元31,还可以用于利用所述预设词向量模型对所述种子作弊应用程序进行词向量处理,得到所述种子作弊词向量。

对于本发明实施例,为了识别作弊应用程序,所述识别单元32可以包括:匹配模块311和确定模块312。

所述匹配模块311,可以用于将所述词向量输入到所述作弊识别模型进行匹配。

所述确定模块312,用于确定所述词向量与作弊标注对应的样本词向量之间的相似度是否大于或者等于预设相似度阈值。

所述确定模块312,还可以用于若确定所述词向量与作弊标注对应的样本词向量之间的相似度大于或者等于预设相似度阈值,则确定所述应用程序为作弊应用程序。

所述确定模块312,还可以用于若确定所述词向量与作弊标注对应的样本词向量之间的相似度大于或者等于预设相似度阈值,则确定所述应用程序为非作弊应用程序。

所述确定模块312,具体可以用于确定所述词向量与作弊标注对应的样本词向量之间的余弦距离是否小于或者等于预设余弦距离。

在具体应用场景中,所述反作弊处理单元33,具体可以用于通过对所述应用程序进行清理、拦截或者加入到黑名单,实现所述应用程序的反作弊。

需要说明的是,本发明实施例提供的一种应用程序的反作弊装置所涉及各功能模块的其他相应描述,可以参考图1所示方法的对应描述,在此不再赘述。

基于上述如图1所示方法,相应的,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的;若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

基于上述如图1所示方法和如图4所示应用程序的反作弊装置的实施例,本发明实施例还提供了一种应用程序的反作弊装置的实体结构图,如图6所示,该装置包括:处理器41、存储器42、及存储在存储器42上并可在处理器上运行的计算机程序,其中存储器42和处理器41均设置在总线43上所述处理器41执行所述程序时实现以下步骤:利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的;若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。该装置还包括:总线43,被配置为耦接处理器41及存储器42。

通过本发明的技术方案,能够利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到。与此同时,在识别出所述应用程序为作弊应用程序时,能够利用预设反作弊规则对所述应用程序进行反作弊处理,从而能够实现自动进行应用程序的反作弊,进而能够提升应用程序的反作弊的效率和精确度。

本发明还提供了如下技术方案:

a1、一种应用程序的反作弊方法,包括:

利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;

将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的;

若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

a2、如a1所述的方法,所述利用预设词向量模型对应用程序进行词向量处理之前,所述方法还包括:

通过训练的用户画像获取应用程序安装列表;

对所述应用程序安装列表进行数据清洗,得到样本应用程序;

利用所述预设词向量模型对所述样本应用程序进行词向量处理,得到所述样本应用程序对应的样本词向量;

利用预设聚类算法和种子作弊词向量,对所述样本词向量进行分类;

对与所述种子作弊词向量归属于同一类别的样本词向量进行标注,得到作弊标注;

利用预设机器学习算法对所述样本词向量和所述作弊标注进行训练,得到所述作弊识别模型。

a3、如a2所述的方法,所述利用预设机器学习算法对所述样本词向量和所述作弊标注进行训练,得到所述作弊识别模型,具体包括:

对所述样本词向量和所述作弊标注进行抽样处理;

将抽样后的样本词向量和作弊标注拆分为训练集和测试集;

利用预设逻辑斯特回归拟合算法对所述训练集进行训练,得到训练模型;

利用所述测试集验证所述训练模型的效果直到满足预设条件,得到所述作弊识别模型。

a4、如a2所述的方法,所述利用预设聚类算法和种子作弊词向量,对所述样本词向量进行分类之前,所述方法还包括:

将反编译代码的、破解通讯协议的、或者安装虚拟机的应用程序,确定为种子作弊应用程序;

利用所述预设词向量模型对所述种子作弊应用程序进行词向量处理,得到所述种子作弊词向量。

a5、如a1所述的方法,所述将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,具体包括:

将所述词向量输入到所述作弊识别模型进行匹配;

确定所述词向量与作弊标注对应的样本词向量之间的相似度是否大于或者等于预设相似度阈值;

若是,则确定所述应用程序为作弊应用程序;

若否,则确定所述应用程序为非作弊应用程序。

a6、如a5所述的方法,所述确定所述词向量与作弊标注对应的样本词向量之间的相似度是否大于或者等于预设相似度阈值,具体包括:

确定所述词向量与作弊标注对应的样本词向量之间的余弦距离是否小于或者等于预设余弦距离。

a7、如a1所述的方法,所述利用预设反作弊规则对所述应用程序进行反作弊处理,具体包括:

通过对所述应用程序进行清理、拦截或者加入到黑名单,实现所述应用程序的反作弊。

a8、如a1-a7任一项所述的方法,所述预设词向量模型为基于word2vec模型训练的。

b9、一种应用程序的反作弊装置,包括:

词向量处理单元,用于利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;

识别单元,用于将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的;

反作弊处理单元,还用于若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

b10、如b9所述的装置,所述装置还包括:获取单元、清洗单元、分类单元、标注单元、训练单元,

所述获取单元,用于通过训练的用户画像获取应用程序安装列表;

所述清洗单元,用于对所述应用程序安装列表进行数据清洗,得到样本应用程序;

所述词向量处理单元,还用于利用所述预设词向量模型对所述样本应用程序进行词向量处理,得到所述样本应用程序对应的样本词向量;

所述分类单元,用于利用预设聚类算法和种子作弊词向量,对所述样本词向量进行分类;

所述标注单元,用于对与所述种子作弊词向量归属于同一类别的样本词向量进行标注,得到作弊标注;

所述训练单元,用于利用预设机器学习算法对所述样本词向量和所述作弊标注进行训练,得到所述作弊识别模型。

b11、如b10所述的装置,

所述训练单元,具体用于对所述样本词向量和所述作弊标注进行抽样处理;将抽样后的样本词向量和作弊标注拆分为训练集和测试集;利用预设逻辑斯特回归拟合算法对所述训练集进行训练,得到训练模型;利用所述测试集验证所述训练模型的效果直到满足预设条件,得到所述作弊识别模型。

b12、如b10所述的装置,所述装置还包括:确定单元,

所述确定单元,用于将反编译代码的、破解通讯协议的、或者安装虚拟机的应用程序,确定为种子作弊应用程序;

所述词向量处理单元,还用于利用所述预设词向量模型对所述种子作弊应用程序进行词向量处理,得到所述种子作弊词向量。

b13、如b9所述的装置,所述识别单元包括:

匹配模块,用于将所述词向量输入到所述作弊识别模型进行匹配;

确定模块,用于确定所述词向量与作弊标注对应的样本词向量之间的相似度是否大于或者等于预设相似度阈值;

所述确定模块,还用于若确定所述词向量与作弊标注对应的样本词向量之间的相似度大于或者等于预设相似度阈值,则确定所述应用程序为作弊应用程序;

所述确定模块,还用于若确定所述词向量与作弊标注对应的样本词向量之间的相似度大于或者等于预设相似度阈值,则确定所述应用程序为非作弊应用程序。

b14、如b13所述的装置,

所述确定模块,具体用于确定所述词向量与作弊标注对应的样本词向量之间的余弦距离是否小于或者等于预设余弦距离。

b15、如b9所述的装置,

所述反作弊处理单元,具体用于通过对所述应用程序进行清理、拦截或者加入到黑名单,实现所述应用程序的反作弊。

b16、如b9-b15任一项所述的装置,所述预设词向量模型为基于word2vec模型训练的。

c17、一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以下步骤:

利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;

将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的;

若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

d18、一种应用程序的反作弊装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现以下步骤:

利用预设词向量模型对应用程序进行词向量处理,得到所述应用程序对应的词向量;

将所述词向量输入到预先训练的作弊识别模型进行匹配,以识别所述应用程序是否为作弊应用程序,所述作弊识别模型为利用预设机器学习算法对所述样本应用程序对应的样本词向量和作弊标注进行训练得到的;

若为作弊应用程序,则利用预设反作弊规则对所述应用程序进行反作弊处理。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

可以理解的是,上述方法及装置中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的应用程序的反作弊装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1