信息推送方法和装置的制造方法

文档序号：10725041阅读：473来源：国知局

信息推送方法和装置的制造方法
【专利摘要】本申请公开了信息推送方法和装置。所述方法的一【具体实施方式】包括：对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果得到第一分类信息；基于预先训练的第一用户分类模型和第二用户分类模型，以及预定下载通道下载的目标应用的在线信息和用户使用信息得到第二分类信息和第三分类信息；根据第一分类信息、第二分类信息和第三分类信息确定通过预定下载通道下载目标应用的用户中的作弊用户；基于通过预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及预定下载通道在预定时长内的下载量，生成并推送预定下载通道的状态信息。该实施方式实现了对下载通道状态的有效监控。
【专利说明】
信息推送方法和装置
技术领域
[0001] 本申请涉及计算机技术领域，具体涉及互联网技术领域，尤其涉及信息推送方法和装置。
【背景技术】
[0002] 随着通信技术的快速发展，大量应用在短时间内涌现，这些应用的开发商为了使更多用户下载使用其开发的应用，会在预定网站（例如官方网站)对其开发的应用进行推广。除此之外，应用开发商还可以以付费推广方式委托各种第三方合作渠道进行应用推广，用户可以通过第三方合作渠道提供的下载通道下载应用，然而，在通过第三方合作渠道进行应用推广的时候，第三方合作渠道可能采取不正当手段(例如使用刷量用户冒充真实下载用户，从而骗取推广费），这样会给应用开发商造成损失，因此，需要监控第三方合作渠道提供的下载通道的状态，以便及时判断该第三方合作渠道是否采用了不正当手段。

【发明内容】

[0003] 本申请的目的在于提出一种改进的信息推送方法和装置，来解决以上【背景技术】部分提到的技术问题。
[0004] 第一方面，本申请提供了一种信息推送方法，所述方法包括:对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类，得到第一分类信息;基于预先训练的第一用户分类模型和第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息和用户使用信息将通过所述预定下载通道下载所述目标应用的各个用户进行用户分类，得到第二分类信息和第三分类信息;根据所述第一分类信息、第二分类信息和第三分类信息确定通过所述预定下载通道下载所述目标应用的用户中的作弊用户;基于通过所述预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及所述预定下载通道在预定时长内的下载量，生成所述预定下载通道的状态信息，并将所述状态信息进行推送。
[0005] 在一些实施例中，所述方法还包括:根据所述预定下载通道的状态信息生成针对所述预定下载通道的优先级设置信息，并将所述优先级设置信息进行推送。
[0006] 在一些实施例中，所述方法还包括:根据基于统计分析得出的第一分类信息、基于第一用户分类模型得出的第二分类信息和基于第二用户分类模型得出的第三分类信息、以及确定的作弊用户分析基于统计分析、基于第一用户分类模型和基于第二用户分类模型的用户分类效果。
[0007] 在一些实施例中，所述在线信息包括在线时间，所述用户使用信息包括用户使用时间；以及所述对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类，得到第一分类信息，包括:计算通过预定网站下载的目标应用每天的用户使用时间与在线时间的比例值，其中，比例值在统计上符合高斯分布;计算比例值的均值和方差;将比例值的均值和方差带入高斯分布的概率密度函数，并根据针对异常用户和正常用户设定的相应的置信水平分别计算异常用户和正常用户的置信区间，得到异常用户和正常用户对应的比例值范围；根据计算的所述比例值范围将通过预定下载通道下载所述目标应用的用户分类为黑用户、白用户或灰用户，从而得到第一分类信息。
[0008] 在一些实施例中，所述基于预先训练的第一用户分类模型和第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息和用户使用信息将通过所述预定下载通道下载所述目标应用的各个用户进行用户分类，得到第二分类信息和第三分类信息，包括:基于预先训练的第一用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第二分类信息;基于预先训练的第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的用户使用信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第三分类信息。
[0009] 在一些实施例中，所述根据所述第一分类信息、第二分类信息和第三分类信息确定通过所述预定下载通道下载所述目标应用的用户中的作弊用户，包括:将所述第一分类信息、第二分类信息和第三分类信息进行统计分析;如果用户被第一分类信息、第二分类信息和第三分类信息中的两种或两种以上分类为黑用户，则确定该用户为作弊用户。
[0010] 在一些实施例中，所述基于通过所述预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及所述预定下载通道在预定时长内的下载量，生成所述预定下载通道的状态信息，包括:计算通过所述预定下载通道下载所述目标应用的用户中作弊用户所占的比例；如果计算得到的比例超过预先设定的作弊用户比例阈值，则判断所述预定下载通道为作弊下载通道，其中，作弊用户比例阈值是根据下载通道在预定时长内的下载量进行设定的。
[0011] 在一些实施例中，所述第一用户分类模型通过以下方式训练获得:将通过预定网站下载的所述目标应用的在线信息集合作为正样本在线信息集合;将第一分类信息中的至少一个黑用户的在线信息作为负样本在线信息集合;利用机器学习方法，基于所述正样本在线信息集合、负样本在线信息集合，训练得到第一用户分类模型。
[0012] 在一些实施例中，所述第二用户分类模型通过以下方式训练获得:将通过预定网站下载的所述目标应用的用户使用信息集合作为正样本用户使用信息集合;将第一分类信息中的至少一个黑用户的用户使用信息作为负样本用户使用信息集合;利用机器学习方法，基于所述正样本用户使用信息集合、负样本用户使用信息集合，训练得到第二用户分类模型。
[0013] 在一些实施例中，所述机器学习方法为逻辑回归算法。
[0014] 第二方面，本申请提供了一种信息推送装置，所述装置包括:统计与分类单元，用于对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类，得到第一分类信息;分类单元，用于基于预先训练的第一用户分类模型和第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息和用户使用信息将通过所述预定下载通道下载所述目标应用的各个用户进行用户分类，得到第二分类信息和第三分类信息；确定单元，用于根据所述第一分类信息、第二分类信息和第三分类信息确定通过所述预定下载通道下载所述目标应用的用户中的作弊用户；推送单元，用于基于通过所述预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及所述预定下载通道在预定时长内的下载量，生成所述预定下载通道的状态信息，并将所述状态信息进行推送。
[0015] 在一些实施例中，所述装置还包括:生成单元，用于根据所述预定下载通道的状态信息生成针对所述预定下载通道的优先级设置信息，并将所述优先级设置信息进行推送。
[0016] 在一些实施例中，所述装置还包括:分析单元，用于根据基于统计分析得出的第一分类信息、基于第一用户分类模型得出的第二分类信息和基于第二用户分类模型得出的第三分类信息、以及确定的作弊用户分析基于统计分析、基于第一用户分类模型和基于第二用户分类模型的用户分类效果。
[0017] 在一些实施例中，所述在线信息包括在线时间，所述用户使用信息包括用户使用时间；以及所述统计与分类单元进一步用于:计算通过预定网站下载的目标应用每天的用户使用时间与在线时间的比例值，其中，比例值在统计上符合高斯分布;计算比例值的均值和方差;将比例值的均值和方差带入高斯分布的概率密度函数，并根据针对异常用户和正常用户设定的相应的置信水平分别计算异常用户和正常用户的置信区间，得到异常用户和正常用户对应的比例值范围；根据计算的所述比例值范围将通过预定下载通道下载所述目标应用的用户分类为黑用户、白用户或灰用户，从而得到第一分类信息。
[0018] 在一些实施例中，所述分类单元进一步用于:基于预先训练的第一用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第二分类信息；基于预先训练的第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的用户使用信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第三分类信息。
[0019] 在一些实施例中，所述确定单元进一步用于:将所述第一分类信息、第二分类信息和第三分类信息进行统计分析;如果用户被第一分类信息、第二分类信息和第三分类信息中的两种或两种以上分类为黑用户，则确定该用户为作弊用户。
[0020] 在一些实施例中，所述推送单元进一步用于:计算通过所述预定下载通道下载所述目标应用的用户中作弊用户所占的比例;如果计算得到的比例超过预先设定的作弊用户比例阈值，则判断所述预定下载通道为作弊下载通道，其中，作弊用户比例阈值是根据下载通道在预定时长内的下载量进行设定的。
[0021] 在一些实施例中，所述第一用户分类模型通过以下方式训练获得:将通过预定网站下载的所述目标应用的在线信息集合作为正样本在线信息集合;将第一分类信息中的至少一个黑用户的在线信息作为负样本在线信息集合;利用机器学习方法，基于所述正样本在线信息集合、负样本在线信息集合，训练得到第一用户分类模型。
[0022] 在一些实施例中，所述第二用户分类模型通过以下方式训练获得:将通过预定网站下载的所述目标应用的用户使用信息集合作为正样本用户使用信息集合;将第一分类信息中的至少一个黑用户的用户使用信息作为负样本用户使用信息集合;利用机器学习方法，基于所述正样本用户使用信息集合、负样本用户使用信息集合，训练得到第二用户分类模型。
[0023] 在一些实施例中，所述机器学习方法为逻辑回归算法。
[0024] 本申请提供的信息推送方法和装置，将通过预定下载通道下载目标应用的用户进行多种方式的分类，并综合多种方式的分类结果确定出作弊用户，之后，根据作弊用户所占的比例以及该预定下载通道在预定时长内的下载量，生成该预定下载通道的状态信息，并将该状态信息进行推送，从而实现了对下载通道状态的有效监控。
【附图说明】
[0025] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本申请的其它特征、目的和优点将会变得更明显：
[0026] 图1是本申请可以应用于其中的示例性系统架构图；
[0027] 图2是根据本申请的信息推送方法的一个实施例的流程图；
[0028] 图3是根据本申请的训练第一用户分类模型的方法的一个实施例的流程图；
[0029] 图4是根据本申请的信息推送装置的一个实施例的结构示意图；
[0030] 图5是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
【具体实施方式】
[0031] 下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释相关发明，而非对该发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与有关发明相关的部分。
[0032]需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0033]图1示出了可以应用本申请的信息推送方法或信息推送装置的实施例的示例性系统架构100。
[0034] 如图1所示，系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型，例如有线、无线通信链路或者光纤电缆等等。
[0035]用户可以使用终端设备101、102、103通过网络104与服务器105交互，以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用，例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等，这些通讯客户端应用可以是通过各种下载通道下载到终端设备101、102、103上的，例如可以是通过应用的官方网站下载的，也可以是其他应用下载平台下载的。
[0036] 终端设备101、102、103可以是具有显示屏并且能够与服务器通信的各种电子设备，包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器（Moving Picture Experts Group Audio Layer III，动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV，动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
[0037] 服务器105可以是提供各种服务的服务器，例如对终端设备101、102、103上所安装应用的在线信息和用户使用信息进行分析的后台服务器。后台服务器可以通过分析确定通过预定下载通道下载目标应用的用户中的作弊用户，并生成预定下载通道的状态信息。
[0038] 需要说明的是，本申请实施例所提供的信息推送方法一般由服务器105执行，相应地，信息推送装置一般设置于服务器105中。
[0039] 应该理解，图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要，可以具有任意数目的终端设备、网络和服务器。
[0040] 继续参考图2,示出了根据本申请的信息推送方法的一个实施例的流程200。所述的信息推送方法，包括以下步骤：
[0041] 步骤201，对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载目标应用的各个用户进行用户分类，得到第一分类信息。
[0042] 在本实施例中，信息推送方法运行于其上的电子设备(例如图1所示的服务器105) 可以通过有线连接方式或者无线连接方式获取通过预定网站下载的目标应用的在线信息和用户使用信息，其中，上述目标应用可以是指需要进行推广的应用，上述预定网站可以是指目标应用的官方网站，通过目标应用的官方网站下载目标应用的用户源自于用户的主动访问下载，因此不存在刷量用户。目标应用的在线信息可以是指目标应用每隔设定时长(例如5分钟）向服务器发送一次其在线的通知数据，这些数据形成了目标应用的在线信息。目标应用的用户使用信息可以是指用户触发目标应用（例如呼出目标应用主界面或应用托盘图标等行为)时产生的数据，用户使用信息可以包括用户触发行为发生的时间信息。上述电子设备可以对获取的通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载目标应用的各个用户进行用户分类，得到第一分类信息。其中，上述预定下载通道可以是指第三方合作渠道为目标应用提供的下载通道。
[0043] 在本实施例的一些可选的实现方式中，上述在线信息包括在线时间，上述用户使用信息包括用户使用时间；以及步骤201可以包括：
[0044] 首先，上述电子设备可以计算通过上述预定网站下载的上述目标应用每天的用户使用时间与在线时间的比例值，统计多天的比例值，其中，比例值在统计上符合高斯分布；
[0045] 之后，可以根据对通过上述预定网站下载的上述目标应用每天的用户使用时间与在线时间的比例值的统计分析，计算均值μ和方差σ;
[0046] 然后，将统计得到的比例值的均值μ和方差σ带入高斯分布的概率密度函数公式 (1)：
[0048]其中，X为比例值可能的取值，对应f (X)值为X在实际情况下取此值时的概率，并根据针对异常用户和正常用户设定的相应的置信水平分别计算异常用户和正常用户的置信区间，得到异常用户和正常用户对应的比例值范围；例如，异常用户使用到95%的置信区间值，表示此范围有95%的可能性代表正常用户的参数区间，实际使用中，不落在此区间内的用户就视为异常用户，计算公式（1)中95%置信区间，查表得出其对应的ζ(α/2)值为1.96，其中，ζ(α/2)表示正态分布的水平α的分位数，α表示显著水平，则X落在区间：
[0050]则标识为异常用户；又例如，正常用户使用到75%的置信区间值，表示此范围有 75%的可能性代表正常用户的参数区间，实际使用中，落在此区间内的用户才视为正常用户，计算公式（1)中75 %置信区间，查表得出其对应的ζ (α/2)值为0.68，则X落在区间：
[0052]则标识为正常用户；
[0053]最后，根据计算的比例值范围将通过预定下载通道下载目标应用的用户分类为黑用户、白用户或灰用户，从而得到第一分类信息，例如，可以将位于异常用户对应的比例值范围内的用户分类为黑用户，可以将位于正常用户对应的对比值范围内的用户分类为白用户，将既不位于异常用户对应的比例值范围也不位于正常用户对应的对比值范围内的用户分类为灰用户。
[0054]步骤202,基于预先训练的第一用户分类模型和第二用户分类模型，根据通过预定下载通道下载的目标应用的在线信息和用户使用信息将通过预定下载通道下载目标应用的各个用户进行用户分类，得到第二分类信息和第三分类信息。
[0055]在本实施例中，上述电子设备可以使用预先训练的、用于将通过上述预定下载通道下载上述目标应用的各个用户进行用户分类的第一用户分类模型和第二用户分类模型，并根据通过上述预定下载通道下载的目标应用的在线信息和用户使用信息将通过预定下载通道下载目标应用的各个用户进行用户分类，从而得到第二分类信息和第三分类信息。 [0056]在本实施例的一些可选的实现方式中，步骤202可以包括：
[0057] 首先，基于预先训练的第一用户分类模型，根据通过预定下载通道下载的目标应用的在线信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第二分类信息，例如，上述电子设备可以首先根据通过预定下载通道下载的目标应用的在线信息每天产生的五分钟区段在线信息得到每天每个用户的在线信息特征向量(例如，可以通过数值〇或1表示目标应用在每个5分钟时段的在线信息，每天有288个5分钟，0表示不在线，1表示在线，则可以得到每天每个用户的一个由0和1组成的 288维的在线信息特征向量），之后，上述电子设备将得到的用户在线信息特征向量导入第一用户分类模型，从而得到该用户为正常用户的概率值，当该概率值大于预先设定的第一阈值则确定用户为白用户，小于预先设定的第二阈值则确定为黑用户，在第一阈值与第二阈值之间则确定为灰用户；
[0058] 然后，基于预先训练的第二用户分类模型，根据通过预定下载通道下载的目标应用的用户使用信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第三分类信息，其中，第二用户分类模型的具体工作过程可以参考第一用户分类模型的具体工作过程，其不同点在于，第二用户分类模型中使用的是通过预定下载通道下载的目标应用的用户使用信息。
[0059] 在一些可选的实现方式中，作为一个实现示例，图3给出了通过训练获得上述第一用户分类模型的一个实现方式的流程300,包括以下步骤：
[0060] 步骤301，将通过预定网站下载的目标应用的在线信息集合作为正样本在线信息集合。
[0061] 在本实现方式中，上述电子设备或者其他用于训练上述第一用户分类模型的电子设备可以获取通过上述预定网站下载的各个目标应用每天的在线信息，该在线信息可以是一个由0和1组成的288维的在线信息特征向量。例如，通过上述预定网站下载的目标应用每隔5分钟向服务器发送一次其在线的通知数据，每天有288个5分钟，0表不不在线，1表不在线，从而形成288维的在线信息特征向量。上述电子设备可以将获取的通过上述预定网站下载的各个目标应用每天的在线信息集合作为正样本在线信息集合。
[0062] 步骤302,将第一分类信息中的至少一个黑用户的在线信息作为负样本在线信息集合。
[0063] 在本实现方式中，用于训练述第一用户分类模型的电子设备可以将步骤201中分类得到的至少一个黑用户的在线信息作为负样本在线信息集合。其中，上述至少一个黑用户的在线信息也可以是由〇和1组成的288维的在线信息特征向量。
[0064]步骤303，利用机器学习方法，基于正样本在线信息集合、负样本在线信息集合，训练得到第一用户分类模型。
[0065] 在本实现方式中，用于训练述第一用户分类模型的电子设备可以利用机器学习方法，基于正样本在线信息集合、负样本在线信息集合，训练得到第一用户分类模型。上述机器学习方法可以是各种机器学习算法，包括但不限于神经网络、支持向量机、遗传算法等等。
[0066] 在一些可选的实现方式中，上述第二用户分类模型可以通过以下方式训练获得：用于训练上述第二用户分类模型的电子设备可以首先将通过上述预定网站下载的目标应用的用户使用信息集合作为正样本用户使用信息集合，其中，用户使用信息集合中的各个用户使用信息可以是一个由〇和1组成的288维的用户使用信息特征向量(例如，可以通过数值0或1表示目标应用在每个5分钟时段的用户使用信息，每天有288个5分钟，0表示用户不使用，1表示用户使用，则可以得到每天每个用户的一个由0和1组成的288维的用户使用信息特征向量）；之后，将第一分类信息中的至少一个黑用户的用户使用信息作为负样本用户使用信息集合，其中，上述至少一个黑用户的用户使用信息也可以是由〇和1组成的288维的用户使用信息特征向量;最后，利用机器学习方法，基于所述正样本用户使用信息集合、负样本用户使用信息集合，训练得到第二用户分类模型。
[0067]可选的，上述机器学习方法可以为逻辑回归算法。作为一个示例，使用逻辑回归算法训练得到第一用户分类模型的具体过程可以包括:根据逻辑回归算法得到公式
[0068] Hi :y = ao+aixi+a2X2+-,,+a288X288 (2)
[0069] H2 :h(x) = 1/( 1+e-y) (3)
[0070]其中，（X1，X2，X3，X4，···，X288)为在线信息特征向量，&0，&1，&2，&3，'"&288为向量系数，公式(3)H2中h(x)表示用户为正常用户的概率。设定正样本在线信息集合中的正样本在线信息的h(x) = l，负样本在线信息集合中的负样本在线信息的h(x)=0,计算符合要求的向量系数，从而训练得到第一用户分类模型。
[0071]步骤203,根据第一分类信息、第二分类信息和第三分类信息确定通过预定下载通道下载目标应用的用户中的作弊用户。
[0072]在本实施例中，上述电子设备可以根据步骤201得到的第一分类信息以及步骤202 得到的第二分类信息和第三分类信息，确定通过上述预定下载通道下载上述目标应用的用户中的作弊用户，其中，作弊用户可以是指用于冒充真实下载用户的刷量用户，现阶段，可以使用应用的启动、使用、卸载等数据判断一个用户是否为刷量用户，例如用户下载应用之后立即卸载或者下载应用后从未使用，则可以判断该用户为刷量用户。
[0073]在本实施例的一些可选的实现方式中，步骤203可以包括:上述电子设备可以将第一分类信息、第二分类信息和第三分类信息进行统计分析;如果通过预定下载通道下载目标应用的用户被第一分类信息、第二分类信息和第三分类信息中的两种或两种以上分类为黑用户，则确定该用户为作弊用户；如果通过预定下载通道下载目标应用的用户被第一分类信息、第二分类信息和第三分类信息中的两种或两种以上分类为白用户，则确定该用户为正常用户。
[0074]步骤204,基于通过预定下载通道下载目标应用的用户中的作弊用户所占的比例、以及预定下载通道在预定时长内的下载量，生成预定下载通道的状态信息，并将状态信息进行推送。
[0075] 在本实施例中，上述电子设备可以根据步骤203中确定的、通过预定下载通道下载目标应用的所有用户中的作弊用户计算作弊用户所占的比例，并根据计算得到的比例以及上述预定下载通道在预定时长内的下载量，生成预定下载通道的状态信息，并将状态信息进行推送。
[0076]在本实施例的一些可选的实现方式中，步骤204可以包括:上述电子设备可以首先计算通过上述预定下载通道下载上述目标应用的用户中作弊用户所占的比例;如果计算得到的比例超过预先设定的作弊用户比例阈值，则判断上述预定下载通道为作弊下载通道，其中，作弊用户比例阈值是根据下载通道在预定时长内的下载量进行设定的。例如，如果某个下载通道每天的应用下载量大于5或小于100,则可以规定当该下载通道的作弊用户所占的比例超过60%时，该下载通道为作弊下载通道，处于作弊状态；当该下载通道的作弊用户所占的比例小于20 %时，该下载通道为正常下载通道，处于正常状态。又例如，如果某个下载通道每天的应用下载量大于100,则可以规定当该下载通道的作弊用户所占的比例超过 50%时，该下载通道为作弊下载通道，处于作弊状态；当该下载通道的作弊用户所占的比例小于10%时，该下载通道为正常下载通道，处于正常状态。
[0077] 在本实施例的一些可选的实现方式中，上述方法还包括:上述电子设备可以根据预定下载通道的状态信息生成针对上述预定下载通道的优先级设置信息，并将上述优先级设置信息进行推送。例如，上述电子设备在判断上述预定下载通道为作弊下载通道，处于作弊状态时，可以生成相应的优先级设置信息，以提示应用开放商降低使用该下载通道进行应用推广的优先级，或者放弃继续使用该下载通道进行应用推广。
[0078] 在本实施例的一些可选的实现方式中，上述方法还可以包括:上述电子设备可以根据基于统计分析得出的第一分类信息、基于第一用户分类模型得出的第二分类信息和基于第二用户分类模型得出的第三分类信息、以及确定的作弊用户分析基于统计分析、基于第一用户分类模型和基于第二用户分类模型的用户分类效果。例如，可以通过步骤203确定的作弊用户分与基于第一用户分类模型分类得到的黑用户之间的对比，判断第一用户分类模型的用户分类效果，两者相似度越高，表明第一用户分类模型的用户分类效果越好，反之，表明第一用户分类模型的用户分类效果越差。
[0079] 本申请的上述实施例提供的方法将通过预定下载通道下载目标应用的用户进行多种方式的分类，并综合多种方式的分类结果确定出作弊用户，从用户级别判断该预定下载通道的是否为作弊下载通道，从而实现了对下载通道状态的有效监控。
[0080] 进一步参考图4,作为对上述各图所示方法的实现，本申请提供了一种信息推送装置的一个实施例，该装置实施例与图2所示的方法实施例相对应，该装置具体可以应用于各种电子设备中。
[0081] 如图4所示，本实施例所述的信息推送装置400包括：统计与分类单元401、分类单元402、确定单元403和推送单元404。其中，统计与分类单元401用于对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载上述目标应用的各个用户进行用户分类，得到第一分类信息;分类单元402用于基于预先训练的第一用户分类模型和第二用户分类模型，根据通过上述预定下载通道下载的上述目标应用的在线信息和用户使用信息将通过上述预定下载通道下载上述目标应用的各个用户进行用户分类，得到第二分类信息和第三分类信息;确定单元403用于根据上述第一分类信息、第二分类信息和第三分类信息确定通过上述预定下载通道下载上述目标应用的用户中的作弊用户；推送单元404用于基于通过上述预定下载通道下载上述目标应用的用户中的作弊用户所占的比例、以及上述预定下载通道在预定时长内的下载量，生成上述预定下载通道的状态信息，并将上述状态信息进行推送。
[0082] 在本实施例中，统计与分类单元401、分类单元402、确定单元403和推送单元404的具体处理可以参考图2对应实施例步骤201、步骤202、步骤203和步骤204的详细描述，在此不再赘述。
[0083] 在本实施例的一些可选的实现方式中，上述装置还包括:生成单元(未示出），用于根据上述预定下载通道的状态信息生成针对上述预定下载通道的优先级设置信息，并将上述优先级设置信息进行推送。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述，在此不再赘述。
[0084] 在本实施例的一些可选的实现方式中，上述装置还包括:分析单元(未示出），用于根据基于统计分析得出的第一分类信息、基于第一用户分类模型得出的第二分类信息和基于第二用户分类模型得出的第三分类信息、以及确定的作弊用户分析基于统计分析、基于第一用户分类模型和基于第二用户分类模型的用户分类效果。该实现方式可参考上述图2 对应实施例中相应实现方式的详细描述，在此不再赘述。
[0085] 在本实施例的一些可选的实现方式中，上述在线信息包括在线时间，上述用户使用信息包括用户使用时间；以及上述统计与分类单元401进一步用于:计算通过预定网站下载的目标应用每天的用户使用时间与在线时间的比例值，其中，比例值在统计上符合高斯分布;计算比例值的均值和方差;将比例值的均值和方差带入高斯分布的概率密度函数，并根据针对异常用户和正常用户设定的相应的置信水平分别计算异常用户和正常用户的置信区间，得到异常用户和正常用户对应的比例值范围；根据计算的上述比例值范围将通过预定下载通道下载上述目标应用的用户分类为黑用户、白用户或灰用户，从而得到第一分类信息。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述，在此不再赘述。
[0086] 在本实施例的一些可选的实现方式中，上述分类单元402进一步用于:基于预先训练的第一用户分类模型，根据通过上述预定下载通道下载的上述目标应用的在线信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第二分类信息；基于预先训练的第二用户分类模型，根据通过上述预定下载通道下载的上述目标应用的用户使用信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第三分类信息。该实现方式可参考上述图2 对应实施例中相应实现方式的详细描述，在此不再赘述。
[0087] 在本实施例的一些可选的实现方式中，上述确定单元403进一步用于:将上述第一分类信息、第二分类信息和第三分类信息进行统计分析;如果用户被第一分类信息、第二分类信息和第三分类信息中的两种或两种以上分类为黑用户，则确定该用户为作弊用户。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述，在此不再赘述。
[0088] 在本实施例的一些可选的实现方式中，上述推送单元404进一步用于:计算通过上述预定下载通道下载上述目标应用的用户中作弊用户所占的比例;如果计算得到的比例超过预先设定的作弊用户比例阈值，则判断上述预定下载通道为作弊下载通道，其中，作弊用户比例阈值是根据下载通道在预定时长内的下载量进行设定的。该实现方式可参考上述图 2对应实施例中相应实现方式的详细描述，在此不再赘述。
[0089] 在本实施例的一些可选的实现方式中，上述第一用户分类模型通过以下方式训练获得:将通过预定网站下载的上述目标应用的在线信息集合作为正样本在线信息集合;将第一分类信息中的至少一个黑用户的在线信息作为负样本在线信息集合;利用机器学习方法，基于上述正样本在线信息集合、负样本在线信息集合，训练得到第一用户分类模型。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述，在此不再赘述。
[0090] 在本实施例的一些可选的实现方式中，上述第二用户分类模型通过以下方式训练获得:将通过预定网站下载的上述目标应用的用户使用信息集合作为正样本用户使用信息集合;将第一分类信息中的至少一个黑用户的用户使用信息作为负样本用户使用信息集合;利用机器学习方法，基于上述正样本用户使用信息集合、负样本用户使用信息集合，训练得到第二用户分类模型。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述，在此不再赘述。
[0091] 在本实施例的一些可选的实现方式中，上述机器学习方法为逻辑回归算法。该实现方式可参考上述图2对应实施例中相应实现方式的详细描述，在此不再赘述。
[0092] 下面参考图5,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。
[0093]如图5所示，计算机系统500包括中央处理单元(CPU)501，其可以根据存储在只读存储器(R0M)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中，还存储有系统500操作所需的各种程序和数据。 CPU 501、R0M 502以及RAM 503通过总线504彼此相连。输入/输出（I/O)接口505也连接至总线 504。
[0094]以下部件连接至I/O接口 505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508; 以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口 505。可拆卸介质511，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器510上，以便于从其上读出的计算机程序根据需要被安装入存储部分508。
[0095] 特别地，根据本公开的实施例，上文参考流程图描述的过程可以被实现为计算机软件程序。例如，本公开的实施例包括一种计算机程序产品，其包括有形地包含在机器可读介质上的计算机程序，所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分509从网络上被下载和安装，和/或从可拆卸介质511被安装。在该计算机程序被中央处理单元(CPU) 501执行时，执行本申请的方法中限定的上述功能。
[0096] 附图中的流程图和框图，图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。
[0097] 描述于本申请实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括统计与分类单元、分类单元、确定单元和推送单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，统计与分类单元还可以被描述为"对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类，得到第一分类信息的单元"。
[0098] 作为另一方面，本申请还提供了一种非易失性计算机存储介质，该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在，未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序，当所述一个或者多个程序被一个设备执行时，使得所述设备:对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类，得到第一分类信息;基于预先训练的第一用户分类模型和第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息和用户使用信息将通过所述预定下载通道下载所述目标应用的各个用户进行用户分类，得到第二分类信息和第三分类信息;根据所述第一分类信息、第二分类信息和第三分类信息确定通过所述预定下载通道下载所述目标应用的用户中的作弊用户;基于通过所述预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及所述预定下载通道在预定时长内的下载量，生成所述预定下载通道的状态信息，并将所述状态信息进行推送。
[0099] 以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的发明范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离所述发明构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
【主权项】
1. 一种信息推送方法，其特征在于，所述方法包括：对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类，得到第一分类信息；基于预先训练的第一用户分类模型和第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息和用户使用信息将通过所述预定下载通道下载所述目标应用的各个用户进行用户分类，得到第二分类信息和第三分类信息；根据所述第一分类信息、第二分类信息和第三分类信息确定通过所述预定下载通道下载所述目标应用的用户中的作弊用户；基于通过所述预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及所述预定下载通道在预定时长内的下载量，生成所述预定下载通道的状态信息，并将所述状态信息进行推送。2. 根据权利要求1所述的方法，其特征在于，所述方法还包括：根据所述预定下载通道的状态信息生成针对所述预定下载通道的优先级设置信息，并将所述优先级设置信息进行推送。3. 根据权利要求1所述的方法，其特征在于，所述方法还包括：根据基于统计分析得出的第一分类信息、基于第一用户分类模型得出的第二分类信息和基于第二用户分类模型得出的第三分类信息、以及确定的作弊用户分析基于统计分析、基于第一用户分类模型和基于第二用户分类模型的用户分类效果。4. 根据权利要求1所述的方法，其特征在于，所述在线信息包括在线时间，所述用户使用信息包括用户使用时间；以及所述对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类，得到第一分类信息，包括：计算通过预定网站下载的目标应用每天的用户使用时间与在线时间的比例值，其中，比例值在统计上符合高斯分布；计算比例值的均值和方差；将比例值的均值和方差带入高斯分布的概率密度函数，并根据针对异常用户和正常用户设定的相应的置信水平分别计算异常用户和正常用户的置信区间，得到异常用户和正常用户对应的比例值范围；根据计算的所述比例值范围将通过预定下载通道下载所述目标应用的用户分类为黑用户、白用户或灰用户，从而得到第一分类信息。5. 根据权利要求4所述的方法，其特征在于，所述基于预先训练的第一用户分类模型和第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息和用户使用信息将通过所述预定下载通道下载所述目标应用的各个用户进行用户分类，得到第二分类信息和第三分类信息，包括：基于预先训练的第一用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第二分类信息；基于预先训练的第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的用户使用信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第三分类信息。6. 根据权利要求5所述的方法，其特征在于，所述根据所述第一分类信息、第二分类信息和第三分类信息确定通过所述预定下载通道下载所述目标应用的用户中的作弊用户，包括：将所述第一分类信息、第二分类信息和第三分类信息进行统计分析；如果用户被第一分类信息、第二分类信息和第三分类信息中的两种或两种以上分类为黑用户，则确定该用户为作弊用户。7. 根据权利要求6所述的方法，其特征在于，所述基于通过所述预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及所述预定下载通道在预定时长内的下载量，生成所述预定下载通道的状态信息，包括：计算通过所述预定下载通道下载所述目标应用的用户中作弊用户所占的比例；如果计算得到的比例超过预先设定的作弊用户比例阈值，则判断所述预定下载通道为作弊下载通道，其中，作弊用户比例阈值是根据下载通道在预定时长内的下载量进行设定的。8. 根据权利要求5所述的方法，其特征在于，所述第一用户分类模型通过以下方式训练获得：将通过预定网站下载的所述目标应用的在线信息集合作为正样本在线信息集合；将第一分类信息中的至少一个黑用户的在线信息作为负样本在线信息集合；利用机器学习方法，基于所述正样本在线信息集合、负样本在线信息集合，训练得到第一用户分类模型。9. 根据权利要求5所述的方法，其特征在于，所述第二用户分类模型通过以下方式训练获得：将通过预定网站下载的所述目标应用的用户使用信息集合作为正样本用户使用信息集合；将第一分类信息中的至少一个黑用户的用户使用信息作为负样本用户使用信息集合；利用机器学习方法，基于所述正样本用户使用信息集合、负样本用户使用信息集合，训练得到第二用户分类模型。10. 根据权利要求8或9所述的方法，其特征在于，所述机器学习方法为逻辑回归算法。11. 一种信息推送装置，其特征在于，所述装置包括：统计与分类单元，用于对通过预定网站下载的目标应用的在线信息和用户使用信息进行统计分析，并基于统计分析的结果将通过预定下载通道下载所述目标应用的各个用户进行用户分类，得到第一分类信息；分类单元，用于基于预先训练的第一用户分类模型和第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息和用户使用信息将通过所述预定下载通道下载所述目标应用的各个用户进行用户分类，得到第二分类信息和第三分类信息；确定单元，用于根据所述第一分类信息、第二分类信息和第三分类信息确定通过所述预定下载通道下载所述目标应用的用户中的作弊用户；推送单元，用于基于通过所述预定下载通道下载所述目标应用的用户中的作弊用户所占的比例、以及所述预定下载通道在预定时长内的下载量，生成所述预定下载通道的状态信息，并将所述状态信息进行推送。12. 根据权利要求11所述的装置，其特征在于，所述装置还包括：生成单元，用于根据所述预定下载通道的状态信息生成针对所述预定下载通道的优先级设置信息，并将所述优先级设置信息进行推送。13. 根据权利要求11所述的装置，其特征在于，所述装置还包括：分析单元，用于根据基于统计分析得出的第一分类信息、基于第一用户分类模型得出的第二分类信息和基于第二用户分类模型得出的第三分类信息、以及确定的作弊用户分析基于统计分析、基于第一用户分类模型和基于第二用户分类模型的用户分类效果。14. 根据权利要求11所述的装置，其特征在于，所述在线信息包括在线时间，所述用户使用信息包括用户使用时间；以及所述统计与分类单元进一步用于：计算通过预定网站下载的目标应用每天的用户使用时间与在线时间的比例值，其中，比例值在统计上符合高斯分布；计算比例值的均值和方差；将比例值的均值和方差带入高斯分布的概率密度函数，并根据针对异常用户和正常用户设定的相应的置信水平分别计算异常用户和正常用户的置信区间，得到异常用户和正常用户对应的比例值范围；根据计算的所述比例值范围将通过预定下载通道下载所述目标应用的用户分类为黑用户、白用户或灰用户，从而得到第一分类信息。15. 根据权利要求14所述的装置，其特征在于，所述分类单元进一步用于：基于预先训练的第一用户分类模型，根据通过所述预定下载通道下载的所述目标应用的在线信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第二分类信息；基于预先训练的第二用户分类模型，根据通过所述预定下载通道下载的所述目标应用的用户使用信息识别用户为正常用户的概率值，根据识别出的概率值将用户识别为黑用户、白用户或灰用户，从而得到第三分类信息。16. 根据权利要求15所述的装置，其特征在于，所述确定单元进一步用于：将所述第一分类信息、第二分类信息和第三分类信息进行统计分析；如果用户被第一分类信息、第二分类信息和第三分类信息中的两种或两种以上分类为黑用户，则确定该用户为作弊用户。17. 根据权利要求16所述的装置，其特征在于，所述推送单元进一步用于：计算通过所述预定下载通道下载所述目标应用的用户中作弊用户所占的比例；如果计算得到的比例超过预先设定的作弊用户比例阈值，则判断所述预定下载通道为作弊下载通道，其中，作弊用户比例阈值是根据下载通道在预定时长内的下载量进行设定的。18. 根据权利要求15所述的装置，其特征在于，所述第一用户分类模型通过以下方式训练获得：将通过预定网站下载的所述目标应用的在线信息集合作为正样本在线信息集合；将第一分类信息中的至少一个黑用户的在线信息作为负样本在线信息集合；利用机器学习方法，基于所述正样本在线信息集合、负样本在线信息集合，训练得到第一用户分类模型。19. 根据权利要求15所述的装置，其特征在于，所述第二用户分类模型通过以下方式训练获得：将通过预定网站下载的所述目标应用的用户使用信息集合作为正样本用户使用信息集合；将第一分类信息中的至少一个黑用户的用户使用信息作为负样本用户使用信息集合；利用机器学习方法，基于所述正样本用户使用信息集合、负样本用户使用信息集合，训练得到第二用户分类模型。20. 根据权利要求18或19所述的装置，其特征在于，所述机器学习方法为逻辑回归算法。
【文档编号】G06F17/30GK106095916SQ201610405289
【公开日】2016年11月9日
【申请日】2016年6月8日
【发明人】陶天, 陶天一, 田甜
【申请人】百度在线网络技术（北京）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陶天一;田甜;
技术所有人：百度在线网络技术（北京）有限公司;
我是此专利的发明人

上一篇：一种书签保存、展示方法、装置及浏览器的制造方法
上一篇：用户身份的处理方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。