处理用户的资源访问行为的方法及装置的制造方法

文档序号:10538695阅读:524来源:国知局
处理用户的资源访问行为的方法及装置的制造方法
【专利摘要】本发明实施例提供一种处理用户的资源访问行为的方法及装置。所述方法包括:根据第一组用户的资源访问行为数据和访问行为类型,训练得到用于识别用户的访问行为类型的识别模型;当接收到当前用户的资源访问请求时,获取当前用户的资源访问行为数据,将所述当前用户的资源访问行为数据输入到所述识别模型,得到所述当前用户的访问行为类型;根据所述当前用户的访问行为类型,对所述当前用户的资源访问请求进行处理。盗链者如预模拟正常用户访问系统的行为特征进入白名单或避开进入黑名单,则需要付出较高的代价,从而主动放弃盗链的操作。
【专利说明】
处理用户的资源访问行为的方法及装置
技术领域
[0001] 本发明涉及信息处理技术,尤其涉及一种处理用户的资源访问行为的方法及装 置。
【背景技术】
[0002] 盗链是指使用技术手段非法获取在线内容服务的地址,然后在非法律允许的地方 使用该地址为用户提供内容服务。对于互联网上的流媒体服务,尤其是以在线视频为代表, 面临着严重的被盗链的问题。视频网站公司投入巨资获得影视剧的版权和支持在线流服务 的带宽,但是盗链者花费很低的成本就能够直接盗取视频流服务。在线音乐等服务也面临 类似的局面。
[0003] 如图1所示,盗链的基本原理是,通过例如抓取请求URL的方式获取一个视频的播 放地址,然后模拟一个正常的用户来访问该服务。
[0004] 在线视频流服务容易被盗链的一个原因是视频服务的用户大多数是非登录用户。 对于登录用户,在为用户提供流服务之前可以进行用户合法性验证,仅为通过认证的用户 提供内容服务。
[0005] 图2示出进行用户合法性验证来提供流服务的工作原理。如图2所示,用户首先使 用用户名和密码登录流服务网站。在通过身份认证后,服务器向用户发放访问令牌 (token)。此后,认证用户使用获得的令牌来观看内容服务器提供的视频内容等。这样,可将 每一个用户的访问频率限制在合理的范围,大幅度地提高盗链的成本。然而,这种方式仅适 用于对用户进行合法性验证的情形,而不具有广泛适用性。
[0006] 如何准确地识别使用盗链来访问内容服务是内容提供商一直迄待解决的问题。

【发明内容】

[0007] 本发明的目的在于提供一种区分正常访问资源服务的用户和使用盗链访问资源 服务的用户的技术方案,从而提高盗链访问资源的成本,提高内容提供商的运营效率。
[0008] 根据本发明的一方面,本发明提供一种处理用户的资源访问行为的方法,所述方 法包括:根据第一组用户的资源访问行为数据和访问行为类型,训练得到用于识别用户的 访问行为类型的识别模型;当接收到当前用户的资源访问请求时,获取当前用户的资源访 问行为数据,将所述当前用户的资源访问行为数据输入到所述识别模型,得到所述当前用 户的访问行为类型;根据所述当前用户的访问行为类型,对所述当前用户的资源访问请求 进行处理。
[0009] 优选地,所述根据第一组用户的资源访问行为数据和访问行为类型,训练得到用 于识别用户的访问行为类型的识别模型的处理包括:获取所述第一组用户的资源访问行为 数据和访问行为类型;从所述第一组用户的资源访问行为数据获取所述用户的行为特征数 据;以所述用户的行为特征数据和所述用户的访问行为类型为训练样本数据集,训练用于 识别用户的实际访问行为类型的识别模型。
[0010] 所述资源可为多媒体内容,所述资源访问行为数据可包括访问所述多媒体内容使 用的应用的信息、对所述应用的启动/退出的信息、浏览页面的信息以及内容消费信息,所 述内容消费信息包括观看的多媒体内容的信息、观看的时间长度的信息以及对观看的多媒 体内容的操作行为的信息。
[0011] 所述行为特征数据可包括部分或全部以下特征:用户在单位时长内启动所述应用 的次数、用户在所述单位时长内使用所述应用的时长、用户在所述单位时长内观看多媒体 内容的次数、用户在所述单位时长内观看多媒体内容的总时长、任一 IP地址对应的用户标 识的个数、用户对观看的多媒体内容的操作行为的频次、用户观看任一多媒体内容的时长。
[0012] 优选地,所述方法还包括:根据第二组用户的资源访问行为数据和访问行为类型, 更新所述识别模型。
[0013] 优选地,所述方法还包括:根据预先统计的用户的长期访问行为特征数据,对得到 识别为正常的用户的访问行为类型进行校正。
[0014] 所述识别模型可通过以下任一机器学习方法训练获得:支持向量机(SVM)、逻辑回 归算法、决策树、卷积神经网络、贝叶斯方法。
[0015] 根据本发明的另一方面,本发明还提供一种处理用户的资源访问行为的方法,所 述方法包括:根据第一组用户的资源访问行为数据和访问行为类型,训练得到用于识别用 户的访问行为类型的识别模型;获取第二组用户的资源访问行为数据,将所述第二组用户 的资源访问行为数据输入到所述识别模型,得到所述第二组用户的访问行为类型;根据所 述第一组用户的访问行为类型和所述第二组用户的访问行为类型,生成白名单;当接收到 当前用户的资源访问请求时,根据所述白名单对所述当前用户的资源访问请求进行处理。
[0016] 根据本发明的另一方面,本发明还提供一种处理用户的资源访问行为的装置,所 述装置包括:识别模型训练单元,用于根据第一组用户的资源访问行为数据和访问行为类 型,训练得到用于识别用户的访问行为类型的识别模型;第一用户访问行为类型识别单元, 用于当接收到当前用户的资源访问请求时,获取当前用户的资源访问行为数据,将所述当 前用户的资源访问行为数据输入到所述识别模型训练单元训练得到的识别模型,得到所述 当前用户的访问行为类型;第一资源访问请求处理单元,用于根据所述当前用户的访问行 为类型,对所述当前用户的资源访问请求进行处理。
[0017] 根据本发明的另一方面,本发明还提供一种处理用户的资源访问行为的装置,所 述装置包括:识别模型训练单元,用于根据第一组用户的资源访问行为数据和访问行为类 型,训练得到用于识别用户的访问行为类型的识别模型;第二用户访问行为类型识别单元, 用于获取第二组用户的资源访问行为数据,将所述第二组用户的资源访问行为数据输入到 所述识别模型,得到所述第二组用户的访问行为类型;白名单生成单元,用于根据所述第一 组用户的访问行为类型和所述第二组用户的访问行为类型,生成白名单;第二资源访问请 求处理单元,用于当接收到当前用户的资源访问请求时,根据所述白名单对所述当前用户 的资源访问请求进行处理。
[0018] 本发明实施例所提供的处理用户的资源访问行为的方法及装置,根据用户的资源 访问行为数据和访问行为类型,训练得到用于识别用户的访问行为类型的识别模型;当接 收到当前用户的资源访问请求时,获取当前用户的资源访问行为数据,将所述当前用户的 资源访问行为数据输入到所述识别模型,得到所述当前用户的访问行为类型;根据所述当 前用户的访问行为类型,对所述当前用户的资源访问请求进行处理。由此,可较准确地识别 出用户的访问行为类型,以区分正常访问资源的用户和通过盗链访问资源的用户,从而便 于阻止通过盗链访问资源的行为。盗链者如预模拟正常用户访问系统的行为特征进入白名 单或避开进入黑名单,则需要付出较高的代价,从而主动放弃盗链的操作。
【附图说明】
[0019] 图1是示出使用盗链访问流服务网站的原理示意图;
[0020] 图2是示出进行用户合法性验证来提供流服务的示意图;
[0021] 图3是示出本发明的总体发明构思的示意图;
[0022] 图4是示出本发明示例性实施例一的处理用户的资源访问行为的方法的流程图; [0023]图5是示出本发明示例性实施例一中步骤S410的示例性处理的流程图;
[0024]图6是示出本发明示例性实施例三的处理用户的资源访问行为的方法的流程图;
[0025] 图7是示出本发明示例性实施例四的处理用户的资源访问行为的装置的结构示意 图;
[0026] 图8是示出本发明示例性实施例五的处理用户的资源访问行为的装置的结构示意 图。
【具体实施方式】
[0027] 本发明的基本构思是,根据正常的用户访问服务系统的行为特征来识别用户的合 法性,将识别为行为正常的用户加到白名单中或者将识别为行为作弊的用户加到黑名单 中,从而通过白名单或黑名单起到类似用户登录的作用,以阻止使用盗链的用户访问服务。 图3是示出本发明的总体发明构思的示意图。
[0028] 参照图3,在用于资源访问的应用的客户端收集用户的资源访问行为数据,并且可 例如定期地将这些资源访问行为数据上传给服务器端。在服务器端,对从多个用户的客户 端收集的资源访问行为数据进行挖掘和分析,识别出行为正常或作弊的用户,并且根据识 别结果将这些用户添加到相应的用户白名单或用户黑名单中。这里,可以用户使用的设备 标识、手机号码、注册用户名、网站访问的cookie等来标识任一用户。
[0029] 另一方面,用户如前所述的方式向资源服务器请求资源内容服务(如视频流媒 体),在其请求中携带用户标识;资源服务器在接收到带有用户标识的资源内容请求后,根 据该用户标识与前述的白名单或黑名单进行校验。如果该用户标识出现在用户白名单中, 则允许用户继续访问资源内容;或者,如果该用户标识出现在用户黑名单中或者没有出现 在用户白名单中,则阻止用户继续访问资源内容。
[0030] 此外,为了根据资源访问行为数据较准确地识别出行为正常或作弊的用户,还可 预先选取包括用户的多条资源访问行为数据的训练样本数据并为选取的训练样本数据标 注用户的访问行为类型(正常或作弊),从训练样本数据的资源访问行为数据分别获取行为 特征数据,并且以获取的行为特征数据及其对应的访问行为类型为训练样本数据集训练用 于识别用户访问行为类型的训练模型。
[0031]通过前述对用户的资源访问行为数据进行挖掘和分析来生成用户白名单或用户 黑名单,并且以生成的用户白名单或用户黑名单来对用户进行合法性验证来控制其对资源 的访问,盗链者如预模拟正常用户访问系统的行为特征进入白名单或避开进入黑名单,则 需要付出较高的代价,从而主动放弃盗链的操作。
[0032]下面结合附图详细描述本发明示例性实施例的资源访问行为模型的训练方法、处 理资源访问行为数据的方法及装置。
[0033] 实施例一
[0034]图4是示出本发明示例性实施例一的处理用户的资源访问行为的方法的流程图。 可通过例如图7所示的装置来执行实施例一的处理用户的资源访问行为的方法。
[0035]参照图4,在步骤S410,根据第一组用户的资源访问行为数据和访问行为类型,训 练得到用于识别用户的访问行为类型的识别模型。稍后将参照实施例二描述步骤S410的示 例性处理。
[0036]所述资源为多媒体内容,所述资源访问行为数据可包括,但不限于,访问所述多媒 体内容使用的应用的信息、对所述应用的启动/退出的信息、浏览页面的信息以及内容消费 信息,所述内容消费信息包括观看的多媒体内容的信息、观看的时间长度的信息以及对观 看的多媒体内容的操作行为的信息。所述用户的访问行为类型可以是,但不限于,正常行为 或作弊行为。
[0037]在步骤S420,当接收到当前用户的资源访问请求时,获取当前用户的资源访问行 为数据,将所述当前用户的资源访问行为数据输入到所述识别模型,得到所述当前用户的 访问行为类型。
[0038]所在步骤S430,根据所述当前用户的访问行为类型,对所述当前用户的资源访问 请求进行处理。
[0039]例如,如果根据步骤S420确定当前用户是正常行为的用户,则可允许当前用户访 问相关的资源;如果确定当前用户是作弊行为的用户,则可阻止当前用户访问相关的资源。
[0040] 通过步骤S410~S430的处理,可根据训练的识别模型较准确地识别出用户的访问 行为类型,以区分正常访问资源的用户和通过盗链访问资源的用户,从而便于阻止通过盗 链访问资源的行为。盗链者如预模拟正常用户访问系统的行为,则需要付出较高的代价,从 而主动放弃盗链的操作。
[0041] 根据训练出的训练模型在个别情况下,可能将作弊行为的用户(使用盗链作弊的 用户)识别为正常用户。为此,优选地,所述方法可还包括:根据预先统计的用户的长期访问 行为特征数据对识别为正常的用户的访问行为类型进行校正。
[0042] 例如,用户的长期访问行为特征数据可以包括用户按周/月的回访频次。假如盗链 者成功模拟了用户安装应用后第一天的行为(成本已经很高了),那么再模拟后续的回访行 为则让成本增加多倍。对于没能正确回访的用户,可以识别为作弊用户。
[0043] 优选地,该方法还包括,根据第二组用户的资源访问行为数据和访问行为类型,更 新所述识别模型。由此,在已建立的识别模型的基础上,根据更多的资源访问行为数据对该 识别模型进行更新。
[0044] 实施例二
[0045]图5是示出本发明示例性实施例一中步骤S410的处理的流程图。
[0046]参照图5,在步骤S510,获取所述第一组用户的资源访问行为数据和访问行为类 型。
[0047] 具体地,用于资源(如多媒体内容)访问的应用(如播放器应用)在运行过程中,可 持续收集用户的资源访问行为数据,并且可实时或定期将这些资源访问行为数据上传到服 务器端。
[0048] 如前所述,所述资源为多媒体内容,所述资源访问行为数据可包括,但不限于,访 问所述多媒体内容使用的应用的信息、对所述应用的启动/退出的信息、浏览页面的信息以 及内容消费信息,所述内容消费信息包括观看的多媒体内容的信息、观看的时间长度的信 息以及对观看的多媒体内容的操作行为的信息等。所述用户的访问行为类型可以是,但不 限于,正常行为或作弊行为。
[0049] 以视频播放器为例,任一用户的资源访问行为可包括如下表所示的内容:
[0050]
[0051]根据本发明的示例性实施例,可选取具有典型访问行为特征的用户,对其进行行 为正常或作弊的标注,并获取这些用户的资源访问行为数据作为初始训练样本数据。
[0052]在步骤S520,从所述第一组用户的资源访问行为数据获取所述用户的行为特征数 据。
[0053] 资源访问行为数据为较原始的类似日志数据。为了便于对用户的资源访问行为进 行学习,先对这些资源访问行为数据进行分析和处理,从其获取用户的行为特征数据作为 模型训练的训练特征。
[0054] 具体地,所述行为特征数据包括,但不限于,部分或全部以下特征:用户在单位时 长内启动所述应用的次数、用户在所述单位时长内使用所述应用的时长、用户在所述单位 时长内观看多媒体内容的次数、用户在所述单位时长内观看多媒体内容的总时长、任一 IP 地址对应的用户标识的个数、用户对观看的多媒体内容的操作行为的频次、用户观看任一 多媒体内容的时长。这些行为特征数据有助于对正常访问的用户和作弊(例如通过盗链)访 问的用户进行区分。
[0055] 下表中列出若干示例性的行为特征数据以及其在识别用户访问行为类型中的意 义:
[0056]
[0057] 例如,如果用户在一天内观看视频的次数异常地高,则很有可能是通过盗链为不 同的用户请求视频内容服务。
[0058]在步骤S530,以所述用户的行为特征数据和所述用户的访问行为类型为训练样本 数据集,训练用于识别用户的实际访问行为类型的识别模型。
[0059] 这里,可通过以下任一机器学习方法训练前述的所述训练模型:支持向量机 (SVM)、逻辑回归算法、决策树、卷积神经网络、贝叶斯方法。
[0060] 通过前述标注有用户的访问行为类型的资源访问行为数据作为初始训练样本数 据,从资源访问行为数据获取具有代表性的行为特征数据,并且以获取的行为特征数据及 其对应的访问行为类型为训练样本数据集训练用于识别用户访问行为类型的训练模型,以 用于较准确地识别用户访问行为类型。
[0061 ] 实施例三
[0062]图6是示出本发明示例性实施例三的处理用户的资源访问行为的方法的流程图。 可通过例如图8所示的装置来执行实施例三的处理用户的资源访问行为的方法。
[0063]参照图6,在步骤S610,根据第一组用户的资源访问行为数据和访问行为类型,训 练得到用于识别用户的访问行为类型的识别模型。
[0064]具体地,可例如通过实施例二的处理,来进行识别模型的训练,在此不再赘述。 [0065]在步骤S620,获取第二组用户的资源访问行为数据,将所述第二组用户的资源访 问行为数据输入到所述识别模型,得到所述第二组用户的访问行为类型。
[0066]在步骤S630,根据所述第一组用户的访问行为类型和所述第二组用户的访问行为 类型,生成白名单。由此,可结合根据第一组用户和第二组用户确定的访问行为类型来生成 被确定为行为正常的用户的白名单。
[0067]在步骤S640,当接收到当前用户的资源访问请求时,根据所述白名单对所述当前 用户的资源访问请求进行处理。
[0068] 通过步骤S610~S640的处理,根据用户的资源访问行为数据和访问行为类型,训 练得到用于识别用户的访问行为类型的识别模型,再根据另一组用户的资源访问行为数据 通过该识别模型识别用户的访问行为类型,结合两组资源访问行为数据得到的用户的访问 行为类型生成白名单,从而根据白名单较准确地识别出当前用户的访问行为类型,以区分 正常访问资源的用户和通过盗链访问资源的用户,从而便于阻止通过盗链访问资源的行 为。盗链者如预模拟正常用户访问系统的行为特征进入白名单或避开进入黑名单,则需要 付出较高的代价,从而主动放弃盗链的操作。
[0069] 如前所述,根据前述训练方法训练出的训练模型在个别情况下,可能将作弊行为 的用户(使用盗链作弊的用户)识别为正常用户并加入用户白名单。为此,优选地,所述方法 可还包括:根据预先统计的用户的长期访问行为特征数据对识别为正常的用户的访问行为 类型进行校正,并且将被识别为作弊行为的用户从白名单里去除掉。
[0070] 优选地,该方法还包括:根据第三组用户的资源访问行为数据和访问行为类型,更 新所述识别模型和所述白名单。由此,在已建立的识别模型的基础上,根据更多的资源访问 行为数据对该识别模型进行更新。
[0071] 实施例四
[0072] 图7是示出本发明示例性实施例四的处理用户的资源访问行为的装置的结构示意 图。
[0073] 参照图7,实施例四的处理用户的资源访问行为的装置包括识别模型训练单元 710、第一用户访问行为类型识别单元720和第一资源访问请求处理单元。
[0074] 识别模型训练单元710用于根据第一组用户的资源访问行为数据和访问行为类 型,训练得到用于识别用户的访问行为类型的识别模型。
[0075] 所述资源为多媒体内容,所述资源访问行为数据包括访问所述多媒体内容使用的 应用的信息、对所述应用的启动/退出的信息、浏览页面的信息以及内容消费信息,所述内 容消费信息包括观看的多媒体内容的信息、观看的时间长度的信息以及对观看的多媒体内 容的操作行为的信息。
[0076] 具体地,识别模型训练单元710用于获取所述第一组用户的资源访问行为数据和 访问行为类型,从所述第一组用户的资源访问行为数据获取所述用户的行为特征数据,以 所述用户的行为特征数据和所述用户的访问行为类型为训练样本数据集,训练用于识别用 户的实际访问行为类型的识别模型。
[0077] 所述行为特征数据可包括,但不限于,部分或全部以下特征:用户在单位时长内启 动所述应用的次数、用户在所述单位时长内使用所述应用的时长、用户在所述单位时长内 观看多媒体内容的次数、用户在所述单位时长内观看多媒体内容的总时长、任一 IP地址对 应的用户标识的个数、用户对观看的多媒体内容的操作行为的频次、用户观看任一多媒体 内容的时长等。
[0078]所述训练模型通过以下任一机器学习方法训练获得:支持向量机(SVM)、逻辑回归 算法、决策树、卷积神经网络、贝叶斯方法。
[0079]第一用户访问行为类型识别单元720用于当接收到当前用户的资源访问请求时, 获取当前用户的资源访问行为数据,将所述当前用户的资源访问行为数据输入到识别模型 训练单元710训练得到的识别模型,得到所述当前用户的访问行为类型。
[0080]第一资源访问请求处理单元730用于根据所述当前用户的访问行为类型,对所述 当前用户的资源访问请求进行处理。
[0081 ] 实施例五
[0082]图8是示出本发明示例性实施例五的处理用户的资源访问行为的装置的结构示意 图。
[0083]参照图8,用于处理用户的资源访问行为数据的装置包括识别模型训练单元710、 第二用户访问行为类型识别单元820、白名单生成单元830和第二资源访问请求处理单元 840 〇
[0084]如前所述,识别模型训练单元710用于根据第一组用户的资源访问行为数据和访 问行为类型,训练得到用于识别用户的访问行为类型的识别模型。
[0085]第二用户访问行为类型识别单元820用于获取第二组用户的资源访问行为数据, 将所述第二组用户的资源访问行为数据输入到所述识别模型,得到所述第二组用户的访问 行为类型。
[0086]白名单生成单元830用于根据所述第一组用户的访问行为类型和所述第二组用户 的访问行为类型,生成白名单。
[0087]第二资源访问请求处理单元840用于当接收到当前用户的资源访问请求时,根据 所述白名单对所述当前用户的资源访问请求进行处理。
[0088] 优选地,该装置还包括:白名单更新单元,用于根据第三组用户的资源访问行为数 据和访问行为类型,更新所述识别模型和所述白名单。
[0089] 优选地,该装置还包括:第二用户访问行为类型校正单元,用于根据预先统计的用 户的长期访问行为特征数据,对得到识别为正常的用户的访问行为类型进行校正,并且将 被识别为作弊行为的用户从白名单里去除掉。
[0090] 需要指出,根据实施的需要,可将本申请中描述的各个步骤拆分为更多步骤,也可 将两个或多个步骤或者步骤的部分操作组合成新的步骤,以实现本发明的目的。
[0091] 上述根据本发明的方法可在硬件、固件中实现,或者被实现为可存储在记录介质 (诸如CD R0M、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载 的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计 算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专 用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微 处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、 ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此 描述的处理方法。此外,当通用计算机访问用于实现在此示出的处理的代码时,代码的执行 将通用计算机转换为用于执行在此示出的处理的专用计算机。
[0092] 以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵 盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
【主权项】
1. 一种处理用户的资源访问行为的方法,其特征在于,所述方法包括: 根据第一组用户的资源访问行为数据和访问行为类型,训练得到用于识别用户的访问 行为类型的识别模型; 当接收到当前用户的资源访问请求时,获取当前用户的资源访问行为数据,将所述当 前用户的资源访问行为数据输入到所述识别模型,得到所述当前用户的访问行为类型; 根据所述当前用户的访问行为类型,对所述当前用户的资源访问请求进行处理。2. 根据权利要求1所述的方法,其特征在于,所述根据第一组用户的资源访问行为数据 和访问行为类型,训练得到用于识别用户的访问行为类型的识别模型的处理包括: 获取所述第一组用户的资源访问行为数据和访问行为类型; 从所述第一组用户的资源访问行为数据获取所述用户的行为特征数据; 以所述用户的行为特征数据和所述用户的访问行为类型为训练样本数据集,训练用于 识别用户的实际访问行为类型的识别模型。3. 根据权利要求2所述的方法,其特征在于,所述方法还包括: 根据第二组用户的资源访问行为数据和访问行为类型,更新所述识别模型。4. 根据权利要求1~3中任一项所述的方法,其特征在于,所述方法还包括: 根据预先统计的用户的长期访问行为特征数据,对得到识别为正常的用户的访问行为 类型进行校正。5. -种处理用户的资源访问行为的方法,其特征在于,所述方法包括: 根据第一组用户的资源访问行为数据和访问行为类型,训练得到用于识别用户的访问 行为类型的识别模型; 获取第二组用户的资源访问行为数据,将所述第二组用户的资源访问行为数据输入到 所述识别模型,得到所述第二组用户的访问行为类型; 根据所述第一组用户的访问行为类型和所述第二组用户的访问行为类型,生成白名 单; 当接收到当前用户的资源访问请求时,根据所述白名单对所述当前用户的资源访问请 求进行处理。6. 根据权利要求5所述的方法,其特征在于,所述方法还包括: 根据第三组用户的资源访问行为数据和访问行为类型,更新所述识别模型和所述白名 单。7. 根据权利要求6所述的方法,其特征在于,所述根据第一组用户的资源访问行为数据 和访问行为类型,训练得到用于识别用户的访问行为类型的识别模型的处理包括: 获取所述第一组用户的资源访问行为数据和访问行为类型; 从所述第一组用户的资源访问行为数据获取所述用户的行为特征数据; 以所述用户的行为特征数据和所述用户的访问行为类型为训练样本数据集,训练用于 识别用户的实际访问行为类型的识别模型。8. 根据权利要求5~7中任一项所述的方法,其特征在于,所述方法还包括: 根据预先统计的用户的长期访问行为特征数据,对识别为正常的用户的访问行为类型 进行校正,并且将被识别为作弊行为的用户从白名单里去除掉。9. 一种处理用户的资源访问行为的装置,其特征在于,所述装置包括: 识别模型训练单元,用于根据第一组用户的资源访问行为数据和访问行为类型,训练 得到用于识别用户的访问行为类型的识别模型; 第一用户访问行为类型识别单元,用于当接收到当前用户的资源访问请求时,获取当 前用户的资源访问行为数据,将所述当前用户的资源访问行为数据输入到所述识别模型训 练单元训练得到的识别模型,得到所述当前用户的访问行为类型; 第一资源访问请求处理单元,用于根据所述当前用户的访问行为类型,对所述当前用 户的资源访问请求进行处理。10. 根据权利要求9所述的装置,其特征在于,所述识别模型训练单元用于获取所述第 一组用户的资源访问行为数据和访问行为类型,从所述第一组用户的资源访问行为数据获 取所述用户的行为特征数据,以所述用户的行为特征数据和所述用户的访问行为类型为训 练样本数据集,训练用于识别用户的实际访问行为类型的识别模型。11. 根据权利要求10所述的装置,其特征在于,所述装置还包括: 第一识别模型更新单元,用于根据第二组用户的资源访问行为数据和访问行为类型, 更新所述识别模型。12. -种处理用户的资源访问行为的装置,其特征在于,所述装置包括: 识别模型训练单元,用于根据第一组用户的资源访问行为数据和访问行为类型,训练 得到用于识别用户的访问行为类型的识别模型; 第二用户访问行为类型识别单元,用于获取第二组用户的资源访问行为数据,将所述 第二组用户的资源访问行为数据输入到所述识别模型,得到所述第二组用户的访问行为类 型; 白名单生成单元,用于根据所述第一组用户的访问行为类型和所述第二组用户的访问 行为类型,生成白名单; 第二资源访问请求处理单元,用于当接收到当前用户的资源访问请求时,根据所述白 名单对所述当前用户的资源访问请求进行处理。13. 根据权利要求12所述的装置,其特征在于,所述装置还包括: 白名单更新单元,用于根据第三组用户的资源访问行为数据和访问行为类型,更新所 述识别模型和所述白名单。14. 根据权利要求12或13所述的装置,其特征在于,所述装置还包括: 第二用户访问行为类型校正单元,用于根据预先统计的用户的长期访问行为特征数 据,对得到识别为正常的用户的访问行为类型进行校正,并且将被识别为作弊行为的用户 从白名单里去除掉。
【文档编号】H04L29/06GK105897676SQ201510869215
【公开日】2016年8月24日
【申请日】2015年12月1日
【发明人】张磊
【申请人】乐视网信息技术(北京)股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1