基于预测模型的用户行为识别方法及装置与流程

文档序号:16671052发布日期:2019-01-18 23:35阅读:157来源:国知局
基于预测模型的用户行为识别方法及装置与流程

本申请涉及通信技术领域,尤其涉及一种基于预测模型的用户行为识别方法及装置。



背景技术:

目前随着终端设备的功能日益完善,用户可通过终端设备办理各式各样的业务,使得终端设备与用户的日常生活关系日益密切。为了保障用户通过终端设备所办理的各项业务的安全性,终端设备可在用户办理各项业务时,基于用户办理业务时的用户行为分析进行用户认证,包括用户办理业务时的操作和/或用户办理业务时提供的信息等进行用户行为分析以实现用户认证,进而可在用户认证通过时才启动对应的业务,以保障用户的业务安全性。

现有技术中,用户在各个终端设备上办理业务时的用户认证一般是单机独立进行用户行为的数据分析和计算,由于单机的终端设备硬件条件等因素的限制,使得单机独立进行用户行为分析的数据处理效率低,用户行为识别效率低,适用范围小,从而导致业务的用户认证安全性低。



技术实现要素:

本申请实施例提供一种基于预测模型的用户行为识别方法及装置,可提高用户行为识别的数据处理效率,提高启动目标业务的用户行为类别的判定准确率,增强目标业务的用户认证安全性,进而可更好地保证目标业务的用户数据安全,适用性更高。

第一方面,本申请实施例提供了一种基于预测模型的用户行为识别方法,该方法包括:

获取用于触发启动目标业务的第一用户操作数据,并确定上述第一用户操作数据所关联的第一用户标识信息;

基于上述目标业务的用户行为识别模型,确定出上述第一用户操作数据和上述第一用户标识信息对应的目标用户行为类别,上述用户行为识别模型由触发启动上述目标业务的样本数据训练得到,上述样本数据中至少包括第一类别用户行为对应的第一用户行为样本数据和第二类别用户行为对应的第二用户行为样本数据,任一用户行为样本数据中均包括用户操作数据和/或用户标识信息;

根据上述目标用户行为类别完成上述目标业务的用户认证并启动上述目标业务,或者根据上述目标用户行为类别断开上述目标业务的用户认证。

在本申请实施例中,基于目标业务的用户行为识别模型,可对获取到的用于触发启动目标业务的用户操作数据及其对应的用户标识信息进行用户行为类别的判定,进而可基于用户行为识别模型识别得到的用户行为类别响应目标业务的用户认证。若基于用户行为类别确定完成目标业务的用户认证则可启动目标业务,否则断开目标业务的用户认证,操作简单。基于用户行为识别模型对用户行为类别进行判断可克服单机独立进行用户行为分析的数据处理所存在的硬件条件限制,进而可提高用户行为识别的数据处理效率,提高启动目标业务的用户行为类别的判定准确率,增强目标业务的用户认证安全性,进而可更好地保证目标业务的用户数据安全,适用性更高。

结合第一方面,在一种可能的实施方式中,上述方法还包括:

获取至少两种类别用户行为的样本数据,上述样本数据用于上述用户行为识别模型训练,上述样本数据中至少包括上述第一用户行为样本数据和上述第二用户行为样本数据;

将上述样本数据作为上述用户行为识别模型的输入,通过上述用户行为识别模型对上述样本数据进行学习以获取识别任一用户操作数据和/或用户标识信息对应的用户行为类别的能力。

本申请实施例可基于分布式的多种类别用户行为的样本数据构建用户行为识别模型,使得用户行为识别模型具备识别任一用户操作数据和/或用户标识信息对应的用户行为类别的能力,可实现分布式的用户行为识别的数据处理,进而可提高基于用户行为识别模型对用户行为类别进行判定的可行性,提高基于用户行为识别模型进行用户行为类别判定的准确性,适用范围更广。

结合第一方面,在一种可能的实施方式中,上述通过上述用户行为识别模型对上述样本数据进行学习包括:

通过上述用户行为识别模型,基于logistics回归算法以第一类别用户行为和第二类别用户行为的二分类问题为学习任务,对上述至少两种类别用户行为中各类别用户行为对应的用户操作数据和/或用户标识信息进行学习,以获得识别目标类别用户行为参数并基于上述目标类别用户行为参数确定出任一用户操作数据和/或用户标识信息对应的用户行为类别的能力。

在本申请实施例中,基于logistics回归算法实现分布式的logistics回归分析对用户行为识别模型进行训练,可有效地分析海量的用户行为数据以训练得到具备识别任一用户操作数据和/或用户标识信息对应的用户行为类别的能力的用户行为识别模型,操作简单。基于分布式logistics回归算法处理海量的用户行为数据可使得训练得到的用户行为识别模型的用户行为类别的判定准确率更高,适用性更强。

结合第一方面,在一种可能的实施方式中,上述获取至少两种类别用户行为的样本数据包括:

从上述目标业务的用户群数据库中获取至少两种类别用户行为的样本数据;

其中,上述样本数据中包括上述用户群数据库包括的至少两种类别用户行为中各类别用户行为触发启动上述目标业务时的用户操作数据和/或用户标识信息。

结合第一方面,在一种可能的实施方式中,上述获取至少两种类别用户行为的样本数据包括:

基于大数据分析从其他业务的用户群数据库中获取至少两种类别用户行为的样本数据,上述其他业务为与上述目标业务为相同类型业务且用户认证方式相同的一个或者多个业务;

其中,上述样本数据中包括上述其他业务的用户群数据库包括的至少两种类别用户行为中各类别用户行为触发启动上述其他业务时的用户操作数据和/或用户标识信息。

在本申请实施例中,用于用户行为识别模型训练的样本数据可从多种数据获取路径获取得到,样本数据的来源可覆盖到多种业务对应的用户认证,提高了样本数据的数据有效性,样本数据的可靠性更强。基于多种数据获取路径获取到的样本数据训练得到用户行为识别模型,基于用户行为识别模型实现用户行为类别的判定进一步实现了用户行为类别的分布式计算,克服用户行为类别识别的单机计算局限,进而可提高基于用户行为识别模型进行用户行为类别判定的准确率。

结合第一方面,在一种可能的实施方式中,上述第一类别用户行为包括正常用户行为,上述第二类别用户行为包括异常用户行为;

上述根据上述目标用户行为类别完成上述目标业务的用户认证并启动上述目标业务,或者根据上述目标用户行为类别断开上述目标业务的用户认证包括:

当上述目标用户行为类别为正常用户行为时,完成上述目标业务的用户认证并且进入上述目标业务的业务办理界面;

当上述用户行为类别为异常用户行为时,关闭上述目标业务的用户认证界面以断开上述目标业务的用户认证,并将上述异常用户行为对应的用户标识信息上报上述目标业务对应的网络管理员。

本申请实施例可通过用户行为识别模型的用户行为类别的判定结果确定是否启动目标业务可以保障目标业务的安全,或者向目标业务的网络管理员发出异常用户攻击的预警信号以阻断目标业务的异常用户认证,可防止异常用户的网络攻击行为,增强了目标业务的安全性和/或网络安全性,适用性更强。

结合第一方面,在一种可能的实施方式中,上述第一用户操作数据和/或上述样本数据中任一用户操作数据中所包含的数据类型包括:用户操作时段、用户操作频率、用户操作的终端设备安全属性信息以及用户的页面操作数据的一种或者多种;

上述第一用户标识信息和/或上述样本数据中任一用户标识信息中所包含的数据类型包括:用户的业务账号信息、用户身份信息、用户身份信息所绑定的联系信息、用户所使用的终端设备信息以及用户所处地理位置信息中的一种或者多种。

第二方面,本申请实施例提供了一种基于预测模型的用户行为识别装置,该装置包括:

数据获取单元,用于获取用于触发启动目标业务的第一用户操作数据,并确定上述第一用户操作数据所关联的第一用户标识信息;

用户行为识别单元,用于基于上述目标业务的用户行为识别模型,确定出上述数据获取单元得到的第一用户操作数据和上述第一用户标识信息对应的目标用户行为类别,上述用户行为识别模型由触发启动上述目标业务的样本数据训练得到,上述样本数据中至少包括第一类别用户行为对应的第一用户行为样本数据和第二类别用户行为对应的第二用户行为样本数据,任一用户行为样本数据中均包括用户操作数据和/或用户标识信息;

认证响应单元,用于根据上述用户行为识别单元确定的目标用户行为类别完成上述目标业务的用户认证并启动上述目标业务,或者根据上述目标用户行为类别断开上述目标业务的用户认证。

结合第二方面,在一种可能的实施方式中,上述数据获取单元还用于:

获取至少两种类别用户行为的样本数据,上述样本数据用于上述用户行为识别模型训练,上述样本数据中至少包括上述第一用户行为样本数据和上述第二用户行为样本数据;

上述用户行为识别单元,用于:

将上述数据获取单元获取的样本数据作为上述用户行为识别模型的输入,通过上述用户行为识别模型对上述样本数据进行学习以获取识别任一用户操作数据和/或用户标识信息对应的用户行为类别的能力。

结合第二方面,在一种可能的实施方式中,上述用户行为识别单元用于:

通过上述用户行为识别模型,基于logistics回归算法以第一类别用户行为和第二类别用户行为的二分类问题为学习任务,对上述至少两种类别用户行为中各类别用户行为对应的用户操作数据和/或用户标识信息进行学习,以获得识别目标类别用户行为参数并基于上述目标类别用户行为参数确定出任一用户操作数据和/或用户标识信息对应的用户行为类别的能力。

结合第二方面,在一种可能的实施方式中,上述数据获取单元用于:

从上述目标业务的用户群数据库中获取至少两种类别用户行为的样本数据;

其中,上述样本数据中包括上述用户群数据库包括的至少两种类别用户行为中各类别用户行为触发启动上述目标业务时的用户操作数据和/或用户标识信息。

结合第二方面,在一种可能的实施方式中,上述数据获取单元用于:

基于大数据分析从其他业务的用户群数据库中获取至少两种类别用户行为的样本数据,上述其他业务为与上述目标业务为相同类型业务且用户认证方式相同的一个或者多个业务;

其中,上述样本数据中包括上述其他业务的用户群数据库包括的至少两种类别用户行为中各类别用户行为触发启动上述其他业务时的用户操作数据和/或用户标识信息。

结合第二方面,在一种可能的实施方式中,上述第一类别用户行为包括正常用户行为,上述第二类别用户行为包括异常用户行为;

上述认证响应单元用于:

当上述目标用户行为类别为正常用户行为时,完成上述目标业务的用户认证并且进入上述目标业务的业务办理界面;

当上述用户行为类别为异常用户行为时,关闭上述目标业务的用户认证界面以断开上述目标业务的用户认证,并将上述异常用户行为对应的用户标识信息上报上述目标业务对应的网络管理员。

结合第二方面,在一种可能的实施方式中,上述第一用户操作数据和/或上述样本数据中任一用户操作数据中所包含的数据类型包括:用户操作时段、用户操作频率、用户操作的终端设备安全属性信息以及用户的页面操作数据的一种或者多种;

上述第一用户标识信息和/或上述样本数据中任一用户标识信息中所包含的数据类型包括:用户的业务账号信息、用户身份信息、用户身份信息所绑定的联系信息、用户所使用的终端设备信息以及用户所处地理位置信息中的一种或者多种。

第三方面,本申请实施例提供了一种终端设备,该终端设备包括处理器和存储器,该处理器和存储器相互连接。该存储器用于存储支持该终端设备执行上述第一方面和/或第一方面任一种可能的实现方式提供的方法的计算机程序,该计算机程序包括程序指令,该处理器被配置用于调用上述程序指令,执行上述第一方面和/或第一方面任一种可能的实施方式所提供的方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令当被处理器执行时使该处理器执行上述第一方面和/或第一方面任一种可能的实施方式所提供的方法。

在本申请实施例中,基于目标业务的用户行为识别模型可对获取到的用于触发启动目标业务的用户操作数据及其对应的用户标识信息进行用户行为类别的判定,进而可基于用户行为识别模型识别得到的用户行为类别响应目标业务的用户认证。若基于用户行为类别确定完成目标业务的用户认证则可启动目标业务,否则断开目标业务的用户认证,操作简单。基于用户行为识别模型对用户行为类别进行判断可克服单机独立进行数据处理的硬件条件限制,进而可提高用户行为识别的数据处理效率,提高启动目标业务的用户行为类别的判定准确率,增强目标业务的用户认证安全性,进而可更好地保证目标业务的用户数据安全,适用性更高。

附图说明

为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的基于预测模型的用户行为识别方法的一流程示意图;

图2是本申请实施例提供的用户行为识别模型的构建方法的流程示意图;

图3是本申请实施例提供的基于预测模型的用户行为识别方法的另一流程示意图;

图4是本申请实施例提供的基于预测模型的用户行为识别装置的结构示意图;

图5是本申请实施例提供的终端设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

logistics回归算法是logistics回归分析所采用的算法,多用于分类。logistics回归算法所采用的函数可以接收输入数据,并根据输入数据预测出输入数据对应的类别,例如数学中的sigmoid函数等。举例来说,logistics回归算法在流行病学中应用情形多是探索某疾病的危险因素,根据危险因素预测某疾病发生的概率,等等。例如,想探讨胃癌发生的危险因素,可以选择两个类别的人群,其中一个类别是胃癌组人群,另一个类别是非胃癌组人群。胃癌组人群和非胃癌组人群肯定有着不同的体征和生活方式等。这里,针对胃癌组人群和非胃癌组人群的分类中因变量就是是否胃癌,即“是”或“否”为两个类别的分类变量。自变量就可以包括很多了,例如年龄、性别、饮食习惯、幽门螺旋杆菌感染等等。通过logistics回归算法进行回归分析就可以了解到底哪些因素是胃癌的危险因素,比如幽门螺旋杆菌感染等。logistics回归算法的适应范围广泛,具体可根据实际应用场景确定,在此不再赘述。

基于logistics回归算法的数据处理特点,本申请实施例提供了一种基于预测模型的用户行为识别方法及装置,可基于logistics回归算法构建用于识别异常用户行为的用户行为识别模型。本申请实施例提供的基于预测模型的用户行为识别方法(为方便描述下面简称本申请实施例提供的方法),适用于多种业务应用场景中用户行为数据(包括用户操作数据和/或用户标识信息等,为方便描述可以用户行为数据进行说明)的分析,识别并截获异常用户行为的用户行为数据。本申请实施例提供的基于海量用户行为数据构建用于对用户行为数据进行logistics回归算法的网络模型(即用户行为识别模型),使得该网络模型具备根据输入的用户行为数据识别对应的用户行为是正常用户行为还是异常用户行为的能力。可以理解,这里上述构建的网络模型也是基于海量的用户行为数据生成的一种logistics回归算法。基于上述构建的网络模型,可在分布式的终端设备上利用该网络模型实现不同业务、不同用户群体以及不同用户行为数据分布等各个不同应用场景下的用户行为数据分析,以判定用户行为数据所对应的用户行为类别,实现用户行为数据的分布式logistics回归分析。其中,上述不同业务的应用场景可包括业务的账号注册、账号登录、业务消费或者支付等,具体可根据实际应用场景确定,在此不做限制。上述不同用户群体对应不同的用户特征和/或用户行为数据,因此,下面也可用不同的用户特征和/或用户行为数据表示不同的用户群体。上述不同用户行为数据分布可包括正态分布、近似正态分布的左偏分布或者近似正态分布的右偏分布等等,不同的数据范围对应不同的数据分布,在此不做限制。

针对不同应用场景、不同用户群体的用户行为数据以及不同用户行为数据分布下的海量用户行为数据,构建logistics回归算法的网络模型,基于该网络模型在分布式的终端设备上实现logistics回归分析,可克服logistics回归算法的单机数据处理所带来的硬件条件限制,可提高用户行为数据的分析效率,增强用户行为类别的判定准确率。基于上述网络模型在分布式的终端设备上实现logistics回归分析也可适用于各业务的应用场景中海量用户行为数据的分析,进而用户行为数据分析得到的用户行为类别确定是否完成启动各业务的用户认证,或者阻断启动业务的用户认证。基于用户行为类别的判断结果确定是否进入各业务的用户操作界面,从而可增强各业务的应用场景下的用户数据安全性,适用性更强。本申请实施例提供的方法可适用于任一业务的用户认证,为方便描述下面将以目标业务为例进行说明,以下不再赘述。下面将结合图1至图5对本申请实施例提供的方法及装置进行说明。

请参见图1,图1是本申请实施例提供的基于预测模型的用户行为识别方法的一流程示意图。本申请实施例提供的方法可包括目标业务的用户行为识别模型的构建、基于用户行为识别模型的用户行为数据分析以实现用户行为类别的判定,以及基于用户行为数据分析得到的用户行为类别的判定结果响应目标业务的用户认证等数据处理阶段。为方便描述,下面将以用户行为识别模型表示用于对用户行为数据进行logistics回归分析以判断用户行为数据对应的用户行为类别的网络模型为例,对本申请实施例提供的方法进行说明。下面将结合步骤s1、s2和s3对本申请实施例提供的各数据处理阶段进行说明。

s1、目标业务的用户行为识别模型的构建。

在一些可行的实施方式中,在目标业务的用户行为识别模型的训练阶段,可整合用于用户行为识别模型训练的用户行为数据,以对用户行为的二分类(例如正常用户行为或者异常用户行为的两种类别用户行为的二分类)问题为学习任务对用户行为识别模型进行训练,使得用户行为识别模型具备对实时采集到的用户行为数据进行正常用户行为或者异常用户行为的用户行为类别判定的能力。其中,上述用户行为数据可包括用户操作数据和/或用户标识信息。其中,上述用户操作数据包括但不限于用户在浏览器的业务操作页面或者客户端的业务操作页面上的页面操作数据、用户在浏览器的业务操作页面或者客户端的业务操作页面上的用户操作时段、用户在浏览器的业务操作页面或者客户端的业务操作页面上的用户操作频率、用户操作的终端设备安全属性信息等等。具体可根据实际应用场景确定更多类型的用户操作数据,在此不做限制。上述用户标识信息包括但不限于用户的业务账号信息、用户身份信息、用户身份信息所绑定的联系信息、用户所使用的终端设备信息以及用户所处地理位置信息等等,具体可根据实际应用场景确定,在此不做限制。

在一些可行的实施方式中,请一并参见图2,图2是本申请实施例提供的用户行为识别模型的构建方法的流程示意图。上述用户行为识别模型的构建所采用的实现方式可包括如下步骤s11至s13中各个步骤所提供的实现方式。

s11、用于用户行为识别模型训练的样本数据采集。

在一些可行的实施方式中,上述用于用户行为识别模型训练的样本数据可包括用于用户行为识别模型训练的至少两种类型用户行为的样本数据。其中,上述样本数据中至少包括第一类别用户行为(例如正常用户行为)对应的第一用户行为样本数据和第二类别用户行为(例如异常用户行为)对应的第二用户行为样本数据,且包括上述第一用户行为样本数据和所述第二用户行为样本数据在内的任一用户行为样本数据中均包括用户操作数据和/或用户标识信息。

可选的,上述至少两种类别用户行为的样本数据可从目标业务的用户群数据库中获取。其中,上述样本数据中包括上述目标业务的用户群数据库包括的至少两种类别用户行为中各类别用户行为触发启动目标业务时的用户操作数据和/或用户标识信息。

可选的,上述至少两种类别用户行为的样本数据可基于大数据分析从其他业务的用户群数据库中获取。其中,上述其他业务为与目标业务为相同类型业务且用户认证方式(比如同为滑块验证码认证或者同为图片验证码认证等)相同的一个或者多个业务。其中,上述样本数据中包括其他业务的用户群数据库包括的至少两种类别用户行为中各类别用户行为触发启动其他业务时的用户操作数据和/或用户标识信息。在本申请实施例中,用于用户行为识别模型训练的样本数据可从多种数据获取路径获取得到,样本数据的来源可覆盖到多种业务对应的用户认证,提高了样本数据的数据有效性,样本数据的可靠性更强。基于多种数据获取路径获取到的样本数据训练得到用户行为识别模型,基于用户行为识别模型实现用户行为类别的判定进一步实现了用户行为类别的分布式计算,克服用户行为类别识别的单机计算的硬件条件局限,进而可提高基于用户行为识别模型进行用户行为类别判定的准确率。

在一些可行的实施方式中,上述第一用户操作数据和/或样本数据中任一用户操作数据中所包含的数据类型包括但不限于用户操作时段、用户操作频率、用户操作的终端设备安全属性信息以及用户的页面操作数据等。其中,上述用户的业务操作数据包括但不限于页面上的用户操作位置、页面上的用户操作时长以及页面上的用户操作轨迹等等,在此不做限制。其中,上述页面上的用户操作位置可为用户的手指或者鼠标在页面上点击的位置,或者在页面上按压的位置等,具体可根据实际应用场景确定,在此不做限制。其中,上述点击操作或者按压操作所触发产生的用户操作指令可为用于触发启动目标业务的业务办理页面(为方便描述可简称为启动目标业务)的用户操作指令,在此不做限制。上述页面上的用户操作指令可为用户手指或者鼠标在页面上点击或者按压等操作对应的持续时长,例如从鼠标点击或者按压页面上的某一个位置到鼠标松开这个过程的时长等。上述页面上的用户操作轨迹为用户手指或者鼠标在页面上多次点击或者按压的轨迹,或者手指或者鼠标在页面上滑动的轨迹等,具体可根据实际应用场景中目标业务的启动所需的用户操作形式确定,在此不做限制。上述用户操作时段可包括但不限于用户在浏览器的业务操作页面或者客户端的业务操作页面上触发启动目标业务的操作日期或者操作时刻等,具体可根据实际应用场景确定,在此不做限制。上述用户操作频率可包括但不限于用户在浏览器的业务操作页面或者客户端的业务操作页面上触发启动目标业务的尝试启动频率或者重复启动频率等等,在此不做限制。上述用户操作的终端设备安全属性信息包括但不限于终端设备是否持续充电、终端设备是否越狱、终端设备是否有模拟器、终端设备的设备属性是否被篡改以及终端设备是否有黑客常用的篡改信息软件等涉及终端设备安全的信息,具体可根据实际应用场景确定,在此不做限制。

在一些可行的实施方式中,上述第一用户标识信息和/或样本数据中任一用户标识信息中所包含的数据类型包括但不限于用户的业务账号信息、用户身份信息、用户身份信息所绑定的联系信息、用户所使用的终端设备信息以及用户所处地理位置信息等等,具体可根据实际应用场景确定,在此不做限制。其中,上述用户的业务账号信息包括但不限于用户触发启动目标业务时执行的业务账号注册流程所填写的业务账号信息,或者用户启动目标业务时执行业务账号登录所填写的业务账号信息等,具体可根据实际应用场景确定,在此不做限制。上述用户身份信息包括但不限于用户的业务账号信息所绑定的用户身份(例如身份证号码),或者银行卡信息等等,具体可根据实际应用场景确定,在此不做限制。上述用户身份信息所绑定的联系信息包括但不限于用户身份信息所绑定的手机号、紧急联系人或者家庭住址等等,在此不做限制。上述用户所使用的终端设备信息包括但不限于终端设备的媒体访问控制(mediumaccesscontrol,mac)地址、国际移动设备标识(internationalmobileequipmentidentity,imei)、互联网协议(internetprotocol,ip)地址、直接内向拨号(directinwarddialling,did)、用户所使用终端设备的显示屏分辨率、终端设备的总存储空间或者终端设备的可用存储空间等,在此不做限制。上述用户所处地理位置信息包括但不限于用户触发启动目标业务时所处的地理位置,或者用户触发启动目标业务时所使用的终端设备所在的地理位置或者终端设备所连接局域网的所属地理区域等等,具体可根据实际应用场景确定,在此不做限制。

可选的,在用户行为识别模型的训练阶段所采集以及筛选的数据类型和/或数据内容,可与下面步骤所提供的用户行为识别模型的测试阶段以及使用阶段等数据处理阶段中,所采集以及筛选的数据类型和/或数据内容均保持数据类型和/或数据内容(数据项目类型相同但数值不同)相同,从而可更好地利用用户行为识别模型对输入的用户行为数据进行学习并输出相应的用户行为类别,可提供基于用户行为识别模型进行用户行为类别判定的准确率,适用性更强。为方便描述,上述各个数据处理阶段中所涉及的用户操作数据和用户标识信息可以用户行为数据为例进行说明。

在一些可行的实施方式中,从目标业务的用户群数据库中获取或者基于大数据分析获取得到上述用于用户行为识别模型训练的样本数据之后,则可对采集到的上述样本数据进行数据清洗、特征筛选,最终形成关于异常用户行为启动目标业务所对应的一些特征数据。其中,上述特征数据可包括但不限于:终端设备的设备信息(例如ip地址的数量、mac地址的数量、did的数量、imei的数量、终端设备可用存储空间与总存储空间的占比等基于统计的特征数据),终端设备安全属性信息(是否持续充电、是否越狱、是否有模拟器、信息是否被篡改等)以及用户操作数据(用户操作时段、用户操作频率、以及用户所处地理位置等)等多个维度的特征数据,在此不做限制。

s12、基于上述样本数据构建用户行为识别模型。

在一些可行的实施方式中,可将上述用于用户行为识别模型训练的样本数据作为用户行为识别模型的输入,通过用户行为识别模型对上述样本数据进行学习,以获取识别任一用户操作数据和/或用户标识信息对应的用户行为类别的能力。可选的,可通过上述用户行为识别模型,基于logistics回归算法以第一类别用户行为(例如正常用户行为)和第二类别用户行为(异常用户行为)的二分类问题的学习任务,对所述至少两种类别用户行为中各类别用户行为对应的用户行为数据(例如用户操作数据和/或用户标识信息)进行学习,以获得识别目标类别用户行为参数并基于所述目标类别用户行为参数确定出任意用户操作数据和/或用户标识信息对应的用户行为类别的能力。这里,基于上述样本数据的数据清洗和特征筛选得到上述多个维度的特征数据,结合logistics回归算法可以正常用户行为和异常用户行为的二分类问题为学习任务,对各类别用户行为对应的特征数据进行学习以获得识别目标类别用户行为参数,并基于该目标类别用户行为参数确定出任一用户操作数据和/或用户标识信息对应的用户行为类别的能力。这里,目标类别用户行为参数可以是异常用户行为对应的用户行为参数,包括但不限于异常用户行为对应的上述各个维度的特征数据,具体可根据实际应用场景确定,在此不做限制。换句话说,就是基于各个类别用户行为对应的特征数据确定出异常用户行为所包括的异常因素(异常行为参数),进而可基于异常因素对任一用户对应的用户行为数据进行数据特征学习。若基于用户行为识别模型确定出某一用户行为数据中包括异常因素,则可基于用户行为识别模型确定出该用户行为数据对应的用户行为为异常用户行为,否则为正常用户行为等。

通常情况下,正常用户行为对应的用户行为数据中用户在页面上的操作位置,操作时长以及用户操作轨迹等相对比较随机。正常用户行为中用户所使用终端设备的标识信息、用户所使用终端设备的显示屏分辨率以及用户的目标业务账号信息等用户标识信息会比较固定且都会有一定的关联关系,包括但不限于用户绑定的关联关系,或者终端设备内置的各个软件所检测得到的信息之间的匹配关系(比如终端设备所处地理位置与终端设备所连接局域网的所属地理位置之间的匹配关系等)等等,在此不做限制。正常用户行为对应的终端设备安全属性信息通常不会持续充电,终端设备少越狱,终端设备通常情况下也不会有模拟器或者黑客常用的篡改信息软件等,且终端设备的设备属性通常情况下不轻易被篡改。然而,相对于正常用户行为对应的用户行为数据,异常用户行为对应的用户标识信息相对会有异常变化,各个用户标识信息之间的关联关系不明确或者关联关系之间相互冲突等。终端设备安全属性信息中可能会出现终端设备持续充电、终端设备频繁越狱、终端设备中设置有模拟器或者黑客常用的篡改信息软件、终端设备的设备属性被篡改等显露不安全迹象的信息等。基于上述正常用户行为和异常用户行为对应的用户行为数据之间的特征差异,可以利用机器学习的logistics回归算法进行回归分析可确定出异常用户行为所可能包括的用户行为参数(异常因素,例如终端设备的设备属性被篡改等),基于上述样本数据对用户行为识别模型进行训练,从而可训练得到能够输出出任一用户行为数据对应的用户行为为异常用户行为的概率,从而可区分正常用户行为和异常用户行为的用户行为识别模型。

在一些可行的实施方式中,上述用户行为识别模型所使用的目标函数可为二分类变量(是否异常用户行为)的计算函数,例如数学中的sigmoid函数。该目标函数是基于目标业务和基于大数据分析统计确定的阈值,根据输入用户行为识别模型的用户行为数据输出正常用户行为(0)或者异常用户行为(1)的二分类(0,1)变量,以将该用户行为数据对应的用户行为区分为正常用户行为或者异常用户行为。基于上述样本数据和上述目标函数可构建基于logistic回归算法进行用户行为识别的用户行为识别模型。这里,上述用户行为识别模型是基于logistics回归算法训练得到的线性的有监督模型。通过模型训练该用户行为识别模型可学习上述异常用户行为的特征数据,通过模型训练该用户行为识别模型可以从上述样本数据对应的多个维度的特征数据中学习得到两个类别用户行为中各类别用户行为对应的潜在特征,进而对整个用户群体进行用户行为的分类预测,以期准确区分出两种类别的用户行为。这里,上述用户行为识别模型可基于输入的用户行为数据输出其所对应的用户行为为异常用户行为的概率,进而可根据该概率确定输入用户行为识别模型的用户行为数据对应的用户行为为正常用户行为或者异常用户行为。在用户行为识别模型的训练过中,若输入用户行为识别模型的用户行为数据为异常用户行为对应的用户行为数据,则用户行为识别模型对应输出的异常用户行为的概率可无限接近于1。同理,若输入用户行为识别模型的用户行为数据为正常用户行为对应的用户行为数据,则用户行为识别模型输出的异常用户行为的概率可无限接近于0,以此反复训练可得到具备针对任一用户行为数据对应输出异常用户行为的概率的能力的网络模型。

s13、基于用户行为识别模型进行正常用户行为与异常用户行为判定的测试。

在一些可行的实施方式中,在构建用户行为识别模型对正常用户行为和异常用户行为进行识别的基础上,保存训练得到的用户行为识别模型的模型参数。同时针对测试过程中,基于用户行为识别模型可对用户单次产生的用户操作数据和用户标识信息等用户行为测试数据进行用户行为的实时判定,快速、准确、实时的返回异常用户行为概率的判定结果。基于用户行为识别模型返回的异常用户行为概率可确定出输入的用户行为测试数据对应的用户行为为异常用户行为或者正常用户行为。基于上述用户行为识别模型输出的正常用户行为或者异常用户行为的用户行为判定结果与实际测试过程中用户行为的类别对用户行为识别模型的模型参数进行修正,使得用户行为识别模型具备更加精准的异常用户行为判定能力,进而可提高基于用户行为识别模型进行正常用户行为或者异常用户行为的用户行为类别的判断准确率。

通过上述步骤s11至s13可完成用户行为识别模型的训练和优化,可得到具备识别正常用户行为和异常用户行为的能力的用户行为识别模型。通过训练得到的用户行为识别模型可对实时采集到的用户行为数据进行判定,以确定实时采集到的用户行为数据对应的用户行为为正常用户行为或者异常用户行为。

s2、基于用户行为识别模型的用户行为数据分析。

在一些可行的实施方式中,基于上述步骤步s11至s13可完成用户行为识别模型的训练和优化之后,则可基于上述用户行为识别模型对实时采集到的用于触发启动目标业务的用户操作数据(为方便描述可以第一用户操作数据为例进行说明)以及第一用户操作数据所关联的用户标识信息(为方便描述可以第一用户标识信息为例进行说明)等用户行为数据(为方便描述可以第一用户行为数据为例进行说明)进行用户行为类别的判定,进而可根据基于用户行为识别模型判定的用户行为类别完成目标业务的用户认证并启动目标业务,或者根据用户行为类别断开目标业务的用户认证。请一并参见图3,图3是本申请实施例提供的基于预测模型的用户行为识别方法的另一流程示意图。本申请实施例提供的方法可将结合步骤s21至s24进行具体说明。

s21、获取用于触发启动目标业务的第一用户操作数据,并确定上述第一用户操作数据所关联的第一用户标识信息。

在一些可行的实施方式中,在用户行为识别模型的使用阶段,在用户需要在目标业务对应的浏览器的业务操作页面或者客户端的业务操作页面上完成触发启动目标业务的操作时,可采集上述浏览器的业务操作页面或者客户端的业务操作页面上的用户操作数据(即第一用户操作数据),并根据上述第一用户操作数据确定第一用户操作数据所关联的第一用户标识信息。为方便描述,启动目标业务的操作可包括启动注册应用账号的业务和/或登录应用账号的业务等操作,其中,上述注册应用账号的业务或者登陆应用账号的业务可以目标业务为例进行说明,下面不再赘述。可选的,上述第一用户操作数据可包括但不限于用户操作时段、用户操作频率、用户操作的终端设备安全属性信息以及用户的页面操作数据的一种或者多种,具体可参见上述步骤s11至s13中各个步骤所提供的实现方式,在此不再赘述。

例如,当用户需要登陆某一个应用的应用账号或者注册某一个应用的应用账号时,可通过鼠标或者手指等途径点击浏览器的图标或者客户端的图标,从而可打开浏览器的业务操作页面或者客户端的业务操作页面。在上述业务操作页面上输入已有的应用账号信息,或者填写待注册的应用账号信息,或者滑动终端设备的屏幕以进行身份识别等用户认证操作。其中,当用户在业务操作页面上输入已有的应用账号信息,或者填写待注册的应用账号信息,或者滑动终端设备的屏幕以进行身份识别等用户认证操作时,终端设备可检测上述用户认证操作所对应的用户操作时段以及用户的业务操作数据等。同时,终端设备还可在用户认证操作过程对用户操作的终端设备进行安全属性信息的获取,还可实时采集得到输入已有的应用账号信息(针对业务的应用账号信息则可称为业务账号信息等,下面不再赘述)、填写待注册的应用账号信息、用户身份信息、用户身份信息所绑定的连续信息等等。可选的,终端设备也可在用户执行用户认证操作过程中,实时采集用户所使用的终端设备信息以及用户所处地理位置信息等等,具体可根据实际应用场景确定,在此不做限制。其中,上述第一用户操作数据和/或第一用户标识信息中所包括的数据类型和/或数据内容可参见上述步骤s11至s13中各个步骤所提供的实现方式中样本数据中任一户操作数据和/或用户标识信息所包括的数据类型和/或数据内容,在此不再赘述。

在一些可行的实施方式中,基于上述用户行为识别模型判定实时采集到的第一用户操作数据和/或第一用户标识信息所对应的用户行为类别之前,终端还可采集用户所使用终端设备的标识信息(例如ip地址等)以及用户所使用终端设备的显示屏分辨率等等用户标识信息,在此不做限制。进一步的,终端设备可以以上述用户标识信息中的一项或者多项作为用户认证的唯一识别信息,并以此衍生出用户在单位时间内执行用户认证操作的用户操作频率等用户操作数据(为方便描述可以第一用户操作数据为例进行说明)。进一步的,可将上述衍生得到的用户操作数据也作为基于用户行为识别模型训练进行用户行为类别判定的输入数据的一部分,进而可提高基于用户行为识别模型进行用户行为类别判定的准确率,适用性更强。

s22、基于上述目标业务的用户行为识别模型,确定出上述第一用户操作数据和上述第一用户标识信息对应的目标用户行为类别。

在一些可行的实施方式中,基于上述用户行为识别模型,确定出包括上述第一用户行为数据在内的输入数据所对应的用户行为类别。终端设备可将包含上述第一用户操作数据、上述第一用户标识信息和/或上述衍生数据在内的第一用户行为数据作为用户行为识别模型的输入数据,基于上述用户行为识别模型对上述输入数据进行学习,并输出上述第一用户行为数据对应的用户行为是异常用户行为的概率,进而可基于上述异常用户行为的概率确定上述第一用户行为数据对应的用户行为是正常用户行为还是异常用户行为的用户行为类别的判定结果,从而可根据判定结果确定是否响应启动目标业务的用户认证。

s23、根据上述目标用户行为类别完成上述目标业务的用户认证并启动上述目标业务,或者根据上述目标用户行为类别断开上述目标业务的用户认证。

在一些可行的实施方式中,当基于上述用户行为识别模型输出的异常用户行为概率确定上述第一用户行为数据对应的用户行为类别为正常用户(例如异常行为概率小于预设阈值并无限接近于0)时,终端设备可确定完成上述目标业务的用户认证并且进入上述目标业务的业务办理界面。例如,终端设备可在浏览器的业务操作页面或者客户端的业务操作页面上输出提示用户认证通过,并进入目标业务的业务办理界面,以供用户进行目标业务的业务办理操作等,具体可根据实际应用场景确定,在此不做限制。

在一些可行的实施方式中,当基于上述用户行为识别模型输出的异常用户行为概率确定上述第一用户行为数据对应的用户行为类别为异常用户(例如异常行为概率大于或者等于预设阈值并无限接近于1)时,终端设备可关闭上述目标业务的用户认证界面以断开上述目标业务的用户认证,并将上述异常用户的用户信息上报上述目标业务对应的网络管理员。例如,当终端设备可在浏览器的业务操作页面或者客户端的业务操作页面上输出提示用户认证失败并退出目标业务的用户认证进程。可选的,基于用户行为识别模型判定的用户行为类别进行目标业务响应的更多实现方式可参见如下步骤s3所提供的具体实施方式,在此不做限制。

s3、基于用户行为数据分析得到的用户行为类别的判定结果响应目标业务的用户认证。

在一些可行的实施方式中,若上述用户行为识别模型判定采集到的第一用户行为数据对应的用户行为为正常用户行为,则可响应该目标滑块验证码的验证并完成滑块验证码的验证,此时可允许用户进入目标业务对应的应用账号注册的后续流程,或者允许用户进入目标业务对应的应用账号登录的后续流程等。具体可根据目标业务的用户认证之后的具体操作确定,在此不做限制。

在一些可行的实施方式中,终端设备可在用户行为识别模型输出用户行为类别判断结果为异常用户行为时,在浏览器的业务操作页面或者客户端的业务操作页面上输出安全提示问题,提示用户按照安全提示问题进行答题以进行二次用户认证,基于安全提示问题的进一步用户认证可进一步规避异常用户的模拟认证,提高目标业务的安全性,适用性更强。可选的,若上述用户行为识别模块判定采集到的第一用户行为数据对应的用户行为类别为异常用户行为,且安全提示问题的认证不正确,则可阻断用户注册和/或登录应用账号的流程,或者将基于目标滑块验证码进行用户认证的用户信息上报目标业务的业务管理员或者网络工程师等网络管理员。例如,终端设备可向网络管理员发出提示信号或者警报或者预警邮件等,以将上述用户信息上报给网络管理员并提示网络管理员进行启动目标业务的用户行为类别的人工侦测,提高目标业务的网络安全性。

本申请实施例通过目标业务的用户群数据库或者基于大数据分析获取得到的样本数据作为用于目标业务的用户行为识别模型训练的样本数据,通过logistics回归算法构建用户行为识别模型。基于用户行为识别模型,可对获取到的用于触发启动目标业务的用户操作数据及其对应的用户标识信息进行用户行为类别的判定,进而可基于用户行为识别模型识别得到的用户行为类别响应目标业务的用户认证。若基于用户行为类别确定完成目标业务的用户认证则可启动目标业务,否则断开目标业务的用户认证,操作简单,基于用户行为识别模型对用户行为类别进行判断可克服单机独立进行数据处理的硬件条件限制,进而可提高用户行为识别的数据处理效率,提高启动目标业务的用户行为类别的判定准确率。可选的,基于用户行为识别模型检测得到异常用户的用户行为时,还可将基于异常用户的用户信息上报目标业务的业务管理员或者网络工程师等网络管理员进而可保证目标业务的用户数据安全性,适用性更高。

参见图4,图4是本申请实施例提供的基于预测模型的用户行为识别装置的结构示意图。本申请实施例提供的基于预测模型的用户行为识别装置包括:

数据获取单元41,用于获取用于触发启动目标业务的第一用户操作数据,并确定上述第一用户操作数据所关联的第一用户标识信息。

用户行为识别单元42,用于基于上述目标业务的用户行为识别模型,确定出上述数据获取单元41得到的第一用户操作数据和上述第一用户标识信息对应的目标用户行为类别,上述用户行为识别模型由触发启动上述目标业务的样本数据训练得到,上述样本数据中至少包括第一类别用户行为对应的第一用户行为样本数据和第二类别用户行为对应的第二用户行为样本数据,任一用户行为样本数据中均包括用户操作数据和/或用户标识信息。

认证响应单元43,用于根据上述用户行为识别单元42确定的目标用户行为类别完成上述目标业务的用户认证并启动上述目标业务,或者根据上述目标用户行为类别断开上述目标业务的用户认证。

在一些可行的实施方式中,上述数据获取单元41还用于:

获取至少两种类别用户行为的样本数据,上述样本数据用于上述用户行为识别模型训练,上述样本数据中至少包括上述第一用户行为样本数据和上述第二用户行为样本数据;

上述用户行为识别单元42,用于:

将上述数据获取单元获取的样本数据作为上述用户行为识别模型的输入,通过上述用户行为识别模型对上述样本数据进行学习以获取识别任一用户操作数据和/或用户标识信息对应的用户行为类别的能力。

在一些可行的实施方式中,上述用户行为识别单元42用于:

通过上述用户行为识别模型,基于logistics回归算法以第一类别用户行为和第二类别用户行为的二分类问题对上述至少两种类别用户行为中各类别用户行为对应的用户操作数据和/或用户标识信息进行学习,以获得识别目标类别用户行为参数并基于上述目标类别用户行为参数确定出任一用户操作数据和/或用户标识信息对应的用户行为类别的能力。

在一些可行的实施方式中,上述数据获取单元41用于:

从上述目标业务的用户群数据库中获取至少两种类别用户行为的样本数据;

其中,上述样本数据中包括上述用户群数据库包括的至少两种类别用户行为中各类别用户行为触发启动上述目标业务时的用户操作数据和/或用户标识信息。

在一些可行的实施方式中,上述数据获取单元41用于:

基于大数据分析从其他业务的用户群数据库中获取至少两种类别用户行为的样本数据,上述其他业务为与上述目标业务为相同类型业务且用户认证方式相同的一个或者多个业务;

其中,上述样本数据中包括上述其他业务的用户群数据库包括的至少两种类别用户行为中各类别用户行为触发启动上述其他业务时的用户操作数据和/或用户标识信息。

在一些可行的实施方式中,上述第一类别用户行为包括正常用户行为,上述第二类别用户行为包括异常用户行为;上述认证响应单元43用于:

当上述目标用户行为类别为正常用户行为时,完成上述目标业务的用户认证并且进入上述目标业务的业务办理界面;

当上述用户行为类别为异常用户行为时,关闭上述目标业务的用户认证界面以断开上述目标业务的用户认证,并将上述异常用户行为对应的用户标识信息上报上述目标业务对应的网络管理员。

在一些可行的实施方式中,上述第一用户操作数据和/或上述样本数据中任一用户操作数据中所包含的数据类型包括:用户操作时段、用户操作频率、用户操作的终端设备安全属性信息以及用户的页面操作数据的一种或者多种;

上述第一用户标识信息和/或上述样本数据中任一用户标识信息中所包含的数据类型包括:用户的业务账号信息、用户身份信息、用户身份信息所绑定的联系信息、用户所使用的终端设备信息以及用户所处地理位置信息中的一种或者多种。。

在一些可行的实施方式中,上述基于预测模型的用户行为识别装置可通过其内置的各个功能模块执行如上述图1至图3中各个步骤所提供的实现方式。可选的,上述基于预测模型的用户行为识别装置可为上述各个实施例中所描述的终端设备,在此不做限制。例如,上述数据获取单元41可用于执行上述各个步骤中用户操作数据、用户标识信息以及样本数据等数据的获取,具体可参见上述各个步骤所提供的实现方式,在此不再赘述。上述用户行为识别单元42可用于执行上述各个步骤中基于用户行为识别模型的用户行为类别的判定等实现方式,具体可参见上述各个步骤所提供的实现方式,在此不再赘述。上述认证响应单元43可用于执行上述各个实施例中基于用户行为识别模型输出的判定结果进行用户认证响应的相关实现方式,具体可参见上述各个步骤所提供的实现方式,在此不再赘述。

在本申请实施例中,基于预测模型的用户行为识别装置可通过目标业务的用户群数据库或者基于大数据分析获取得到的样本数据作为用于目标业务的用户行为识别模型训练的样本数据,通过logistics回归算法构建用户行为识别模型。基于用户行为识别模型,可对获取到的用于触发启动目标业务的用户操作数据及其对应的用户标识信息进行用户行为类别的判定,进而可基于用户行为识别模型识别得到的用户行为类别响应目标业务的用户认证。若基于用户行为类别确定完成目标业务的用户认证则可启动目标业务,否则断开目标业务的用户认证,操作简单,基于用户行为识别模型对用户行为类别进行判断可克服单机独立进行数据处理的硬件条件限制,进而可提高用户行为识别的数据处理效率,提高启动目标业务的用户行为类别的判定准确率。可选的,基于用户行为识别模型检测得到异常用户的用户行为时,还可将基于异常用户的用户信息上报目标业务的业务管理员或者网络工程师等网络管理员进而可保证目标业务的用户数据安全性,适用性更高。

参见图5,图5是本申请实施例提供的终端设备的结构示意图。如图5所示,本实施例中的终端设备可以包括:一个或多个处理器501和存储器502。上述处理器501和存储器502通过总线503连接。存储器502用于存储计算机程序,该计算机程序包括程序指令,处理器501用于执行存储器502存储的程序指令,执行如下操作:

获取用于触发启动目标业务的第一用户操作数据,并确定上述第一用户操作数据所关联的第一用户标识信息;

基于上述目标业务的用户行为识别模型,确定出上述第一用户操作数据和上述第一用户标识信息对应的目标用户行为类别,上述用户行为识别模型由触发启动上述目标业务的样本数据训练得到,上述样本数据中至少包括第一类别用户行为对应的第一用户行为样本数据和第二类别用户行为对应的第二用户行为样本数据,任一用户行为样本数据中均包括用户操作数据和/或用户标识信息;

根据上述目标用户行为类别完成上述目标业务的用户认证并启动上述目标业务,或者根据上述目标用户行为类别断开上述目标业务的用户认证。

在一些可行的实施方式中,上述处理器501还用于:

获取至少两种类别用户行为的样本数据,上述样本数据用于上述用户行为识别模型训练,上述样本数据中至少包括上述第一用户行为样本数据和上述第二用户行为样本数据;

将上述样本数据作为上述用户行为识别模型的输入,通过上述用户行为识别模型对上述样本数据进行学习以获取识别任一用户操作数据和/或用户标识信息对应的用户行为类别的能力。

在一些可行的实施方式中,上述处理器501用于:

通过上述用户行为识别模型,基于logistics回归算法以第一类别用户行为和第二类别用户行为的二分类问题对上述至少两种类别用户行为中各类别用户行为对应的用户操作数据和/或用户标识信息进行学习,以获得识别目标类别用户行为参数并基于上述目标类别用户行为参数确定出任一用户操作数据和/或用户标识信息对应的用户行为类别的能力。

在一些可行的实施方式中,上述处理器501用于:

从上述目标业务的用户群数据库中获取至少两种类别用户行为的样本数据;

其中,上述样本数据中包括上述用户群数据库包括的至少两种类别用户行为中各类别用户行为触发启动上述目标业务时的用户操作数据和/或用户标识信息。

在一些可行的实施方式中,上述处理器501用于:

基于大数据分析从其他业务的用户群数据库中获取至少两种类别用户行为的样本数据,上述其他业务为与上述目标业务为相同类型业务且用户认证方式相同的一个或者多个业务;

其中,上述样本数据中包括上述其他业务的用户群数据库包括的至少两种类别用户行为中各类别用户行为触发启动上述其他业务时的用户操作数据和/或用户标识信息。

在一些可行的实施方式中,上述第一类别用户行为包括正常用户行为,上述第二类别用户行为包括异常用户行为;上述处理器501用于:

当上述目标用户行为类别为正常用户行为时,完成上述目标业务的用户认证并且进入上述目标业务的业务办理界面;

当上述用户行为类别为异常用户行为时,关闭上述目标业务的用户认证界面以断开上述目标业务的用户认证,并将上述异常用户行为对应的用户标识信息上报上述目标业务对应的网络管理员。

在一些可行的实施方式中,上述第一用户操作数据和/或上述样本数据中任一用户操作数据中所包含的数据类型包括:用户操作时段、用户操作频率、用户操作的终端设备安全属性信息以及用户的页面操作数据的一种或者多种;

上述第一用户标识信息和/或上述样本数据中任一用户标识信息中所包含的数据类型包括:用户的业务账号信息、用户身份信息、用户身份信息所绑定的联系信息、用户所使用的终端设备信息以及用户所处地理位置信息中的一种或者多种。

在一些可行的实施方式中,上述处理器501可以是中央处理单元(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

该存储器502可以包括只读存储器和随机存取存储器,并向处理器501提供指令和数据。存储器502的一部分还可以包括非易失性随机存取存储器。例如,存储器502还可以存储设备类型的信息。

具体实现中,上述终端设备可通过其内置的各个功能模块执行如上述图1至图3中各个步骤所提供的实现方式,具体可参见上述各个步骤所提供的实现方式,在此不再赘述。

在本申请实施例中,终端设备可通过目标业务的用户群数据库或者基于大数据分析获取得到的样本数据作为用于目标业务的用户行为识别模型训练的样本数据,通过logistics回归算法构建用户行为识别模型。基于用户行为识别模型,可对获取到的用于触发启动目标业务的用户操作数据及其对应的用户标识信息进行用户行为类别的判定,进而可基于用户行为识别模型识别得到的用户行为类别响应目标业务的用户认证。若基于用户行为类别确定完成目标业务的用户认证则可启动目标业务,否则断开目标业务的用户认证,操作简单。基于用户行为识别模型对用户行为类别进行判断可克服单机独立进行数据处理的硬件条件限制,进而可提高用户行为识别的数据处理效率,提高启动目标业务的用户行为类别的判定准确率。可选的,基于用户行为识别模型检测得到异常用户的用户行为时,还可将基于异常用户的用户信息上报目标业务的业务管理员或者网络工程师等网络管理员进而可保证目标业务的用户数据安全性,适用性更高。

本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序包括程序指令,该程序指令被处理器执行时实现图1至图3中各个步骤所提供的基于预测模型的用户行为识别方法,具体可参见上述各个步骤所提供的实现方式,在此不再赘述。

上述计算机可读存储介质可以是前述任一实施例提供的基于预测模型的用户行为识别装置或者上述终端设备的内部存储单元,例如电子设备的硬盘或内存。该计算机可读存储介质也可以是该电子设备的外部存储设备,例如该电子设备上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,该计算机可读存储介质还可以既包括该电子设备的内部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该电子设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。

本申请的权利要求书和说明书及附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1