一种账号识别方法、装置及系统与流程

文档序号：14073270阅读：174来源：国知局

本发明涉及网络数据处理技术领域，尤其涉及一种账号识别方法、装置及系统。

背景技术：

随着互联网技术的快速发展，人们的生活越来越离不开互联网。用户可以在互联网平台注册账号以使用互联网平台提供的服务。目前，用户在互联网平台注册账号后，登记正确的身份证信息(例如包括身份证号码、姓名、身份证地址、用户照片等信息)，即被认为该账号已经实名。然而，目前，账号被转卖或盗用的情况较为严重。特别地，有些人尤其是一些不法分子会购买其他人的身份信息，甚至是已经实名认证过的账号进行网络欺诈等违法犯罪行为。由于冒名作案，案发后很难定位到真正的责任人，导致网络犯罪十分猖獗。另外，当账号被不法分子盗用后，由于互联网平台无法及时监控到账号的盗用情况，可能导致用户的财产损失。

在相关技术中，存在异地登录验证的技术对账号进行监控，即当使用者登录账号的地址发生改变时，提示进行账号使用者的身份验证。

综上，相关技术虽然具有异地登录验证的技术，但是缺少能够持续、准确识别账户(即账号)与账户使用者之间关联性的方法。

技术实现要素：

以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。

本申请实施例提供一种账号识别方法、装置及系统，能够持续、准确识别账号与使用者之间的关联性，以提高网络安全性。

本申请实施例提供一种账号识别方法，用于识别待识别账号与使用者之间的关联性，其中，从待识别账号在预定时长内的用户行为信息中能够提取多个特征，所述账号识别方法包括：根据待识别账号的待判断的用户行为信息，确定待识别账号的待判断的特征；将待识别账号的待判断的特征与所述多个特征分别进行比较，得到多个比较结果；根据多个比较结果，识别待识别账号与使用者之间的关联性。

其中，根据多个比较结果，识别待识别账号与使用者之间的关联性，包括：

通过对多个比较结果使用用户识别模型进行计算，来识别待识别账号与使用者之间的关联性；或者，

通过判断多个比较结果是否满足预定条件，来识别待识别账号与使用者之间的关联性。

其中，所述账号识别方法还包括：通过以下方式之一从待识别账号在预定时长内的用户行为信息中提取多个特征：

从待识别账号在预定时长内的用户行为信息中提取多个用户习惯特征；

从待识别账号在预定时长内的用户行为信息中提取用户关系特征以及至少一个用户习惯特征。

其中，用户行为信息包括多个用户行为特征，每个用户行为特征对应有一个或多个特征值；

通过以下方式从待识别账号在预定时长内的用户行为信息中提取用户习惯特征：

从预定时长内的用户行为信息中，确定用户行为特征对应的一个或多个特征值；

针对每个用户行为特征，分别确定所述一个或多个特征值中满足第一预设条件的特征值，并将所述满足第一预设条件的特征值确定为用户习惯特征；

其中，所述第一预设条件包括以下至少之一：使用次数最多；使用时长最长；使用次数和使用时长的加权和最大。

其中，所述从待识别账号在预定时长内的用户行为信息中提取用户关系特征，包括：

根据预定时长内的用户行为信息，分别确定第一关系分值和第二关系分值；其中，所述第一关系分值包括所述待识别账号和每个第一关联特征之间的关系分值，所述第一关联特征是和所述待识别账号相关联的关联特征；所述第二关系分值包括关系账号与所关联的第一关联特征之间的关系分值，所述关系账号指除所述待识别账号外，与任一第一关联特征有关联的账号；

根据所述第一关系分值和第二关系分值，确定所述待识别账号和每个关系账号之间的第三关系分值；

根据所述第三关系分值，确定所述待识别账号的用户关系特征；

其中，所述关联特征指能够构建不同账号之间关系的用户行为特征的特征值。

其中，所述用户关系特征包括：满足第二预设条件的关系账号，其中，所述第二预设条件包括：关系账号与所述待识别账号之间的第三关系分值大于或等于第一阈值，或者，第三关系分值在由高至低的排序中属于前n个，n为正整数。

其中，所述将所述待识别账号的待判断的特征与所述多个特征分别进行比较，得到多个比较结果，包括：

在所述待判断的特征包括待判断的用户行为特征，且所述多个特征中包括与所述待判断的用户行为特征对应的用户习惯特征时，比较所述待判断的用户行为特征的特征值与所述用户习惯特征是否一致，得到比较结果；

在所述多个特征中包括用户关系特征，且所述待判断的特征包括待判断的用户关系特征时，计算所述待判断的用户关系特征和所述多个特征中包括的用户关系特征之间的杰卡德距离，比较所述杰卡德距离和第二阈值，得到比较结果。

其中，所述通过对所述多个比较结果使用用户识别模型进行计算，来识别所述待识别账号与使用者之间的关联性之前，所述账号识别方法还包括：通过以下步骤得到所述用户识别模型：

选取样本数据，所述样本数据包括已知的使用者发生改变的账号的数据；利用所述样本数据对机器学习算法模型进行训练，得到所述用户识别模型。

其中，所述对所述多个比较结果使用用户识别模型进行计算，来识别所述待识别账号与使用者之间的关联性，包括：

对所述多个比较结果使用用户识别模型进行计算，得到所述待识别账号的使用者没有改变的概率值；在所述概率值大于第三阈值时，识别所述待识别账号的使用者没有改变；在所述概率值小于或等于第三阈值时，识别所述待识别账号的使用者发生改变。

其中，所述从待识别账号在预定时长内的用户行为信息中提取多个特征，包括：

从所述待识别账号的注册时刻起，在每个信息获取时刻，从预定时长内的用户行为信息中提取多个特征；

其中，所述预定时长指所述待识别账号的注册时刻与最新的信息获取时刻之间的时长，或者，所述预定时长指相邻的信息获取时刻之间的间隔时长。

本申请实施例还提供一种账号识别装置，用于识别待识别账号与使用者之间的关联性，所述账号识别装置包括：

第一获取模块，用于从待识别账号在预定时长内的用户行为信息中提取多个特征；

第二获取模块，用于根据所述待识别账号的待判断的用户行为信息，确定所述待识别账号的待判断的特征；

比较模块，用于将所述待识别账号的待判断的特征与所述多个特征分别进行比较，得到多个比较结果；

识别模块，用于根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性。

其中，所述识别模块，用于通过以下方式根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性：

通过对所述多个比较结果使用用户识别模型进行计算，来识别所述待识别账号与使用者之间的关联性；或者，

通过判断所述多个比较结果是否满足预定条件，来识别所述待识别账号与使用者之间的关联性。

其中，所述第一获取模块，用于通过以下方式之一从待识别账号在预定时长内的用户行为信息中提取多个特征：

从待识别账号在预定时长内的用户行为信息中提取多个用户习惯特征；

从待识别账号在预定时长内的用户行为信息中提取用户关系特征以及至少一个用户习惯特征。

其中，所述用户行为信息包括多个用户行为特征，每个用户行为特征对应有一个或多个特征值；

所述第一获取模块，用于通过以下方式从待识别账号在预定时长内的用户行为信息中提取用户习惯特征：

从预定时长内的用户行为信息中，确定用户行为特征对应的一个或多个特征值；

针对每个用户行为特征，分别确定所述一个或多个特征值中满足第一预设条件的特征值，并将所述满足第一预设条件的特征值确定为用户习惯特征；

其中，所述第一预设条件包括以下至少之一：使用次数最多；使用时长最长；使用次数和使用时长的加权和最大。

其中，所述第一获取模块，用于通过以下方式从待识别账号在预定时长内的用户行为信息中提取用户关系特征：

根据所述第一关系分值和第二关系分值，确定所述待识别账号和每个关系账号之间的第三关系分值；

根据所述第三关系分值，确定所述待识别账号的用户关系特征；

其中，所述关联特征指能够构建不同账号之间关系的用户行为特征的特征值。

其中，所述用户关系特征包括：满足第二预设条件的关系账号，所述第二预设条件包括：关系账号与所述待识别账号之间的第三关系分值大于或等于第一阈值，或者，第三关系分值在由高至低的排序中属于前n个，n为正整数。

其中，所述比较模块，用于通过以下方式将待判断的特征与所述多个特征分别进行比较，得到多个比较结果：

其中，所述账号识别装置还包括：模型建立模块，用于通过以下步骤得到所述用户识别模型：选取样本数据，所述样本数据包括已知的使用者发生改变的账号的数据；利用所述样本数据对机器学习算法模型进行训练，得到所述用户识别模型。

其中，所述识别模块，用于通过以下方式对所述多个比较结果使用用户识别模型进行计算，来识别所述待识别账号与使用者之间的关联性：

其中，所述第一获取模块，用于通过以下方式从待识别账号在预定时长内的用户行为信息中提取多个特征：

从所述待识别账号的注册时刻起，在每个信息获取时刻，从预定时长内的用户行为信息中提取多个特征；

其中，所述预定时长指所述待识别账号的注册时刻与最新的信息获取时刻之间的时长，或者，所述预定时长指相邻的信息获取时刻之间的间隔时长。

本申请实施例还提供一种账号识别系统，用于识别待识别账号与使用者之间的关联性，所述账号识别系统包括：第一装置以及第二装置；

所述第一装置，用于从待识别账号在预定时长内的用户行为信息中提取多个特征，根据所述待识别账号的待判断的用户行为信息，确定所述待识别账号的待判断的特征，将所述待判断的特征与所述多个特征分别进行比较，得到多个比较结果，并将所述多个比较结果发送给所述第二装置；

所述第二装置，用于接收所述第一装置发送的所述多个比较结果，根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性。

其中，所述第二装置用于通过以下方式根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性：

通过对所述多个比较结果使用用户识别模型进行计算，来识别所述待识别账号与使用者之间的关联性；或者，

通过判断所述多个比较结果是否满足预定条件，来识别所述待识别账号与使用者之间的关联性。

其中，所述第一装置还用于通过以下方式得到所述用户识别模块：选取样本数据，其中，所述样本数据包括已知的使用者发生改变的账号的数据；利用所述样本数据对机器学习算法模型进行训练，得到所述用户识别模型；

所述第一装置还用于将得到的所述用户识别模型发送给所述第二装置。

本申请实施例还提供一种用于账号识别的数据处理电子设备，包括：存储器和处理器；所述存储器用于存储用于账号识别的程序，所述用于账号识别的程序在被所述处理器读取执行时，执行如下操作：根据所述待识别账号的待判断的用户行为信息，确定所述待识别账号的待判断的特征；将所述待识别账号的待判断的特征与多个特征分别进行比较，得到多个比较结果；根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性，其中，所述多个特征是从待识别账号在预定时长内的用户行为信息中提取的。

在本申请实施例中，从待识别账号在预定时长内的用户行为信息中能够提取多个特征；根据所述待识别账号的待判断的用户行为信息，确定所述待识别账号的待判断的特征；将待判断的特征与所述多个特征分别进行比较，得到多个比较结果；根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性。本申请实施例依赖于大数据挖掘，深度剖析用户线上行为的多个特征维度，实现有效地识别账号与账号使用者之间的关联性，例如监控账号的使用者是否发生改变，以提高网络安全性。

在阅读并理解了附图和详细描述后，可以明白其他方面。

附图说明

图1为本申请实施例一提供的账号识别方法的流程图；

图2为本申请实施例一中账号与关联特征的关系示例图；

图3为本申请实施例一中账号之间的关系示例图；

图4为本申请实施例三提供的账号识别装置的示意图；

图5为本申请实施例四提供的账号识别系统的示意图。

具体实施方式

以下结合附图对本申请实施例进行详细说明，应当理解，以下所说明的实施例仅用于说明和解释本申请，并不用于限定本申请。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

需要说明的是，如果不冲突，本申请实施例以及实施例中的特征可以相互结合，均在本申请的保护范围之内。另外，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

术语定义：

用户行为：指账号(即账户)的使用者使用该账号进行的操作行为，例如，账号注册、身份认证、网页浏览、账号修改、账号登陆等。

用户行为信息：指账号的使用者使用该账号进行的操作行为所产生的信息，例如，账号的注册行为信息(下面简称账号注册信息)、身份认证行为信息(下面简称身份认证信息)、网页浏览行为信息(下面简称网页浏览信息)、账号修改行为信息(下面简称账号修改信息)、账号登录行为信息(下面简称账号登录信息)等。

用户行为特征：指反映用户行为相关指标的数据，例如，账号进行用户行为所使用的设备信息、所使用的手机号码、所使用的收货地址等。

用户行为特征对应的特征值：指用户行为特征的具体数据，例如当用户行为特征为用户所使用的手机号码时，对应的特征值可以为手机号码1、手机号码2等，即具体的手机号码。

用户习惯特征：指用户行为特征对应的一个或多个特征值中满足相应条件的特征值；例如，当用户采用的收货地址包括收货地址a1、a2以及a3时，收货地址a1的使用次数最多，则用户习惯特征可以为：常用收货地址为收货地址a1。

关联特征：指能够构建不同账号之间关系的用户行为特征的特征值；例如，账号a1使用手机号码1进行过相应行为，账号a2也使用手机号码1进行过相应行为，则账号a1和账号a2之间的关联特征可以为手机号码1。

实施例一

图1为本申请实施例一提供的账号识别方法的流程图。本实施例提供一种账号识别方法，用于识别待识别账号与账号使用者之间的关联性，例如识别待识别账号的使用者(即用户)是否改变。本实施例提供的账号识别方法可以应用于服务端计算设备(例如，服务器)或者在服务端计算设备上运行的虚拟机。下面以应用于服务端计算设备为例进行说明。

于本实施例中，从待识别账号在预定时长内的用户行为信息中能够提取多个特征。所述多个特征可以包括多个用户习惯特征，或者，包括用户关系特征以及至少一个用户习惯特征。所述多个特征可以用于作为后续账号识别过程的参照特征。另外，在每次进行账号识别时，可以重新从待识别账号在预定时长内的用户行为信息中提取多个特征，或者，也可以使用之前已经提取得到的多个特征。本申请对此并不限定。下面以先从待识别账号在预定时长内的用户行为信息中提取多个特征，再利用所述多个特征进行账号识别的过程为例进行说明。

如图1所示，本实施例提供的账号识别方法，可以包括以下步骤：

步骤101：从待识别账号在预定时长内的用户行为信息中提取多个特征。

于本实施例中，当用户在互联网平台(例如，京东商城等电商平台以及qq等社交平台)注册账号后，互联网平台的后台服务器会记录用户通过该账号进行的操作信息(即，用户行为信息)，并将每个账号的所有用户行为信息按照时间顺序保存到数据库中，例如以日志的方式进行保存。

于本实施例中，步骤101可以包括：从待识别账号的注册时刻起，在每个信息获取时刻，从预定时长内的用户行为信息中提取多个特征。其中，所述预定时长可以指待识别账号的注册时刻与最新的信息获取时刻之间的时长。于本实施例中，所述信息获取时刻可以周期性设置，即从待识别账号的注册时刻起，可以周期性地从预定时长内的用户行为信息中提取多个特征。

可选地，从待识别账号的注册时刻起，可以在每天的固定时刻(即前述的信息获取时刻为固定设置或周期性设置)，从注册时刻与最新的固定时刻之间的时长内的用户行为信息中提取多个特征。或者，所述信息获取时刻可以根据指令触发确定，即从待识别账号的注册时刻起，在接收到触发指令时，从预定时长(即注册时刻与指令触发时刻之间的时长)内的用户行为信息中提取多个特征。然而，本申请对此并不限定。

于本实施例中，不管采用何种方式触发信息获取时刻，多个特征是从待识别账号的注册时刻至最新的信息获取时刻期间发生的用户行为信息中提取的。然而，在另一些实现方式中，所述预定时长可以指相邻的信息获取时刻之间的间隔时长。即，多个特征是从最新的信息获取时刻与前一个信息获取时刻期间的用户行为信息中提取的。

例如，从待识别账号的注册时刻t0起，在t1时刻，可以从t0至t1时刻内的用户行为信息中提取多个特征，之后，在t2时刻，可以从t0至t2时刻内的用户行为信息中提取多个特征，之后，在t3时刻，可以从t0至t3时刻内的用户行为信息中提取多个特征，其中，t3-t2等于t2-t1等于t1-t0；或者，从待识别账号的注册时刻t0起，在t1时刻，可以从t0至t1时刻内的用户行为信息中提取多个特征，之后，在t2时刻，可以从t1至t2时刻内的用户行为信息中提取多个特征，之后，在t3时刻，可以从t2至t3时刻内的用户行为信息中提取多个特征。

于本实施例中，用户行为信息可以包括以下一项或多项：账号注册信息、身份认证信息、账号登录信息、网络浏览信息、交易信息、账号修改信息、聊天信息：

其中，账号注册信息可以包括以下一项或多项：账号注册时间、手机号码、邮箱地址、账号名称、账号密码、进行账号注册所使用的网络信息(例如，ip地址、wifi地址)、进行账号注册时的地理位置信息(例如，gps(globalpositioningsystem，全球定位系统)信息)；

身份认证信息可以包括以下一项或多项：认证时间、身份证号码、姓名、身份证地址、进行身份认证所使用的设备信息、进行身份认证所使用的网络信息、进行身份认证时的地理位置信息、实人生物信息(例如，指纹、人脸信息)；

账号登录信息可以包括以下一项或多项：登录时间、账号登录所使用的设备信息、账号登录所使用的网络信息、进行账号登录时的地理位置信息、实人生物信息；

网络浏览信息可以包括以下一项或多项：浏览的网页地址、浏览时间、浏览时长、收藏的网址、进行网络浏览所使用的设备信息、进行网络浏览所使用的网络信息、进行网络浏览时的地理位置信息；

交易信息可以包括以下一项或多项：购买信息、售卖信息、进行网络交易所使用的设备信息、网络信息以及地理位置信息；其中，购买信息包括收货信息，收货信息包括：收货姓名、收货手机号、收货地址；

账号修改信息可以包括以下一项或多项：账号修改时间、账号修改的内容(例如，密码、账号名称、密码提示问题等)、进行账号修改所使用的设备信息、网络信息以及地理位置信息；

聊天信息可以包括以下一项或多项：聊天对象、聊天时间、进行聊天所使用的设备信息、网络信息以及地理位置信息。

上述用户行为信息仅为举例，本申请对此并不限定。

于本实施例中，步骤101可以包括以下之一：

从待识别账号在预定时长内的用户行为信息中提取多个用户习惯特征；

从待识别账号在预定时长内的用户行为信息中提取用户关系特征以及至少一个用户习惯特征。

于本实施例中，所述用户行为信息包括多个用户行为特征，每个用户行为特征对应有一个或多个特征值；

其中，可以通过以下方式从待识别账号在预定时长内的用户行为信息中提取用户习惯特征：

从预定时长内的用户行为信息中，确定用户行为特征对应的一个或多个特征值；

针对每个用户行为特征，分别确定所述一个或多个特征值中满足第一预设条件的特征值，并将所述满足第一预设条件的特征值确定为用户习惯特征；其中，根据一个用户行为特征可以对应确定一个用户习惯特征；

其中，所述第一预设条件包括以下至少之一：使用次数最多；使用时长最长；使用次数和使用时长的加权和最大。

于本实施例中，针对每个账号，通过时间轴梳理用户行为之后，随着账号的使用时间的增长，越来越多的用户行为会被记录下来，因此，可以根据这些用户行为信息抽象出用户习惯特征。

于此，假设用户习惯特征的矩阵为h，则h可以表示如下式：

h＝<h1,h2,......,hm>；

上式表示用户有m种习惯特征，例如习惯使用的设备、经常链接的网页、常去的地理位置、常用的收货地址、常用的手机号码等。其中，m为大于或等于1的整数。

假设上述矩阵h中的一种习惯特征hm代表常用的收货地址，由于一个用户的收货地址可能会有若干个，于此，取使用次数最多的收货地址作为常用的收货地址，其计算公式如下：

hm＝max(x1,x2,......,xn)；

上式中表示有n个收货地址，xn表示第n个收货地址的使用次数，即xn＝fn。其中，n为正整数。

另外，假设上述矩阵h中的一种习惯特征hm代表习惯使用的设备，此时设备的链接使用时长比使用次数更具有参考性，因此，取链接使用时长最长的设备作为习惯使用的设备，其计算公式如下：

hm＝max(x1,x2,......,xn)；

上式中表示使用了n个设备，xn表示第n个设备的使用时长，即xn＝tn。其中，n为正整数。

举例而言，用户行为特征例如包括用户采用的收货地址、用户登录账号使用的设备；用户采用的收货地址例如对应以下取值(即特征值)：收货地址a1、收货地址a2、收货地址a3；用户登录账号使用的设备例如对应以下取值(即特征值)：设备b1、设备b2、设备b3。于此，在确定用户常用的收货地址时，将预定时长内上述三个收货地址中使用次数最多的收货地址作为常用收货地址，例如收货地址a1；在确定习惯使用的设备时，将预定时长内，上述三个设备中使用时长最长的设备作为习惯使用的设备，例如设备b1。

类似地，常用的收货姓名、常用的手机号码等用户习惯特征可以采用与常用的收货地址相同的确定方式进行确定。经常链接的网页、常去的地理位置等用户习惯特征可以采用与习惯使用的设备相同的确定方式进行确定。

然而，本申请对此并不限定。在另一些实施方式中，可以综合考虑用户行为特征对应的一个或多个特征值的使用次数和使用时长来确定用户习惯特征。举例而言，假设上述矩阵h中的一种习惯特征hm计算公式如下：

hm＝max(x1,x2,......,xn)；

上式中表示一个用户行为特征对应有n个特征值，xn表示第n个特征值的使用时长和使用次数的加权和，即xn＝a×fn+b×tn，fn表示使用次数，tn表示使用时长；a、b为权重，可以根据需要预先设置；n为正整数。

在一些实施方式中，可以根据用户习惯特征的属性，选择上述一种或多种方式来确定用户习惯特征。然而，本申请对此并不限定。

于本实施例中，所述从待识别账号在预定时长内的用户行为信息中提取用户关系特征，包括：

根据所述第一关系分值和第二关系分值，确定所述待识别账号和每个关系账号之间的第三关系分值；

根据所述第三关系分值，确定所述待识别账号的用户关系特征；

其中，所述关联特征指能够构建不同账号之间关系的用户行为特征的特征值。

于本实施例中，所述用户关系特征可以包括：满足第二预设条件的关系账号，其中，所述第二预设条件包括：关系账号与所述待识别账号之间的第三关系分值大于或等于第一阈值，或者，第三关系分值在由高至低的排序中属于前n个，n为正整数。其中，所述第一阈值和n值可以根据实际情况进行设置，本申请对此并不限定。

于本实施例中，当若干个账号都在同一个设备上登录过、有过用户行为时，则这些账号可以看作有一定关系；类似地，若干账号有相同的wifi地址、收货地址等也可以视作有关系。通过上述列举的几个关系可以看出，账号之间的关系是通过各种关联特征来链接在一起的，即通过关联特征来构建账号之间的关系。于本实施例中，可以作为关联特征的用户行为特征可以包括以下一项或多项：wifi地址、收货地址、邮箱地址、手机号码。

在确定账号之间的关系时，先确定账号与关联特征之间的关系。于本实施例中，刻画账号和关联特征的关系分值时，根据相应规则或经验设置价值权重，即账号在关联特征上的操作都会有一个价值权重w。比如账号在一个关联特征上的购买操作比添加购物车操作的价值权重要高。关于价值权重的设置规则可以根据实际情况进行确定，本申请对此并不限定。

于本实施例中，可以根据以下方式确定账号与关联特征的关系分值：

计算一账号在一关联特征上的操作行为的价值权重的第一和值，计算该关联特征(即用户行为特征的特征值)所属的用户行为特征上的所有操作行为的价值权重的第二和值；

计算所述第一和值除以所述第二和值的结果，并将所述结果乘以上述关联特征所属的用户行为特征对应的所有价值权重的最大值；

取上述乘积结果的二分之一次方，作为所述账号与所述关联特征的关系分值。

举例而言，如图2所示，在预定时长内账号a1在三个手机号(关联特征m1、m2、m3)上有过相应的用户行为。其中，购买行为的价值权重为w1，修改密码行为的价值权重为w2，绑定邮箱行为的价值权重为w3。

下面给出账号a1与关联特征m1(即手机号1)的关系分值的计算公式：

从上式可以看出如果用户在某一个关联特征上操作行为越多，行为的价值权重越重要，则关系分值就高。上式中max是为了调和这个关系分值，由于后面一个分式因子有可能为1，极端情况是该账号只有一个关联特征和一个行为，但是这个时候的r(a1,m1)并不一定是最大的，还要看这个账号在这个关联特征上所做动作的价值权重。

在确定每个账号和关联特征的关系分值(即，第一关系分值和第二关系分值)之后，通过关联特征将全量账号关联起来。下面先说明若干定义：

m(ai)表示账号ai所有相关联的关联特征的集合，即

m(ai)＝{m1,m2,......,mn}；

u(mk)表示关联特征mk上所有与之关联的账号的集合，即

u(mk)＝{a1,a2,......,an}；

账号ai和aj的关系分值(即前述的第三关系分值)可以根据下式计算：

其中，log函数的作用在于调和，以免分母项数很多的时候，这项分式总体的值急剧缩小。

通过上面的式子能够计算每个账号和关系账号的关系分值(即上述的第三关系分值)。针对一个待识别账号，根据计算得到和关系账号之间的所有第三关系分值，按照第三关系分值由大到小的顺序取前n个关系账号作为待识别账号的关系名单(即，前述的用户关系特征)。其中，n为正整数，n的取值根据实际需要确定，本申请对此并不限定。

下面简述一个实例。如图3所示，账号a1和a2通过关联特征m1和m2关联起来，账号a1还与关联特征m3有关系，账号a3与关联特征m1和m4有关系。根据账号之间的关系分值的计算公式，此处的账号a1和a2的关系分值可以根据下式计算：

于本实施例中，通过账号的用户关系特征，能够辅助判断账号背后的使用人，如果用户关系特征一旦发生剧变，则可以说明这个账号的用户很可能发生转变。

步骤102：根据待识别账号的待判断的用户行为信息，确定待识别账号的待判断的特征。

于本实施例中，待判断的特征可以包括：待判断的用户关系特征以及至少一个用户行为特征；或者，可以包括待判断的多个用户行为特征。

于本实施例中，所述待判断的特征可以根据以下任一方式确定：

根据预设周期确定待判断的用户行为信息；此时，针对一个待识别账号，在每个周期时刻，根据距离此周期时刻最近的一次用户行为信息，得到待判断的用户行为特征；根据该待识别账号的注册时刻至当前周期时刻之间的用户行为信息，或者，根据当前周期时刻之前一段时长内的用户行为信息，确定待判断的用户关系特征(例如，用户关系名单)；

根据指令触发确定待判断的用户行为信息；此时，针对一个待识别账号，在指令触发时刻，根据距离此指令触发时刻最近的一次用户行为信息，得到待判断的用户行为特征；根据该待识别账号的注册时刻至该指令触发时刻之间的用户行为信息，或者，根据所述指令触发时刻之前一段时长内的用户行为信息，确定待判断的用户关系特征；

根据待识别账号的最新用户行为发生时刻确定待判断的用户行为信息；此时，针对一个待识别账号，根据最新发生的用户行为信息，得到待判断的用户行为特征；根据该待识别账号的注册时刻至所述最新的用户行为发生时刻之间的用户行为信息，或者，根据所述最新的用户行为发生时刻之前一段时长内的用户行为信息，确定待判断的用户关系特征；

根据待识别账号的特定用户行为发生时刻确定待判断的用户行为信息；例如，根据待识别账号的用户登录地址发生改变时刻的用户行为信息，确定待判断的用户行为特征；根据待识别账号的注册时刻至所述登录地址发生改变时刻之间的用户行为信息，或者，根据所述登录地址发生改变时刻之前一段时长内的用户行为信息，确定待判断的用户关系特征。

然而，本申请对此并不限定，于其他实施方式中，还可以根据需要设置其他条件来确定待判断的特征。

步骤103：将待识别账号的待判断的特征与所述多个特征分别进行比较，得到多个比较结果。

本步骤中用于进行比较的多个特征为根据步骤101得到的多个特征。在一些实现方式中，在本次账号识别之后，再进行账号识别时，可以直接使用步骤101得到的多个特征，不需重复步骤101重新提取多个特征。

于本实施例中，本步骤可以包括：

其中，在所述多个特征中包括与所述待判断的用户行为特征对应的用户习惯特征时，若待判断的用户行为特征的特征值和用户习惯特征一致，则确定所述用户习惯特征对应的比较结果为第一数值，若待判断的用户行为特征的特征值与用户习惯特征不一致，则确定所述用户习惯特征对应的比较结果为第二数值；

在所述多个特征中包括用户关系特征，且所述待判断的特征包括待判断的用户关系特征时，计算待判断的用户关系特征和所述多个特征中包括的用户关系特征之间的杰卡德距离，若所述杰卡德距离小于第二阈值，则确定用户关系特征对应的比较结果为第三数值，若所述杰卡德距离大于或等于该第二阈值，则确定用户关系特征对应的比较结果为第四数值。

在所述多个特征中包括的用户习惯特征没有对应的待判断的用户行为特征时，可以确定所述用户习惯特征对应的比较结果为空。

于本实施例中，第一数值为1，表示正常，第二数值为0，表示异常。第三数值为0，表示异常，第四数值为1，表示正常。即，得到的比较结果为布尔类型。

例如，针对用户习惯特征，将最新的用户行为特征与对应的用户习惯特征进行匹配，如果最新的用户行为特征与用户习惯特征匹配，则确定该用户习惯特征的比较结果为1，否则，则确定该用户习惯特征比较结果为0。例如，某用户经常在杭州进行购物，突然当前有一个购买行为发生在北京，那么这就不符合习惯，故用户购买习惯特征异常，购买习惯的比较结果为0。若用户习惯特征与最新的用户行为特征没有对应关系，则设置该用户习惯特征对应的比较结果为空。例如，最新的用户行为特征不包括收货地址信息，则体现常用收货地址的用户习惯特征对应的比较结果可以设置为空。

于实际应用中，在步骤101提取到的用户习惯特征可能为多个，在本步骤得到的待判断的用户行为特征的数目可能小于或等于步骤101中提取到的用户习惯特征的数目。于本实施例中，比较结果的数目根据本步骤得到的待判断的特征(例如，根据最新的用户行为信息确定)包括的用户行为特征以及用户关系特征的数目确定，例如小于或等于步骤101提取到的特征的数目。

例如，针对用户关系特征，计算最新的关系名单(记为第一集合)和在步骤101确定的关系名单(记为第二集合)之间的杰卡德距离(jaccarddistance)。其中，将第一集合与第二集合的交集中的账号个数称为交集数目，将第一集合与第二集合的并集中的账号个数称为并集数目，则杰卡德距离等于交集数目除以并集数目的值。若杰卡德距离小于第二阈值，则可以判定该待识别账号的用户关系特征异常，对应的比较结果可以为0；若杰卡德距离大于或等于该第二阈值，则可以判定该待识别账号的用户关系特征正常，对应的比较结果可以为1。其中，第二阈值可以根据实际情况进行设置。

在得到每个用户习惯特征对应的比较结果以及用户关系特征对应的比较结果之后，可以将所有计算出的比较结果组合成特征向量x。

步骤104：根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性。

于本实施例中，通过对所述多个比较结果使用用户识别模型进行计算，来识别所述待识别账号与使用者之间的关联性。

于本实施例中，在步骤104之前，所述方法还包括：通过以下步骤得到所述用户识别模型：

选取样本数据，所述样本数据包括已知的使用者发生改变的账号的数据；利用所述样本数据对机器学习算法模型进行训练，得到所述用户识别模型。

于本实施例中，先通过模型训练得到用户识别模型，之后，在每次针对账号的识别过程中，可以直接将步骤103得到的特征向量放入用户识别模型进行计算，以识别账号与使用者之间的关联性。

于本实施例中，利用已有的身份冒用案件来沉淀人工标注的样本。利用这些样本进行模型训练。之后用训练好的用户识别模型，进行全量用户在线预测，就能够得出每一个账号身份的真实性分值。

于本实施例中，机器学习算法可以包括以下任一种：逻辑归回算法、随机森林算法、gbdt(gradientboostingdecisiontree，梯度提升决策树)、决策树算法、svm(supportvectormachine，支持向量机)算法、神经网络算法。

于本实施例中，以逻辑回归算法为例来构建用户识别模型。通过逻辑回归算法来求解特征向量的最优权重，得到非凸优化问题的近似最优解。

基于逻辑回归算法构建用户识别模型的说明如下：

一、给出sigmoid函数，该函数用于将模型输出结果平滑地映射到二值(0和1)：

二、给定特征向量及权重向量，于此，假设特征向量为n维，即，特征向量为x＝(x1,x2,......,xn)；由于利用人工标注样本进行有监督学习，人工在审核样本之后会给出是否为实人(账号的使用者是否发生改变)的标识，假设人工审核样本之后标注结果为y(answer)，若账号发生买卖(即账号的使用者发生改变)，则结果为0，未发生买卖(即账号的使用者没有改变)则结果为1，即y∈(0,1)；因此，给定特征权重向量如下：

θ^tx＝θ0+θ1x1+θ2x2+......+θnxn；

三、构造预测函数，上述的特征权重向量为特征向量加权之后的结果，上述特征权重向量放入sigmoid函数中计算得出模型预测的结果如下：

上式输出的结果hθ(x)表示值为1的概率，即账号的使用者身份未发生变异的概率值；

四、构造损失函数；假设一共有m个样本，则逻辑回归的损失函数如下：

于此，目标是找出一组最优的θ，让损失函数的值变得最小；运用梯度下降方法优化θ得出最小的损失函数，直接给出更新函数如下：

其中，更新函数中a表示模型训练速率，即学习率，这个值越小则越逼近最优解，但是模型训练速度会很慢，反之亦然，该值可以根据具体情况确定，本实施例中该值例如为0.01；表示第i个样本中第j个特征。θ就是模型训练得出的重要成果。

在得到训练后的用户识别模型之后，后续可以直接采用模型训练的结果θ对步骤103得到的特征向量加权后计算预测结果hθ(x)，得到的预测结果即为待识别账号的使用者没有改变的概率值。

于本实施例中，步骤104可以包括：

对所述多个比较结果使用用户识别模型进行计算，得到所述待识别账号的使用者没有改变的概率值；在所述概率值大于第三阈值时，识别所述待识别账号的使用者没有改变；在所述概率值小于或等于第三阈值时，识别所述待识别账号的使用者发生改变。其中，第三阈值可以根据实际情况进行设置。

在一些实现方式中，可以将概率值与第三阈值的比较过程也放入用户识别模型中，即，将多个比较结果放入用户识别模型之后，可以直接得到待识别账号的使用者是否发生改变的结果。

于本实施例中，在识别出账号的使用者发生改变时，可以提示用户进行实人认证，例如，要求认证用户的指纹、人脸等实人生物信息。在用户进行实人认证通过之后，才允许用户继续使用所述账号进行操作。

于本实施例中，基于互联网平台的大数据，抽象出用户习惯特征，提取用户关系特征，在后续对账号的用户行为进行监控时，基于用户习惯特征或者用户习惯特征和用户关系特征，通过用户识别模型的计算，进行账号与用户之间的关联性识别。

举例说明以下场景：

场景一

用户在互联网平台注册账号并进行实名认证后，没有使用该账号进行网页浏览或购物操作，就将该账号转卖给其他人，其他人使用该账号。针对这种情况，在用户注册账号并进行实名认证后，互联网平台根据该用户注册该账号的信息以及实名认证的信息，例如可以确定常用的手机号码、常去的地理位置、常用的姓名等习惯特征以及用户关系特征(例如，用户关系名单)；之后，互联网平台实时监控该账号的使用情况，在检测到该账号的使用行为(例如，其他人使用该账号进行网页浏览)时，可以确定该账号的最新的用户行为信息(例如包括当前使用的设备信息、当前的地理位置信息，以及当前用户关系名单等)。将用户注册账号后记录的信息与当前最新的用户行为信息进行比较，得到多个比较结果，对多个比较结果使用用户识别模型进行计算，判断该账号的使用者是否改变。此时，实际上由于使用者发生改变，因此，用户设备信息、地理位置信息、用户关系名单等均可能发生改变，根据上述改变可以识别使用者发生改变。互联网平台在识别账号的使用者改变后，提示账号的使用者进行活体检测、人脸识别等身份验证方式，以确保账号使用者为身份认证的本人。

场景二

用户在互联网平台注册账号后，在一个地方登录该账号进行网页浏览，在另一个地方又登录了该账号进行购物操作。互联网平台可以在用户每次使用该账号时，检测使用者是否改变。当用户在另一个地方登录该账号进行购物操作时，虽然地理位置信息发生了改变，但是，在该账号的用户关系特征以及其他习惯特征没有改变的情况下，互联网平台可以识别该账号的使用者没有改变，从而不会提示用户进行身份验证，相比于相关技术中，互联网平台发现账号的使用设备或者登录地点发生改变就提示用户进行验证的方式，本实施例提供的方案能够提升用户的使用体验。

综上所述，在本实施例中，通过电商数据的行为轨迹抽象出用户的习惯特征或者用户习惯特征和用户关系特征，结合多个用户习惯特征或者结合用户习惯特征和用户关系特征，能够持续、准确识别账号与使用者之间的关联性，例如账号是否发生身份买卖或是否被盗用。一旦监控到账号的使用者发生改变，则要求使用者进行活体检测或人脸识别等身份验证方式，以确保账号使用者为身份认证的本人，从而提高网络安全性。

实施例二

本实施例提供一种账号识别方法，用于识别待识别账号与使用者之间的关联性，例如识别待识别账号的使用者(即用户)是否改变。

本实施例提供的账号识别方法与实施例一的区别在于：在本实施例中，通过判断所述多个比较结果是否满足预定条件，来识别所述待识别账号与使用者之间的关联性。

于本实施例中，通过判断所述多个比较结果是否满足预定条件，来识别所述待识别账号与使用者之间的关联性可以包括：

分别计算每个比较结果与对应的权重的乘积，计算所有乘积的和值；

当所述和值大于第四阈值时，识别所述待识别账号的使用者没有发生改变；

在所述和值小于或等于第四阈值时，识别所述待识别账号的使用者发生改变。

于本实施例中，从待识别账号在预定时长内的用户行为信息中提取的每个特征对应有一个权重，所述权重可以是通过机器学习算法计算得到的。

其中，机器学习算法可以包括以下任一种：逻辑归回算法、随机森林算法、gbdt(gradientboostingdecisiontree，梯度提升决策树)、决策树算法、svm(supportvectormachine，支持向量机)算法、神经网络算法。例如，采用逻辑回归算法计算权重的过程可以参照实施例一，其中，θ即为得到的最优权重向量。

于本实施例中，在得到每个用户习惯特征对应的比较结果以及用户关系特征对应的比较结果之后，可以将所有计算出的比较结果组合成特征向量x，根据特征向量x和最优权重向量θ，计算特征权重向量：

θ^tx＝θ0+θ1x1+θ2x2+......+θnxn；

根据所述特征权重向量的结果来识别待识别账号与使用者之间的关联性。例如，当特征权重向量大于第四阈值时，识别所述待识别账号的使用者没有发生改变；在特征权重向量小于或等于第四阈值时，识别所述待识别账号的使用者发生改变。其中，第四阈值可以根据实际情况设置，本申请对此并不限定。

然而，本实施例并不限定于此。于其他实施方式中，还可以在多个比较结果中满足预定数值的数目大于或等于第五阈值时，识别待识别账号的使用者没有发生改变，在比较结果中满足预定数值的数目小于第五阈值时，识别待识别账号的使用者发生改变。在此实施方式中，基于实施例一中对比较结果的描述，当比较结果为布尔类型时，预定数值可以为1(表示正常)。即待判断的特征中正常特征的数目大于或等于第五阈值，则识别待识别账号的使用者没有发生改变。其中，第五阈值可以根据实际情况设置。

此外，关于本实施例的其他说明可以参照实施例一所述，故于此不再赘述。

实施例三

如图4所示，本实施例提供一种账号识别装置，用于识别待识别账号与使用者之间的关联性，所述账号识别装置包括：

第一获取模块，用于从待识别账号在预定时长内的用户行为信息中提取多个特征；

第二获取模块，用于根据所述待识别账号的待判断的用户行为信息，确定所述待识别账号的待判断的特征；

比较模块，用于将待识别账号的待判断的特征与所述多个特征分别进行比较，得到多个比较结果；

识别模块，用于根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性。

于本实施例中，所述第一获取模块，可以通过以下之一方式从待识别账号在预定时长内的用户行为信息中提取多个特征：

从待识别账号在预定时长内的用户行为信息中提取多个用户习惯特征；

从待识别账号在预定时长内的用户行为信息中提取用户关系特征以及至少一个用户习惯特征。

其中，所述用户行为信息包括多个用户行为特征，每个用户行为特征对应有一个或多个特征值；

所述第一获取模块可以通过以下方式从待识别账号在预定时长内的用户行为信息中提取用户习惯特征：

从预定时长内的用户行为信息中，确定用户行为特征对应的一个或多个特征值；

针对每个用户行为特征，分别确定所述一个或多个特征值中满足第一预设条件的特征值，并将所述满足第一预设条件的特征值确定为用户习惯特征；

其中，所述第一预设条件包括以下至少之一：使用次数最多；使用时长最长；使用次数和使用时长的加权和最大。

于本实施例中，所述第一获取模块，可以通过以下方式从待识别账号在预定时长内的用户行为信息中提取用户关系特征：

根据所述第一关系分值和第二关系分值，确定所述待识别账号和每个关系账号之间的第三关系分值；

根据所述第三关系分值，确定所述待识别账号的用户关系特征；

其中，所述关联特征指能够构建不同账号之间关系的用户行为特征的特征值。

于本实施例中，所述用户关系特征包括：满足第二预设条件的关系账号，所述第二预设条件包括：关系账号与所述待识别账号之间的第三关系分值大于或等于第一阈值，或者，第三关系分值在由高至低的排序中属于前n个，n为正整数。

于本实施例中，所述比较模块，可以用于通过以下方式将待判断的特征与所述多个特征分别进行比较，得到多个比较结果：

于本实施例中，所述识别模块，可以用于通过以下方式根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性：

通过对所述多个比较结果使用用户识别模型进行计算，来识别所述待识别账号与使用者之间的关联性；或者，

通过判断所述多个比较结果是否满足预定条件，来识别所述待识别账号与使用者之间的关联性。

于本实施例中，所述账号识别装置还可以包括：模型建立模块，用于通过以下步骤得到所述用户识别模型：选取样本数据，所述样本数据包括已知的使用者发生改变的账号的数据；利用所述样本数据对机器学习算法模型进行训练，得到所述用户识别模型。

于本实施例中，所述识别模块，可以用于通过以下方式对所述多个比较结果使用用户识别模型进行计算，来识别所述待识别账号与使用者之间的关联性：

于本实施例中，所述第一获取模块，可以用于通过以下方式从待识别账号在预定时长内的用户行为信息中提取多个特征：

从所述待识别账号的注册时刻起，在每个信息获取时刻，从预定时长内的用户行为信息中提取多个特征；

其中，所述预定时长指所述待识别账号的注册时刻与最新的信息获取时刻之间的时长，或者，所述预定时长指相邻的信息获取时刻之间的间隔时长。

关于本实施例提供的账号识别装置的处理流程可以参照实施例一所述的方法，故于此不再赘述。

实施例四

如图5所示，本实施例提供一种账号识别系统，用于识别待识别账号与使用者之间的关联性，所述账号识别系统包括：第一装置以及第二装置；

所述第一装置，用于从待识别账号在预定时长内的用户行为信息中提取多个特征，根据所述待识别账号的待判断的用户行为信息，确定所述待识别账号的待判断的特征，将待判断的特征与所述多个特征分别进行比较，得到多个比较结果，并将所述多个比较结果发送给所述第二装置；

所述第二装置，用于接收所述第一装置发送的所述多个比较结果，根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性。

于本实施例中，所述第二装置用于通过以下方式根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性：

通过对所述多个比较结果使用用户识别模型进行计算，来识别所述待识别账号与使用者之间的关联性；或者，

通过判断所述多个比较结果是否满足预定条件，来识别所述待识别账号与使用者之间的关联性。

于本实施例中，所述第一装置还用于通过以下方式得到所述用户识别模块：选取样本数据，所述样本数据包括已知的使用者发生改变的账号的数据；利用所述样本数据对机器学习算法模型进行训练，得到所述用户识别模型；

所述第一装置还用于将得到的所述用户识别模型发送给所述第二装置。

于本实施例中，第一装置可以是服务端计算设备或者在服务端计算设备上运行的虚拟机，第二装置可以是客户端计算设备或者不同于第一装置的服务端计算设备。

本实施例与实施例一的区别在于：在本实施例中，比较结果的确定过程以及用户识别模型的训练过程的执行主体与账号识别过程的执行主体是不同的。

于本实施例中，举例而言，服务端计算设备从待识别账号在预定时长内的用户行为信息中提取多个特征，根据待识别账号的待判断的用户行为信息，确定待识别账号的待判断的特征，将待判断的特征与所述多个特征分别进行比较，得到多个比较结果，并实时将所述多个比较结果发送给所述客户端计算设备；并且，所述服务端计算设备利用选取的样本数据进行模型训练，得到用户识别模型，并将训练后的用户识别模型发送给客户端计算设备；客户端计算设备对接收到的多个比较结果使用用户识别模型进行计算，得到所述待识别账号的使用者没有改变的概率值，并根据所述概率值，识别所述待识别账号的使用者是否改变。关于本实施例中相关过程的具体实现可以参照实施例一所述，故于此不再赘述。

实施例五

本发明实施例提供一种用于账号识别的数据处理电子设备，包括：存储器和处理器；所述存储器用于存储用于账号识别的程序，所述用于账号识别的程序在被所述处理器读取执行时，执行如下操作：根据所述待识别账号的待判断的用户行为信息，确定所述待识别账号的待判断的特征；将待判断的特征与多个特征分别进行比较，得到多个比较结果；根据所述多个比较结果，识别所述待识别账号与使用者之间的关联性，其中，所述多个特征是从待识别账号在预定时长内的用户行为信息中提取的。

另外，所述处理器执行的具体操作可以参照实施例一和实施例二所述，故于此不再赘述。

此外，本发明实施例还提供一种计算机可读存储介质，存储有计算机可执行指令，所述计算机可执行指令被处理器执行时实现所述的账号识别方法。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，例如通过集成电路来实现其相应功能，也可以采用软件功能模块的形式实现，例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本申请不限制于任何特定形式的硬件和软件的结合。

以上显示和描述了本申请的基本原理和主要特征和本申请的优点。本申请不受上述实施例的限制，上述实施例和说明书中描述的只是说明本申请的原理，在不脱离本申请精神和范围的前提下，本申请还会有各种变化和改进，这些变化和改进都落入要求保护的本申请范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：柯力
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：一种身份验证方法及其设备与流程
上一篇：服务器、许可证管理方法及许可证管理系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。