模型训练方法、特征序列生成方法和服务器与流程

文档序号：16252236发布日期：2018-12-12 00:08阅读：226来源：国知局

本说明书实施例涉及计算机技术领域，特别涉及一种模型训练方法、特征序列生成方法和服务器。

背景技术

随着互联网的发展，在实际业务的运营过程中，通常需要根据用户的行为数据来对该用户的风险水平进行评估，并根据评估结果来支撑业务的运营。例如，通常需要根据用户的行为数据来对该用户的账户风险水平进行评估，以识别该用户的账户是否为垃圾账户。另举一例，通常需要根据用户的行为数据来对该用户的交易数据风险水平进行评估，以识别该用户的交易数据是否为作弊交易数据。

在相关技术中，通常可以选取统计量，并可以根据选取的统计量来对该用户的风险水平进行评估。所述统计量例如可以包括最大值和平均值等。但是，一方面，统计量通常是根据用户经验来选取的，用户经验缺乏科学性和合理性；另一方面，统计量通常无法全面反映用户的行为特征。因此，上述根据统计量来对用户的风险水平进行评估的方法，准确率较低。

技术实现要素：

本说明书实施例的目的是提供一种模型训练方法、特征序列生成方法和服务器，以提高评估结果的准确性。

为实现上述目的，本说明书实施例提供一种模型训练方法，包括：获取至少一个用户在指定时间区间内的行为数据；确定所述行为数据对应的数据编码；以所述数据编码形成的矩阵为行为矩阵，使用所述行为矩阵训练基于编码模型和解码模型构建的数学模型，以使所述数学模型的输入和输出之间的差别满足预设条件。

为实现上述目的，本说明书实施例提供一种服务器，包括：获取单元，用于获取至少一个用户在指定时间区间内的行为数据；确定单元，用于确定所述行为数据对应的数据编码；训练单元，用于以所述数据编码形成的矩阵为行为矩阵，使用所述行为矩阵训练基于编码模型和解码模型构建的数学模型，以使所述数学模型的输入和输出之间的差别满足预设条件。

为实现上述目的，本说明书实施例提供一种服务器，包括：存储器，用于存储计算机指令；处理器，用于执行所述计算机指令实现以下步骤：获取至少一个用户在指定时间区间内的行为数据；确定所述行为数据对应的数据编码；以所述数据编码形成的矩阵为行为矩阵，使用所述行为矩阵训练基于编码模型和解码模型构建的数学模型，以使所述数学模型的输入和输出之间的差别满足预设条件。

为实现上述目的，本说明书实施例提供一种特征序列生成方法，包括：获取用户在指定时间区间内的行为数据；确定所述行为数据对应的数据编码；以所述数据编码形成的矩阵为行为矩阵，将所述行为矩阵输入至编码模型得到特征序列；所述特征序列用于表征所述用户的行为特征。

为实现上述目的，本说明书实施例提供一种服务器，包括：获取单元，用于获取用户在指定时间区间内的行为数据；确定单元，用于确定所述行为数据对应的数据编码；输入单元，用于以所述数据编码形成的矩阵为行为矩阵，将所述行为矩阵输入至编码模型得到特征序列；所述特征序列用于表征所述用户的行为特征。

为实现上述目的，本说明书实施例提供一种服务器，包括：存储器，用于存储计算机指令；处理器，用于执行所述计算机指令实现以下步骤：获取用户在指定时间区间内的行为数据；确定所述行为数据对应的数据编码；以所述数据编码形成的矩阵为行为矩阵，将所述行为矩阵输入至编码模型得到特征序列；所述特征序列用于表征所述用户的行为特征。

由以上本说明书实施例提供的技术方案可见，本说明书实施例中，服务器可以获取用户在指定时间区间内的行为数据；可以确定所述行为数据对应的数据编码；可以以所述数据编码形成的矩阵为行为矩阵，将所述行为矩阵输入至编码模型得到特征序列。所述特征序列可以用于表征用户的行为特征。所述特征序列是基于行为数据本身生成的，不依赖于用户经验，能够全面反映用户的行为特征。基于所述特征序列来对用户的风险水平进行评估，可以提高评估结果的准确性。

附图说明

为了更清楚地说明本说明书实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本说明书中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本说明书实施例一种模型训练方法的流程图；

图2为本说明书实施例一种序列到序列模型的功能结构示意图；

图3为本说明书实施例一种特征序列生成方法的流程图；

图4为本说明书实施例一种服务器的功能结构示意图；

图5为本说明书实施例一种服务器的功能结构示意图；

图6为本说明书实施例一种服务器的功能结构示意图。

具体实施方式

下面将结合本说明书实施例中的附图，对本说明书实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本说明书一部分实施例，而不是全部的实施例。基于本说明书中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都应当属于本说明书保护的范围。

请参阅图1和图2。本说明书实施例提供一种模型训练方法。所述模型训练方法以服务器为执行主体，可以包括如下步骤。

步骤s10：获取至少一个用户在指定时间区间内的行为数据。

在本实施例中，所述指定时间区间可以为开发人员在所述服务器输入的具有任意长度的时间区间。所述指定时间区间的长度例如可以为1个月、1.5个月、或3个月等。每个用户在所述指定时间区间内的行为数据的数量可以为至少一个。所述行为数据可以用于描述用户的行为。所述行为数据例如可以包括“登录”、“转账”、和“付款”等。行为数据“登录”可以用于描述用户的登录账户行为；行为数据“转账”可以用于描述用户的转账行为；行为数据“付款”可以用于描述用户的付款行为。

在本实施例的一个实施方式中，所述服务器获取的行为数据可以对应有用户标识和时间信息。所述用户标识可以标识用户，例如可以为用户的手机号、或用户的电子邮箱地址等。所述时间信息可以用于描述行为数据的产生时间。例如，所述服务器获取的行为数据可以如下表1所示。

表1

在本实施例中，所述服务器可以采用任意方式来获取行为数据，例如可以从日志数据中提取行为数据；或者，还可以接收与自身业务相对应的应用程序发来的行为数据。

步骤s12：确定所述行为数据对应的数据编码。

在本实施例中，经过步骤s10，所述服务器可以获得至少一个用户在所述指定时间区间内的至少一个行为数据。所述服务器可以确定每个行为数据对应的数据编码。所述服务器具体可以使用编码算法，计算每个行为数据对应的数据编码。所述编码算法可以将所述行为数据映射为能够被所述服务器识别的编码。所述编码算法可以包括独热编码(one-hotencoding)算法、或word2vec算法等。所述word2vec算法可以包括cbow模型和/或skip-gram模型。所述服务器可以使用cbow模型和/或skip-gram模型计算行为数据对应的数据编码。当然本领域技术人员应当能够理解，所述编码算法还可以包括其它任意能够将所述行为数据映射为编码的算法。所述数据编码的长度可以根据实际需要灵活设定，例如可以为200、或300等。所述数据编码例如可以包括词向量(wordembedding)等。

以下以独热编码算法为例，详细介绍所述服务器计算每个行为数据对应的数据编码的过程。当然本领域技术人员应当能够理解，此处的过程仅为示例，在实际中独热编码算法还可以有其它的变形或变化。此外，所述服务器还可以使用其它数据编码算法，计算每个行为数据对应的数据编码。在此不再依次列举介绍。

所述服务器可以构建词典，所述词典可以包括在步骤s10获取的行为数据；可以以所述词典中行为数据的数量作为向量的长度，构建目标向量。所述词典中的每个行为数据在所述目标向量中对应有唯一位置。所述目标向量中的每个位置可以具有初始值。针对所述词典中的每个行为数据，所述服务器可以将该行为数据在所述目标向量中对应位置的值设定为目标值；可以保持其它位置的值不变；可以将设定后的所述目标向量作为该行为数据对应的数据编码。所述初始值和所述目标值均可以为任意数值。例如所述初始值可以为0；所述目标值可以为1。例如，所述词典可以包括行为数据“登录”、“转账”、和“付款”；所述目标向量可以为[000]；所述行为数据“登录”对应的数据编码可以为[100]；所述行为数据“转账”对应的数据编码可以为[010]；所述行为数据“付款”对应的数据编码可以为[001]。

在本实施例的一个实施方式中，步骤s10获取的各个用户的行为数据数量有可能是不同的，从而经过步骤s12各个用户的数据编码数量有可能是不同的。如此开发人员可以在所述服务器输入数量。开发人员输入的数量例如可以为50、200、或350等。所述服务器可以接收开发人员输入的数量作为指定数量；可以以每个用户在指定时间区间内的行为数据形成的集合为行为数据集合；可以将所述行为数据集合中行为数据的数量与指定数量进行比对。在所述行为数据集合中行为数据的数量大于或等于所述指定数量的条件下，所述服务器可以从所述行为数据集合中选取所述指定数量个行为数据；可以确定所述指定数量个行为数据对应的数据编码。在所述行为数据集合中行为数据的数量小于所述指定数量的条件下，所述服务器可以将默认行为数据添加至所述行为数据集合，以使所述行为数据集合中行为数据的数量等于所述指定数量；可以确定所述行为数据集合中各个行为数据对应的数据编码。这样各个用户的数据编码数量能够保持一致。

所述服务器可以采用任意方式从所述行为数据集合中选取所述指定数量个行为数据。例如，如前所述，所述服务器获取的行为数据可以对应有时间信息，所述时间信息可以用于描述行为数据的产生时间。那么，所述服务器可以基于行为数据对应的时间信息，从所述行为数据集合中选取产生时间最晚的所述指定数量个行为数据。

所述默认行为数据可以根据实际需要灵活设定，例如可以为“default”等。

步骤s14：以基于所述数据编码形成的矩阵为行为矩阵，使用所述行为矩阵训练基于编码模型和解码模型构建的数学模型，以使所述数学模型的输入和输出之间的差别满足预设条件。

在本实施例中，经过步骤s12，所述服务器得到的数据编码的数量可以为至少一个。基于所述至少一个数据编码，所述服务器可以构建至少一个行为矩阵。每个行为矩阵可以包括至少一个数据编码。在每个行为矩阵中各个数据编码对应的行为数据来自同一用户。例如，所述服务器可以获取用户usera在指定时间区间内的行为数据behaviora_1、behaviora_2、和behaviora_3；可以获取用户userb在指定时间区间内的行为数据behaviorb_1、behaviorb_2、和behaviorb_3；可以分别计算行为数据behaviora_1、behaviora_2、behaviora_3、behaviorb_1behaviorb_2、和behaviorb_3对应的数据编码codea_1、codea_2、codea_3、codeb_1、codeb_2、和codeb_3；可以基于数据编码codea_1、codea_2、和codea_3，构建行为矩阵matrixa；可以基于数据编码codeb_1、codeb_2、和codeb_3，构建行为矩阵matrixb。所述行为矩阵matrixa可以对应用户usera。所述行为矩阵matrixb可以对应用户userb。

在本实施例的一个实施方式中，在每个行为矩阵中各个数据编码可以依据与其对应的行为数据的产生时间顺序进行排序。延续前例，行为数据behaviora_1、behaviora_2、和behaviora_3对应的时间信息可以分别为timea_1、timea_2、和timea_3。时间信息timea_1、timea_2、和timea_3描述的产生时间依次递增。那么，所述行为矩阵行为数据behaviorb_1、behaviorb_2、和behaviorb_3对应的时间信息可以分别为timeb_1、timeb_2、和timeb_3。时间信息timeb_2、timeb_1、和timeb_3描述的产生时间依次递增。那么，所述行为矩阵这样在使用所述行为矩阵训练数学模型时，能够使所述数学模型学习到行为数据的先后顺序特征。

在本实施例中，所述编码模型(encoder)可以用于对所述数学模型的输入进行编码得到特征序列。所述解码模型(decoder)用于对所述特征序列进行解码得到所述数学模型的输出。所述编码模型和所述解码模型可以基于循环神经网络(recurrentneuralnetwork，rnn)实现，例如长短期记忆(longshort-termmemory，lstm)网络。所述特征序列可以具有任意固定长度，能够用于表征用户的行为特征。

所述数学模型的输入可以为行为矩阵，输出可以为目标矩阵。所述数学模型的训练目标可以为输入和输出之间的差别满足预设条件。所述预设条件可以包括以下至少一种：所述差别的度量值达到最小；所述差别的度量值小于或等于预设阈值等。所述预设阈值可以根据实际需要灵活设定。所述度量值可以包括以下至少一种：均方误差(mean-squareerror，mse)；均方根误差(rootmeansquareerror，rmse)；平均绝对误差(meanabsoluteerror，mae)等。例如，所述数学模型的输入可以为行为矩阵codea_1＝[a11a12a13]；codea_2＝[a21a22a23]；codea_3＝[a31a32a33]。所述数学模型的输出可以为目标矩阵那么，行为矩阵matrixa和目标矩阵t之间的均方误差

所述数学模型具体可以包括序列到序列(sequencetosequence，seq2seq)模型。当然本领域技术人员应当能够理解，所述数学模型还可以包括其它任意包括有编码模型和解码模型的模型。图2为所述序列到序列模型的结构示意图。当然本领域技术人员应当能够理解，此处的结构示意图仅为示例，在实际中所述序列到序列模型还可以有其它的变形或变化。

所述编码模型的输入可以为行为矩阵。具体地，所述编码模型可以包括多个节点，每个节点可以根据输入计算出对应的输出，每个节点的输入可以包括行为矩阵中的一个数据编码、和与该节点相邻的前一个节点的输出。例如，所述编码模型可以包括节点he0、he1、he2、…、hen；节点he0可以为初始节点；节点he1的输入可以包括行为矩阵中的数据编码x1、和节点he0的输出(节点he0本身)；节点he2的输入可以包括该行为矩阵中的数据编码x2、和节点he1的输出；依次类推，节点hen的输入可以包括该行为矩阵中的数据编码xn、和节点he(n-1)的输出。节点hen的输出可以为特征序列c。

所述解码模型可以包括多个节点，每个节点可以根据输入计算出对应的输出，每个节点的输入可以包括特征序列、和与该节点相邻的前一个节点的输出。例如，所述编码模型可以包括节点hd0、hd1、hd2、…、hen；节点hd0可以为初始节点；节点hd1的输入可以包括特征序列c、和节点hd0的输出(节点hd0本身)，输出可以包括数据编码y1；节点hd2的输入可以包括特征序列c、和数据编码y1，输出可以包括数据编码y2；依次类推，节点hdn的输入可以包括特征序列c、和数据编码yn-1，输出可以包括数据编码yn。所述解码模型的输出可以包括数据编码y1、y2、…、yn。所述数据编码y1、y2、…、yn可以形成目标矩阵。

在本实施例中，所述服务器可以获取至少一个用户在指定时间区间内的行为数据；可以确定所述行为数据对应的数据编码；可以以所述数据编码形成的矩阵为行为矩阵，使用所述行为矩阵训练基于编码模型和解码模型构建的数学模型，以使所述数学模型的输入和输出之间的差别满足预设条件。训练后的数学模型可以用于生成特征序列。所述特征序列可以用于表征用户的行为特征。

请参阅图3。本说明书实施例还提供一种特征序列生成方法。所述特征序列生成方法以服务器为执行主体，可以包括如下步骤。

步骤s20：获取用户在指定时间区间内的行为数据。

步骤s22：确定所述行为数据对应的数据编码。

步骤s24：以所述数据编码形成的矩阵为行为矩阵，将所述行为矩阵输入至编码模型得到特征序列。

在本实施例中，所述服务器可以获取所述用户在指定时间区间内的行为数据；可以确定所述行为数据对应的数据编码；可以基于所述行为数据对应的数据编码，构建所述用户的行为矩阵；可以将所述行为矩阵输入至编码模型得到所述用户的特征序列。所述编码模型可以来自数学模型，所述数学模型可以基于前述实施例训练得到。

在本实施例中，所述特征序列可以用于表征所述用户的行为特征。基于所述特征序列可以对所述用户的风险水平进行评估。例如，基于所述特征序列，可以使用聚类、或分类等算法识别所述用户的账户是否为垃圾账户。

在本实施例的一个实施方式中，在所述行为矩阵中各个数据编码可以依据与其对应的行为数据的产生时间顺序进行排序。这样将所述行为矩阵输入至编码模型得到的特征序列，能够表征所述用户不同行为之间的顺序特征。

在本实施例中，所述服务器可以获取用户在指定时间区间内的行为数据；可以确定所述行为数据对应的数据编码；可以以所述数据编码形成的矩阵为行为矩阵，将所述行为矩阵输入至编码模型得到特征序列。所述特征序列可以用于表征用户的行为特征。所述特征序列是基于行为数据本身生成的，不依赖于用户经验，能够全面反映用户的行为特征。基于所述特征序列来对用户的风险水平进行评估，可以提高评估结果的准确性。

请参阅图4。本说明书实施例提供一种服务器。所述服务器可以包括如下单元。

获取单元30，用于获取至少一个用户在指定时间区间内的行为数据；

确定单元32，用于确定所述行为数据对应的数据编码；

训练单元34，用于以所述数据编码形成的矩阵为行为矩阵，使用所述行为矩阵训练基于编码模型和解码模型构建的数学模型，以使所述数学模型的输入和输出之间的差别满足预设条件。

请参阅图5。本说明书实施例提供一种服务器。所述服务器可以包括存储器和处理器。

在本实施例中，所述存储器包括但不限于动态随机存取存储器(dynamicrandomaccessmemory，dram)和静态随机存取存储器(staticrandomaccessmemory，sram)等。所述存储器可以用于存储计算机指令。

在本实施例中，所述处理器可以按任何适当的方式实现。例如，所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit，asic)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以用于执行所述计算机指令实现以下步骤：获取至少一个用户在指定时间区间内的行为数据；确定所述行为数据对应的数据编码；以所述数据编码形成的矩阵为行为矩阵，使用所述行为矩阵训练基于编码模型和解码模型构建的数学模型，以使所述数学模型的输入和输出之间的差别满足预设条件。

请参阅图6。本说明书实施例提供一种服务器。所述服务器可以包括如下单元。

获取单元40，用于获取用户在指定时间区间内的行为数据；

确定单元42，用于确定所述行为数据对应的数据编码；

输入单元44，用于以所述数据编码形成的矩阵为行为矩阵，将所述行为矩阵输入至编码模型得到特征序列；所述特征序列用于表征所述用户的行为特征。

请参阅图5。本说明书实施例提供一种服务器。所述服务器可以包括存储器和处理器。

在本实施例中，所述处理器可以按任何适当的方式实现。例如，所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit，asic)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以用于执行所述计算机指令实现以下步骤：获取用户在指定时间区间内的行为数据；确定所述行为数据对应的数据编码；以所述数据编码形成的矩阵为行为矩阵，将所述行为矩阵输入至编码模型得到特征序列；所述特征序列用于表征所述用户的行为特征。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其对于服务器实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

另外，可以理解的是，所属领域技术人员在阅读本说明书文件之后，可以无需创造性劳动想到本说明书文件中列举的部分或全部实施例之间可以组合，这些组合也在本说明书公开和保护的范围内。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(programmablelogicdevice,pld)(例如现场可编程门阵列(fieldprogrammablegatearray，fpga))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片2。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(hardwaredescriptionlanguage，hdl)，而hdl也并非仅有一种，而是有许多种，如abel(advancedbooleanexpressionlanguage)、ahdl(alterahardwaredescriptionlanguage)、confluence、cupl(cornelluniversityprogramminglanguage)、hdcal、jhdl(javahardwaredescriptionlanguage)、lava、lola、myhdl、palasm、rhdl(rubyhardwaredescriptionlanguage)等，目前最普遍使用的是vhdl(very-high-speedintegratedcircuithardwaredescriptionlanguage)与verilog2。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

通过以上的实施方式的描述可知，本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如rom/ram、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。

本说明书可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

虽然通过实施例描绘了本说明书，本领域普通技术人员知道，本说明书有许多变形和变化而不脱离本说明书的精神，希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：傅欣艺
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：LNG接收站再冷凝器液气比率的计算方法与流程
上一篇：一种全自动智能小便器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。