一种训练方法、预测方法、装置及电子设备与流程

文档序号：17444280发布日期：2019-04-17 05:17阅读：175来源：国知局

本申请实施例涉及深度学习技术领域，尤其涉及一种训练方法、预测方法、装置及电子设备。

背景技术：

深度学习是机器学习中一种基于对数据进行表征学习的方法。目前比较常见的深度学习应用是使用深度学习来训练预测模型，预测模型可以对一些信息进行预测。以预测用户相关信息为例，目前训练预测模型的方式是将用户的相关属性抽象成若干个变量(如性别，年龄，地理位置等)，之后根据这些变量联合用户样本数据，进行模型训练。

当前阶段，预测模型的开发已相对成熟，基于现有用户的相关属性难以再进一步提预测模型的准确率。

技术实现要素：

本申请实施例的目的是提供一种训练方法、预测方法、装置及电子设备，用于提高预测模型的准确率。

为了实现上述目的，本申请实施例采用下述技术方案：

第一方面，本申请实施例提供一种预测模型的训练方法，包括：

将第一样本数据集中的第一样本数据和所述第一样本数据对应的用户社交特征作为第一中间预测模型的输入，预测得到所述第一样本数据对应的第一预测结果，其中，所述第一中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征训练得到；

将所述第一样本数据作为第二中间预测模型的输入，预测得到所述第一样本数据对应的第二预测结果，其中，所述第二中间预测模型基于第三样本数据集中的第三样本数据训练得到；

将所述第一样本数据对应的第一预测结果和第二预测结果作为目标预测模型的输入，将所述第一样本数据对应的标签作为所述目标预测模型的输出，对所述目标预测模型进行训练；

其中，所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

第二方面，本申请实施例提供了一种预测方法，包括：

将用户的指定特征数据和所述指定特征数据对应的用户社交特征作为第一中间预测模型的输入，预测得到所述指定特征数据对应的第一预测结果；其中，第一中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征训练得到；

将所述指定特征数据作为第二中间预测模型的输入，预测得到所述指定特征数据对应的第二预测结果，其中，所述第二中间预测模型基于第三样本数据集中的第三样本数据训练得到；

将所述指定特征数据对应的第一预测结果和第二预测结果作为目标预测模型的输入，得到所述指定特征数据对应的目标预测结果，其中，所述目标预测模型基于第一样本数据集中的第一样本数据在所述第一中间预测模型和所述第二中间预测模型对应的预测结果训练得到；

其中，所述指定特征数据、所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

第三方面，本申请实施例提供了一种预测模型的训练方法，包括：

将第一样本数据集中的第一样本数据和第一样本数据对应的用户社交特征作为中间预测模型的输入，预测得到所述第一样本数据对应的预测结果，其中，所述中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征数据训练得到；

将所述第一样本数据、所述第一样本数据对应的预测结果作为目标预测模型的输入，将所述第一样本数据对应的标签作为所述目标预测模型的输出，对所述目标预测模型进行训练；

其中，所述第一样本数据集和所述第二样本数据集具有相同维度的特征数据。

第四方面，本申请实施例提供了一种预测方法，包括：

将所述指定特征数据对应的第一预测结果作为目标预测模型的输入，得到所述指定特征数据对应的目标预测结果，其中，所述目标预测模型基于第一样本数据集中的第一样本数据在第一中间预测模型对应的预测结果训练得到；

其中，所述指定特征数据、所述第一样本数据集、所述第二样本数据集具有相同维度的特征数据。

第五方面，本申请实施例提供了一种预测模型的训练装置，包括：

第一预测模块，将第一样本数据集中的第一样本数据和所述第一样本数据对应的用户社交特征作为第一中间预测模型的输入，预测得到所述第一样本数据对应的第一预测结果，其中，所述第一中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征训练得到；

第二预测模块，将所述第一样本数据作为第二中间预测模型的输入，预测得到所述第一样本数据对应的第二预测结果，其中，所述第二中间预测模型基于第三样本数据集中的第三样本数据训练得到；

第一训练模型块，将所述第一样本数据对应的第一预测结果和第二预测结果作为目标预测模型的输入，将所述第一样本数据对应的标签作为所述目标预测模型的输出，对所述目标预测模型进行训练；

其中，所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

第六方面，本申请实施例提供了一种预测装置，包括：

第三预测模块，将用户的指定特征数据和所述指定特征数据对应的用户社交特征作为第一中间预测模型的输入，预测得到所述指定特征数据对应的第一预测结果；其中，第一中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征训练得到；

第四预测模块，将所述指定特征数据作为第二中间预测模型的输入，预测得到所述指定特征数据对应的第二预测结果，其中，所述第二中间预测模型基于第三样本数据集中的第三样本数据训练得到；

第五预测模块，将所述指定特征数据对应的第一预测结果和第二预测结果作为目标预测模型的输入，得到所述指定特征数据对应的目标预测结果，其中，所述目标预测模型基于第一样本数据集中的第一样本数据在所述第一中间预测模型和所述第二中间预测模型对应的预测结果训练得到；

其中，所述指定特征数据、所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

第七方面，本申请实施例提供了一种预测模型的训练装置，包括：

第六预测模块，将第一样本数据集中的第一样本数据和第一样本数据对应的用户社交特征作为中间预测模型的输入，预测得到所述第一样本数据对应的预测结果，其中，所述中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征数据训练得到；

第二训练模型块，将所述第一样本数据、所述第一样本数据对应的预测结果作为目标预测模型的输入，将所述第一样本数据对应的标签作为所述目标预测模型的输出，对所述目标预测模型进行训练；

其中，所述第一样本数据集和所述第二样本数据集具有相同维度的特征数据。

第八方面，本申请实施例提供了一种预测装置，包括：

第七预测模块，将用户的指定特征数据和所述指定特征数据对应的用户社交特征作为第一中间预测模型的输入，预测得到所述指定特征数据对应的第一预测结果；其中，第一中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征训练得到；

第八预测模块，将所述指定特征数据对应的第一预测结果作为目标预测模型的输入，得到所述指定特征数据对应的目标预测结果，其中，所述目标预测模型基于第一样本数据集中的第一样本数据在第一中间预测模型对应的预测结果训练得到；

其中，所述指定特征数据、所述第一样本数据集、所述第二样本数据集具有相同维度的特征数据。

第九方面，本申请实施例提供了一种电子设备，包括：

存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行：

其中，所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

第十方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下步骤：

其中，所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

第十一方面，本申请实施例提供了一种电子设备，包括：

其中，所述指定特征数据、所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

第十二方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如下步骤：

其中，所述指定特征数据、所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

由以上本申请实施例提供的技术方案可见，本申请实施例将用户的社交行为引入预测模型，以作为预测的新信息源。由于预测模型的预测维度得到了扩展，因此预测的准确性也得到了有效的提升，进而对预测业务的发展起到了推进作用。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请实施例中记载的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的预测模型的训练方法对应第一种方式的流程示意图；

图2为本申请实施例提供的预测模型的训练方法对应第一种方式的详细流程示意图；

图3为本申请实施例提供的预测方法对应第一种方式的流程示意图；

图4为本申请实施例提供的预测模型的训练方法对应第二种方式的流程示意图；

图5为本申请实施例提供的预测模型的训练方法对应第二种方式的详细流程示意图；

图6为本申请实施例提供的预测方法对应第二种方式的流程示意图；

图7为本申请实施例提供的预测模型的训练装置对应第一种方式的逻辑结构示意图；

图8为本申请实施例提供的电子设备的硬件结构示意图；

图9为本申请实施例提供的预测装置对应第一种方式的逻辑结构示意图；

图10为本申请实施例提供的另一电子设备的硬件结构示意图；

图11为本申请实施例提供的预测模型的训练装置对应第二种方式的逻辑结构示意图；

图12为本申请实施例提供的预测装置对应第二种方式的逻辑结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例具体实施例及相应的附图对本申请实施例的技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请实施例一部分实施例，而不是全部的实施例。基于本申请实施例中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请实施例保护的范围。

如前所述，现有预测模型的开发已十分成熟，难以再进一步提升预测的准确率。因此，亟需引入全新维度的用户属性作为预测因子，以对预测模型进行优化。

而随着无线网络应用的发展，社交网络已经成为了人们日常生活中重要的交互方式。用户社交信息描述了用户与朋友之间行为，呈现出规模型性、代表性、可拓展性的特点。然而，目前用户社交信息尚未应用在预测模型中。本申请旨在将用户社交信息作为预测模型中的预测因子，以提高预测模型的准确率。

一方面，本申请实施例提供一种预测模型的训练方法，如图1所示，包括：

步骤s102，将第一样本数据集中的第一样本数据和第一样本数据对应的用户社交特征作为第一中间预测模型的输入，预测得到第一样本数据对应的第一预测结果，其中，第一中间预测模型基于第二样本数据集中的第二样本数据和第二样本数据对应的历史用户社交特征训练得到；

针对步骤s102而言：

第一样本数据集和第二样本数据集为传统训练数据集，具有相同维度的特征数据，以用于训练同一预测模型。

用户社交特征是指用户与他人之间的社交行为的特征，是传统训练数据集所没有的特征数据。

作为示例性介绍，假设第一中间预测模型用于预测用户的信贷风险，则可以从用户与朋友之间的转账、发送红包等涉及资金流动的用户社交信息中获取用户社交特征。通过用户社交特征训练第一中间预测模型，可以使第一中间预测模型具备基于用户社交特征预测信贷风险的能力。

需要说明的是，本申请实施例不对第一中间预测模型的训练方式进行具体限定。当然，为了保证预测的合理性，应基于用户历史的社交行为预测未来可能发生的状况。因此作为优选方案，第二样本数据集中的样本数据(包含第二样本数据)的发生时间段应位于第一样本数据集中的样本数据(包含第一样本数据)的发生时间段之前。即，本步骤所述的第二样本数据所对应的历史用户社交特征数据相对于本步骤所述的第一样本数据为在先数据。

此外，本申请实施例也不对第一中间预测模型进行具体限定。第一中间预测模型可以看成是分类器，可采用分类器常见的迭代决策树模型(gradientboostingdecisiontree)、逻辑回归(logisticregression)模型、随机森林(randomforest)模型、朴素贝叶斯(naivebayes)模型和支持向量机(supportvectormachine)模型中的任一者。

在第一中间预测模型训练完成后，本步骤可以将第二样本数据对应的历史用户社交特征作为第一中间预测模型输入层节点的特征向量，使输入层具备将输入的第一样本数据表示为用户社交特征的能力；之后，将第一样本数据输入至第一中间预测模型即可对第一样本数据进行预测，得到第一预测结果。

步骤s104，将第一样本数据作为第二中间预测模型的输入，预测得到第一样本数据对应的第二预测结果，其中，第二中间预测模型基于第三样本数据集中的第三样本数据训练得到。

针对步骤s104而言：

应理解，第三样本数据集中的样本数据(包含第三样本数据)的发生时间段位于第一样本数据集中的样本数据(包含第一样本数据)的发生时间段之前。

第三样本数据集与第一样本数据集和第二样本数据集一样，均为传统训练数据集，具有相同维度的特征数据，且不具有用户社交特征的特征数据。

因此，第二中间预测模型基于第三样本数据集的第三样本数据训练后，并不具有基于用户社交特征进行预测的能力。即，第二中间预测模型可以视为现有的传统预测模型。

所以应理解，传统预测模型节点的特征向量不包含用户社交特征。

本步骤将第一样本数据输入至传统预测模型，使得传统预测模型基于现有的特征向量对第一样本数据进行预测，得到第二预测结果。因此，该第二预测结果可视为使用现有预测方法所预测的结果。

同理，本申请实施例也不对第二中间预测模型进行具体限定。第二中间预测模型可以采用迭代决策树模型、逻辑回归、随机森林模型、朴素贝叶斯模型和支持向量机模型中的任一者。

步骤s106，将第一样本数据对应的第一预测结果和第二预测结果作为目标预测模型的输入，将第一样本数据对应的标签作为目标预测模型的输出，对目标预测模型进行训练。

针对步骤s106而言：

训练后的目标预测模型能够在以原有特征向量为预测因子的基础上进一步以用户社交特作为新的预测因子，进行预测。

同理，本申请实施例也不对目标预测模型进行具体限定。目标预测模型可以采用迭代决策树模型、逻辑回归、随机森林模型、朴素贝叶斯模型和支持向量机模型中的任一者。

应理解，不同实现方式的目标预测模型对应有不同的训练方法，因此本申请实施例也不对目标预测模型的训练方法进行具体限定。

本申请实施例中，将用户的社交行为引入预测模型，以作为预测的新信息源。由于预测模型的预测维度得到了扩展，因此预测的准确性也得到了有效的提升，进而对预测业务的发展起到了推进作用。

下面对申请实施例的训练方法的流程进行详细介绍。

如前所述，本申请实施例旨在引入用户社交信息作为预测模型中的预测因子，以提高预测模型的准确率，因此需要将用户社交信息表示为用户社交特征，以作为预测模型的特征向量。

为实现这一目的，本申请实施例可以训练指定图模型，使指定图模型具有将用户社交信息表示为用户社交特征能力。

需要说明的是，本申请实施例并不对上述指定图模型的训方法进行限定。

以无监督方式训练指定图模型为例(有监督方式训练同样适用)，本申请实施例建立节点的特征向量用于表示节点对应的用户的社交关系(即用户与他人之间社交关系)的图模型。之后将第四样本数据集中的第四样本数据对应的用户社交信息作为input输入至图模型，得到图模型输出的code，这个code就是input的一个表示。之后使用code对input进行重构，并基于重构的input与原始的input相比得到的误差，确定损失函数。之后基于损失函数对图模型进行调整，使重构的input与原始的input的误差不断缩小，这个调整过程即训练过程。

指定图模型训练完成后，第一样本数据的用户在指定图模型对应的节点的特征向量即为第一样本数据对应的用户社交特征，同理，第二样本数据的用户在指定图模型对应的节点的特征向量即为第二样本数据对应的历史用户社交特征。

同理，第四样本数据集中的样本数据的发生时间也应段位于第一样本数据集中的样本数据的发生时间段之前。

需要说明的是，图模型训练学习用户社交特征具体流程属于图模型的经典训练方法，因此本文不再详细赘述。

之后，本申请实施例可以将第二样本数据对应的历史用户社交特征作为第二样本数据的特征向量，联合第二样数据对应的标签，对第一中间预测模型进行有训练。

作为示例介绍，本申请实施例在训练第一中间预测模型的过程中，将第二样本数据对应的历史用户社交特征输入至第一中间预测模型，并基于最大似然估计推导得到的第一中间预测模型的损失函数。之后基于损失函数计算训练过程中第一中间预测模型对第二样本数据对应的预测结果与期望结果(标签指示的结果为期望结果)的损失，并以降低损失为目的，调整第一中间预测模型的参数，从而达到训练目的。

在第一中间预测模型训练完成后，可以使用第一中间预测模型对第一样本数据进行预测。

具体地，本申请实施例可以将第一样本数据和第一样本数据对应的用户社交特征输入至模型第一中间预测模型，使得一预测模型对第一样本数据进行预测，得到第一样本数据对应的第一预测结果。

同时，本申请实施例还将第一样本数据输入至第二中间预测模型，使第二中间预测模型对第一样本数据进行预测，得到第一样本数据对应的第二预测结果。

在获得第一样本数据对应的第一预测结果和第二预测结果后，将第一预测结果和第二预测结果分别作为第一样本数据的特征向量，输入至目标预测模型，并将第一样本数据对应的标签作为目标预测模型的输出(即期望输出)，以确定第一预测结果和第二预测结果对应第一中间预测模型的权重。

下面以目标预测模型采用逻辑回归模型为例，对第一中间预测模型的训练方法进行示例性介绍。

逻辑回归模型的基础线性回归公式为：hθ(x)＝θ0+θ1x1+θ2x2+...+θdxd；

上式中，θ表示参数(权重)，x1至xd表示特征向量。

本申请实施例首先基于最大似然估计推导得到的逻辑回归模型的损失函数，并通过损失函数计算逻辑回归模型的损失(损失为第一样本数据对应的逻辑回归模型的实际输出与第一样本数据标记的期望输出间的误差)。之后通过调整逻辑回归模型参数θ0至θd，以降低损失函数计算得到的损失，从而达到训练目的。

应理解，模型训练是人工智能中的基础技术，由于本申请实施例并不涉及该方面的改进，因此不再举例赘述。

下面结合实际应用，对本申请实施例的训练方法进行详细介绍。

本申请实施例的训练方法用于训练预测信贷风险的深度学习模型。其中，训练用的样本数据集(即上文所述第一样本数据集、第二样本数据集合第三样本数据集)包含信贷风险样本数据，该信贷风险样本数据属于传统训练数据，可以从具有消费功能的系统以及具有信用产品的系统中获取。

如图2所示，训练流程如下：

将样本数据集按照对应的发生时间正序分为a、b、c三份。其中，a时间段的样本数据集为上文所述的第四样本数据集，b时间段为上文所述的第二样本数据集，c时间段的样本数据集为上文所述的第一样本数据集。

构建第一中间预测模型，包括：对a时间段的社交网络数据做预处理，并使用预处理后的a时间段的社交网络数据，训练指定图模型；将b时间段的样本数据集中的样本数据在指定图模型对应的节点的特征向量，输入至gbdt模型，并联合b时间段的样本数据集对应的标签，对gbdt模型进行训练，该训练后的gbdt模型即第一中间预测模型。

将c时间段的样本数据集中的样本数据以及c时间段的样本数据集中的样本数据在指定图模型对应的节点的特征向量输入至gbdt模型，以对c时间段的样本数据集中的样本数据进行打分，得到评分集合pec(即本文所述的第一预测结果)。

将c时间段的样本数据集中的样本数据输入至现有的第二中间预测模型，得到使第二中间预测模型对c时间段的样本数据集中的样本数据进行打分，得到评分集合poc(即本文所述的第二预测结果)。

将pec和poc作为c时间段的样本数据集的样本数据的特征向量输入至目标预测模型，并联合c时间段的样本数据集对应的标签，训练目标预测模型；训练后的目标预测模型即为最终的信贷风险预测模型。

通过图2所示的训练方法可以看出，本申请实施例将用户的社交网络数据引入信贷风险预测模型，从而作为评估用户信贷风险的新信息源。由于评估维度得到了扩展，因此可有效提升信贷风险预测结果的准确率，对信贷业务发展起到了推进作用，因此具有较高的实用性。

此外，本申请实施例还提供一种基于图1所示训练方法中的第一中间预测模型、第二中间预测模型以及目标预测模型的预测方法。如图3所示，该预测方法包括：

步骤s302，将用户的指定特征数据和指定特征数据对应的用户社交特征作为第一中间预测模型的输入，预测得到指定特征数据对应的第一预测结果；其中，第一中间预测模型基于第二样本数据集中的第二样本数据和第二样本数据对应的历史用户社交特征训练得到。

针对步骤s302而言：

应理解，本步骤中的第一中间预测模型即上文步骤102所述的第一中间预测模型。

其中，指定特征数据对应的用户社交特征具体为指定特征数据的发生时间段所对应的用户社交特征。

如前所述，合理的预测基于用户历史的社交信息预测未来可能发生的状况，因此作为优选方案，本步骤中的用户社交特征所对应的发生时间段不晚于指定特征数据对应的发生时间段。

以预测用户信贷风险为例，用户信贷数据中的特征数据即用户指定特征，涉及用户资金流动的用户社交信息中的特征数据即用户社交特征。

假设当前时间为6月份，若使用用户对应4月份的信贷数据预测用户信贷风险，则对应地，用户社交特征应用从用户对应4月份或4月份之前一段时间的社交信息中获取。

步骤s304，将指定特征数据作为第二中间预测模型的输入，预测得到指定特征数据对应的第二预测结果，其中，第二中间预测模型基于第三样本数据集中的第三样本数据训练得到；

针对步骤s304而言：

应理解，本步骤中的模型第二中间预测模型即上文步骤s104所述的第二中间预测模型。

因此，第二中间预测模型预测得到的第二预测结果可视为是使用现有预测方法所预测的结果。

步骤s306，将指定特征数据对应的第一预测结果和第二预测结果作为目标预测模型的输入，得到指定特征数据对应的目标预测结果，其中，目标预测模型基于第一样本数据集中的第一样本数据在第一中间预测模型和第二中间预测模型对应的预测结果训练得到；

针对步骤s306而言：

应理解，本步骤中的第一中间预测模型即上文步骤s102所述的第一中间预测模型，本步骤中的目标预测模型即上文步骤s106所述的训练后的目标预测模型。

由于本申请实施例并不对目标预测模型进行具体限定，因此目标预测模型输出的预测结果的表现形式也并不唯一，可以是评分也可以是定性的结果。

其中，上述指定特征数据、第二样本数据集和第三样本数据集具有相同维度的特征数据。

本申请实施例结合用户社交信息进行预测，在预测维度得上到了扩展，使得预测的准确性也得到有效提升。此外，由于用户社交行为的拓展性较高，因此本申请实施例的方案可适用于预测不同类别的结果(比如预测用户的信贷风险、健康风险等)，具有较高的实用价值。

下面以预测用户的信贷风险为例，对预测方法的实际应用进行介绍。

假设预测某一目标用户的信贷风险，则本申请实施例可以从用户注册过的金融平台中获取用户的信贷数据，并从信贷数据中提取信贷特征数据(即指定特征数据)；同时，可以从用户注册过的社交平台中获取与信贷数据发生时间相对应的涉及资金流动的用户社交信息，并从改用户社交信息中提取用户社交特征。

之后，将信贷特征数据和用户社交特征输入至第一中间预测模型，得到信贷特征数据基于用户社交特征为预测因子，对信贷特征数据预测的第一预测结果；

同时，还将信贷特征数据输入至第二中间预测模型，得到第二中间预测模型基于传统预测因子，对信贷特征数据预测的第二预测结果。

之后，进一步将信贷特征数据对应的第一预测结果和第二预测结果输入至目标预测模型，得到目标预测模型基于用户社交特征和传统预测因子，对信贷特征数据预测的目标预测结果。

该目标预测结果用于确定或者指示用户是否存在信贷风险。

此外，如图4所示，本申请实施例还提供另一种预测模型的训练方法，包括：

步骤s402，将第一样本数据集中的第一样本数据和第一样本数据对应的用户社交特征作为中间预测模型的输入，预测得到第一样本数据对应的预测结果，其中，中间预测模型基于第二样本数据集中的第二样本数据和第二样本数据对应的历史用户社交特征数据训练得到；

针对步骤s402而言：

第一样本数据集和第二样本数据集为传统训练数据集，具有相同维度的特征数据，以用于训练同一预测模型。

用户社交特征是指用户与他人之间的社交行为的特征，是传统训练数据集所没有的特征数据。

作为示例性介绍，假设中间预测模型用于预测用户的信贷风险，则可以从用户与朋友之间的如转账、发送红包等涉及资金流动的用户社交信息中获取用户社交特征。通过用户社交特征训练中间预测模型，可以使中间预测模型具备基于用户社交特征进行预测的能力。

需要说明的是，本申请实施例不对中间预测模型的训练方式进行具体限定。当然，为了保证预测的合理性，应基于用户历史的社交行为预测未来可能发生的状况。因此作为优选方案，第二样本数据集中的样本数据(包含第二样本数据)的发生时间段应位于第一样本数据集中的样本数据(包含第一样本数据)的发生时间段之前。即，本步骤所述的第二样本数据对应的历史用户社交特征数据相对于本步骤所述的第一样本数据为在先数据。

此外，本申请实施例也不对中间预测模型进行具体限定。中间预测模型可以看成是分类器，可采用分类器常见的迭代决策树模型、逻辑回归模型、随机森林模型、朴素贝叶斯模型和支持向量机模型中的任一者。

在中间预测模型训练完成后，本步骤可以将第二样本数据对应的历史用户社交特征作为中间预测模型输入层节点的特征向量，使输入层具备将输入的第一样本数据表示为用户社交特征的能力；之后，将第一样本数据输入至中间预测模型即可对第一样本数据进行预测，得到第一预测结果。

步骤s404，将第一样本数据、第一样本数据对应的预测结果作为目标预测模型的输入，将第一样本数据对应的标签作为目标预测模型的输出，对目标预测模型进行训练。

针对步骤s404而言：

目标预测型为现有技术中的传统预测模型。

与图1中步骤s106所述的训练方法不同的是，本步骤直接对传统预测模型接进行训练，以得到最终的目标预测型。训练后的目标预测型在原有特征向量基础上，进一步添加用户社交特征作为新的特征向量，因此能够以用户社交特征为依据，进行预测。

本申请实施例中，也同样将用户的社交行为引入预测模型，以作为预测的新信息源。由于预测模型的预测维度得到了扩展，因此预测的准确性也得到了有效的提升，进而对预测业务的发展起到了推进作用。

下面以训练用于预测信贷风险的深度学习模型为例，对申请实施例的训练进行详细介绍。

本申请实施例通过在原始模型中引入用户社交行为的特征向量，提升原有模型的风险评估的准确度，如图5所示，具体流程如下：

构建第一中间预测模型，包括：对a时间段的社交网络数据做预处理，并使用预处理后的a时间段的社交网络数据，训练指定图模型；将b时间段的样本数据集中的样本数据在指定图模型对应的节点的特征向量，输入至gbdt模型，并联合b时间段的样本数据集对应的标签，对gbdt模型进行训练，该训练后的gbdt模型即中间预测模型。

将c时间段的样本数据集中的样本数据以及c时间段的样本数据集中的样本数据在指定图模型对应的节点的特征向量输入至gbdt模型，以对c时间段的样本数据集中的样本数据进行打分，得到评分集合pec。

将pec添加为传统预测模型的输入层的节点，之后向传统预测模型输入c时间段的样本数据集的样本数据，并联合c时间段的样本数据集中的样本数据对应的标签，对传统预测模型进行训练，得到最终的信贷风险预测模型。

通过图5所示的训练方法可以看出，本申请实施例将用户的社交网络数据引入信贷风险预测模型，从而作为评估用户信贷风险的新信息源。由于评估维度得到了扩展，因此可有效提升信贷风险预测结果的准确率，对信贷业务发展起到了推进作用，因此具有较高的实用性。

此外，如图6所示，本申请实施例还提供一种基于图4所示训练方法中的目标预测模型的预测方法，包括：

步骤s602，将用户的指定特征数据和指定特征数据对应的用户社交特征作为中间预测模型的输入，预测得到所述指定特征数据对应的第一预测结果；其中，中间预测模型基于第二样本数据集中的第二样本数据和第二样本数据对应的历史用户社交特征训练得到；

针对步骤s602而言：

应理解，本步骤中的中间预测模型即上文步骤s402所述的中间预测模型。

其中，指定特征数据对应的用户社交特征具体为指定特征数据的发生时间段所对应的用户社交特征。

以预测用户信贷风险为例，用户信贷数据中的特征数据即用户指定特征，涉及用户资金流动的用户社交信息中的特征数据即用户社交特征。

步骤s604，将指定特征数据对应的第一预测结果作为目标预测模型的输入，得到指定特征数据对应的目标预测结果，其中，目标预测模型基于第一样本数据集中的第一样本数据在中间预测模型对应的预测结果训练得到。

针对步骤s604而言：

应理解，上述指定特征数据、第一样本数据集、第二样本数据集具有相同维度的特征数据。

应理解，本步骤中的中间预测模型即上文步骤s402所述的中间预测模型，本步骤中的目标预测模型即上文步骤s406所述的训练后的目标预测模型。

由于本申请实施例并不对目标预测模型进行具体限定，因此目标预测模型输出的预测结果的表现形式也并不唯一，可以是评分也可以是定性的结果。

此外，如图7所示，本申请实施例还提供一种预测模型的训练装置700，包括：

第一预测模块710，将第一样本数据集中的第一样本数据和所述第一样本数据对应的用户社交特征作为第一中间预测模型的输入，预测得到所述第一样本数据对应的第一预测结果，其中，所述第一中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征训练得到；

第二预测模块720，将所述第一样本数据作为第二中间预测模型的输入，预测得到所述第一样本数据对应的第二预测结果，其中，所述第二中间预测模型基于第三样本数据集中的第三样本数据训练得到；

第一训练模型块730，将所述第一样本数据对应的第一预测结果和第二预测结果作为目标预测模型的输入，将所述第一样本数据对应的标签作为所述目标预测模型的输出，对所述目标预测模型进行训练；

其中，所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

本实施例中，将用户的社交行为引入预测模型，以作为预测的新信息源。由于预测模型的预测维度得到了扩展，因此预测的准确性上得到有效提升，有助于推进预测业务的发展。

可选地，所述第一样本数据对应的用户社交特征是所述第一样本数据的用户在指定图模型对应的节点的特征向量，所述第二样本数据对应的历史用户社交特征是所述第二样本数据的用户在所述指定图模型对应的节点的特征向量；其中，所述指定图模型基于第四样本集中的第四样本数据对应的用户社交信息训练得到，所述指定图模型中节点的特征向量用于表示节点对应的用户的社交关系。

可选地，所述第四样本数据集中的样本数据的发生时间段位于所述第一样本数据集中的样本数据的发生时间段之前。

可选地，所述第二样本数据集中的样本数据的发生时间段位于所述第一样本数据集中的样本数据的发生时间段之前；所述第三样本数据集中的样本数据的发生时间段位于所述第一样本数据集中的样本数据的发生时间段之前。

可选地，所述第一中间预测模型为迭代决策树模型、逻辑回归模型、随机森林模型、朴素贝叶斯型和支持向量机模型中的任一者；

所述第二中间预测模型为迭代决策树模型、逻辑回归模型、随机森林模型、朴素贝叶斯型和支持向量机模型中的任一者；所述目标预测模型为迭代决策树模型、逻辑回归模型、随机森林模型、朴素贝叶斯型和支持向量机模型中的任一者。

可选地，所述第一样本数据集、所述第二样本数据集和所述第三样本数据集中的样本数据均为信贷风险样本数据，所述目标预测模型为用于信贷风险预测的深度学习模型。

显然，本申请实施例的训练装置可作为图1所示的训练方法的执行主体，因此该训练方法所能实现的技术效果，本申请实施例的训练装置同样也能够实现。

图8是本申请的一个实施例电子设备的结构示意图。请参考图8，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(random-accessmemory，ram)，也可能还包括非易失性存储器(non-volatilememory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是isa(industrystandardarchitecture，工业标准体系结构)总线、pci(peripheralcomponentinterconnect，外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

存储器，用于存放程序。具体地，程序可以包括程序代码，所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器，并向处理器提供指令和数据。

处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行，在逻辑层面上形成共享资源访问控制装置。处理器，执行存储器所存放的程序，并具体用于执行以下操作：

其中，所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

上述如本申请图1所示实施例揭示的预测模型的训练方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(centralprocessingunit，cpu)、网络处理器(networkprocessor，np)等；还可以是数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现场可编程门阵列(field－programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模型块组合执行完成。软件模型块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图1中的训练方法，并实现图7所示预测模型的训练装置在图1、图2所示实施例的功能，本申请实施例在此不再赘述。

当然，除了软件实现方式之外，本申请的电子设备并不排除其他实现方式，比如逻辑器件抑或软硬件结合的方式等等，也就是说以下处理流程的执行主体并不限定于各个逻辑单元，也可以是硬件或逻辑器件。

此外，本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1所示实施例的方法，并具体用于执行以下方法：

其中，所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

此外，如图9所示，本申请实施例还提供一种预测装置900，包括：

第三预测模块910，将用户的指定特征数据和所述指定特征数据对应的用户社交特征作为第一中间预测模型的输入，预测得到所述指定特征数据对应的第一预测结果；其中，第一中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征训练得到；

第四预测模块920，将所述指定特征数据作为第二中间预测模型的输入，预测得到所述指定特征数据对应的第二预测结果，其中，所述第二中间预测模型基于第三样本数据集中的第三样本数据训练得到；

第五预测模块930，将所述指定特征数据对应的第一预测结果和第二预测结果作为目标预测模型的输入，得到所述指定特征数据对应的目标预测结果，其中，所述目标预测模型基于第一样本数据集中的第一样本数据在所述第一中间预测模型和所述第二中间预测模型对应的预测结果训练得到；

其中，所述指定特征数据、所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

显然，本申请实施例的预测装置可作为图3所示的预测方法的执行主体，因此该预测方法所能实现的技术效果，本申请实施例的预测装置同样也能够实现。

图10是本申请的一个实施例电子设备的结构示意图。请参考图10，在硬件层面，该电子设备包括处理器，可选地还包括内部总线、网络接口、存储器。其中，存储器可能包含内存，例如高速随机存取存储器(random-accessmemory，ram)，也可能还包括非易失性存储器(non-volatilememory)，例如至少1个磁盘存储器等。当然，该电子设备还可能包括其他业务所需要的硬件。

处理器、网络接口和存储器可以通过内部总线相互连接，该内部总线可以是isa(industrystandardarchitecture，工业标准体系结构)总线、pci(peripheralcomponentinterconnect，外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图10中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

将用户的指定特征数据和所述指定特征数据对应的用户社交特征作为第一中间预测模型的输入，预测得到所述指定特征数据对应的第一预测结果；其中，所述第一中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征训练得到；

其中，所述指定特征数据、所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

上述如本申请图3所示实施例揭示的预测方法可以应用于处理器中，或者由处理器实现。处理器可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器，包括中央处理器(centralprocessingunit，cpu)、网络处理器(networkprocessor，np)等；还可以是数字信号处理器(digitalsignalprocessor，dsp)、专用集成电路(applicationspecificintegratedcircuit，asic)、现场可编程门阵列(field－programmablegatearray，fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模型块组合执行完成。软件模型块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器读取存储器中的信息，结合其硬件完成上述方法的步骤。

该电子设备还可执行图3的预测方法，并实现图9预测装置在图3所示实施例的功能，本申请实施例在此不再赘述。

本申请实施例还提出了一种计算机可读存储介质，该计算机可读存储介质存储一个或多个程序，该一个或多个程序包括指令，该指令当被包括多个应用程序的便携式电子设备执行时，能够使该便携式电子设备执行图1所示实施例的方法，并具体用于执行以下方法：

其中，所述指定特征数据、所述第一样本数据集、所述第二样本数据集和所述第三样本数据集具有相同维度的特征数据。

此外，如图11所示，本申请实施例还提供一种预测模型的训练装置1100，包括：

第六预测模块1110，将第一样本数据集中的第一样本数据和第一样本数据对应的用户社交特征作为中间预测模型的输入，预测得到所述第一样本数据对应的预测结果，其中，所述中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征数据训练得到；

第二训练模型块1120，将所述第一样本数据、所述第一样本数据对应的预测结果作为目标预测模型的输入，将所述第一样本数据对应的标签作为所述目标预测模型的输出，对所述目标预测模型进行训练；

其中，所述第一样本数据集和第二样本数据集具有相同维度的特征数据。

显然，本申请实施例的训练装置可作为图4所示的训练方法的执行主体，因此该训练方法所能实现的技术效果，本申请实施例的训练装置同样也能够实现。

此外，如图12所示，本申请实施例还提供一种预测模型的预测装置1200，包括：

第七预测模块1210，将用户的指定特征数据和所述指定特征数据对应的用户社交特征作为中间预测模型的输入，预测得到所述指定特征数据对应的第一预测结果；其中，所述中间预测模型基于第二样本数据集中的第二样本数据和所述第二样本数据对应的历史用户社交特征训练得到；

第八预测模块1220，将所述指定特征数据对应的第一预测结果作为目标预测模型的输入，得到所述指定特征数据对应的目标预测结果，其中，所述目标预测模型基于第一样本数据集中的第一样本数据在中间预测模型对应的预测结果训练得到；

其中，所述指定特征数据、第一样本数据集、第二样本数据集具有相同维度的特征数据。

显然，本申请实施例的预测装置可作为图6所示的预测方法的执行主体，因此该预测方法所能实现的技术效果，本申请实施例的预测装置同样也能够实现。

本领域技术人员应明白，本申请实施例的实施例可提供为方法、系统或计算机程序产品。因此，本申请实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

上述对本申请实施例特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下，在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外，在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中，多任务处理和并行处理也是可以的或者可能是有利的。

以上仅为本申请实施例的实施例而已，并不用于限制本申请实施例。对于本领域技术人员来说，本申请实施例可以有各种更改和变化。凡在本申请实施例的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请实施例的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林建滨;张志强;方精丽;方彦明;周俊;李小龙
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。