利用LSTM神经网络模型处理交互数据的方法及装置与流程

文档序号：20920669发布日期：2020-05-29 14:06阅读：来源：国知局

技术特征：

1.一种处理交互数据的方法，所述方法包括：

获取根据交互事件集构建的动态交互图，其中，所述交互事件集包括多个交互事件，每个交互事件至少包括，发生交互行为的两个对象和交互时间；所述动态交互图包括任意的第一节点，所述第一节点对应于发生在第一时间的交互事件中的第一对象，所述第一节点通过连接边指向n个关联事件所对应的m个关联节点，所述n个关联事件均发生于第二时间，且均包含所述第一对象作为交互对象之一，所述第二时间为，从所述第一时间向前回溯，所述第一对象发生交互行为的前一时间；所述动态交互图中包括至少一个关联节点数目大于2的多元节点；

在所述动态交互图中，确定与待分析的当前节点对应的当前子图，所述当前子图包括从当前节点出发，经由连接边到达的预定范围内的节点；

将所述当前子图输入神经网络模型，所述神经网络模型包括lstm层，所述lstm层根据所述当前子图中各个节点之间的连接边的指向关系，依次迭代处理各个节点，从而得到所述当前节点的隐含向量；其中所述各个节点包括第二节点，所述依次迭代处理各个节点包括，至少根据所述第二节点的节点特征，该第二节点所指向的k个关联节点各自的中间向量和隐含向量，确定所述第二节点的隐含向量和中间向量；

根据所述当前节点的隐含向量，进行与所述当前节点相关的业务处理。

2.根据权利要求1所述的方法，其中，所述对象包括用户，所述交互事件包括以下中的至少一种：点击事件，社交事件，交易事件。

3.根据权利要求1所述的方法，其中，

所述m个关联节点为2n个节点，分别对应于所述n个关联事件中各个关联事件所包括的两个对象；或者，

所述m个关联节点为n+1个节点，分别对应于所述n个关联事件中与所述第一对象交互的n个其他对象，以及所述第一对象自身。

4.根据权利要求1所述的方法，其中，所述预定范围内的节点包括：

预设阶数k的连接边之内的节点；和/或

交互时间在预设时间范围内的节点。

5.根据权利要求1所述的方法，其中，所述每个交互事件还包括，交互行为的行为特征；

所述第二节点的节点特征包括，所述第二节点所对应的对象的属性特征，以及所述第二节点在所对应的交互时间中参与的交互事件的行为特征。

6.根据权利要求1所述的方法，其中，所述确定所述第二节点的隐含向量和中间向量包括：

将所述第二节点的节点特征，分别与所述k个关联节点对应的k个隐含向量组合，输入算法相同、参数不同的第一变换函数和第二变换函数，分别得到k个第一变换向量和k个第二变换向量；

将所述k个关联节点中第i关联节点的中间向量，与对应的第i个第一变换向量，第i个第二变换向量进行组合操作，得到k个操作结果，将该k个操作结果求和，得到组合向量；

将所述第二节点的节点特征连同所述k个隐含向量，分别输入第三变换函数和第四变换函数，分别得到第三变换向量和第四变换向量；

基于所述组合向量和第三变换向量，确定所述第二节点的中间向量；

基于所述第二节点的中间向量和第四变换向量，确定所述第二节点的隐含向量。

7.根据权利要求1所述的方法，其中，所述依次迭代处理各个节点包括，根据所述第二节点的节点特征，该第二节点所指向的k个关联节点各自的中间向量和隐含向量，以及该第二节点对应的交互时间与所述k个关联节点对应的交互时间之间的时间差，确定所述第二节点的隐含向量和中间向量。

8.根据权利要求7所述的方法，其中，所述确定所述第二节点的隐含向量和中间向量包括：

将所述第二节点的节点特征和所述时间差，与所述k个关联节点对应的k个隐含向量分别组合，输入第一变换函数，得到k个第一变换向量；

将所述第二节点的节点特征与所述k个关联节点对应的k个隐含向量分别组合，输入第二变换函数，得到k个第二变换向量；

将所述k个关联节点中第i关联节点的中间向量，与对应的第i第一变换向量，第i第二变换向量进行组合操作，得到k个操作结果，将该k个操作结果求和，得到组合向量；

将所述第二节点的节点特征连同所述k个隐含向量，分别输入第三变换函数和第四变换函数，分别得到第三变换向量和第四变换向量；

基于所述组合向量和第三变换向量，确定所述第二节点的中间向量；

基于所述第二节点的中间向量和第四变换向量，确定所述第二节点的隐含向量。

9.根据权利要求7所述的方法，其中，所述确定所述第二节点的隐含向量和中间向量包括：

将所述第二节点的节点特征和所述时间差，与所述k个关联节点对应的k个隐含向量分别组合后，输入算法相同、参数不同的第一变换函数和第二变换函数，分别得到k个第一变换向量和k个第二变换向量；

将所述第二节点的节点特征连同所述k个隐含向量，分别输入第三变换函数和第四变换函数，分别得到第三变换向量和第四变换向量；

基于所述组合向量和第三变换向量，确定所述第二节点的中间向量；

基于所述第二节点的中间向量和第四变换向量，确定所述第二节点的隐含向量。

10.根据权利要求1所述的方法，其中，所述神经网络模型包括多个lstm层，其中，上一lstm层确定出的所述第二节点的隐含向量，输入到下一lstm层作为该第二节点的节点特征。

11.根据权利要求10所述的方法，其中，所述神经网络模型将所述多个lstm层各自输出的当前节点的隐含向量进行综合，得到所述当前节点的最终隐含向量。

12.根据权利要求10所述的方法，其中，所述神经网络模型将所述多个lstm层中最后一个lstm层输出的当前节点的隐含向量，作为所述当前节点的最终隐含向量。

13.根据权利要求1所述的方法，其中，所述神经网络模型通过以下方式训练：

获取历史交互事件，其中包括第一样本对象和第二样本对象；

在所述动态交互图中，分别确定与所述第一样本对象对应的第一子图，和与所述第二样本对象对应的第二子图；

将所述第一子图和所述第二子图分别输入所述神经网络模型，分别得到所述第一样本对象的隐含向量和第二样本对象的隐含向量；

根据所述第一样本对象的隐含向量和第二样本对象的隐含向量，预测所述第一样本对象和第二样本对象是否会发生交互，得到预测结果；

根据所述预测结果，确定预测损失；

根据所述预测损失，更新所述神经网络模型。

14.根据权利要求1所述的方法，其中，所述神经网络模型通过以下方式训练：

从所述交互事件集涉及的多个样本对象中选择样本对象，并获取该样本对象的分类标签；

在所述动态交互图中，确定与该样本对象对应的样本子图；

将所述样本子图输入所述神经网络模型，得到所述样本对象的隐含向量；

根据所述样本对象的隐含向量，预测所述样本对象的分类，得到预测结果；

根据所述预测结果和所述分类标签，确定预测损失；

根据所述预测损失，更新所述神经网络模型。

15.一种处理交互数据的装置，所述装置包括：

交互图获取单元，配置为获取根据交互事件集构建的动态交互图，其中，所述交互事件集包括多个交互事件，每个交互事件至少包括，发生交互行为的两个对象和交互时间；所述动态交互图包括任意的第一节点，所述第一节点对应于发生在第一时间的交互事件中的第一对象，所述第一节点通过连接边指向n个关联事件所对应的m个关联节点，所述n个关联事件均发生于第二时间，且均包含所述第一对象作为交互对象之一，所述第二时间为，从所述第一时间向前回溯，所述第一对象发生交互行为的前一时间；所述动态交互图中包括至少一个关联节点数目大于2的多元节点；

子图确定单元，配置为在所述动态交互图中，确定与待分析的当前节点对应的当前子图，所述当前子图包括从当前节点出发，经由连接边到达的预定范围内的节点；

子图处理单元，配置为将所述当前子图输入神经网络模型，所述神经网络模型包括lstm层，所述lstm层根据所述当前子图中各个节点之间的连接边的指向关系，依次迭代处理各个节点，从而得到所述当前节点的隐含向量；其中所述各个节点包括第二节点，所述依次迭代处理各个节点包括，至少根据所述第二节点的节点特征，该第二节点所指向的k个关联节点各自的中间向量和隐含向量，确定所述第二节点的隐含向量和中间向量；

业务处理单元，配置为根据所述当前节点的隐含向量，进行与所述当前节点相关的业务处理。

16.根据权利要求15所述的装置，其中，所述对象包括用户，所述交互事件包括以下中的至少一种：点击事件，社交事件，交易事件。

17.根据权利要求15所述的装置，其中，所述m个关联节点为2n个节点，分别对应于所述n个关联事件中各个关联事件所包括的两个对象；或者，

所述m个关联节点为n+1个节点，分别对应于所述n个关联事件中与所述第一对象交互的n个其他对象，以及所述第一对象自身。

18.根据权利要求15所述的装置，其中，所述预定范围内的节点包括：

预设阶数k的连接边之内的节点；和/或

交互时间在预设时间范围内的节点。

19.根据权利要求15所述的装置，其中，所述每个交互事件还包括，交互行为的行为特征；

所述第二节点的节点特征包括，所述第二节点所对应的对象的属性特征，以及所述第二节点在所对应的交互时间中参与的交互事件的行为特征。

20.根据权利要求15所述的装置，其中，所述lstm层用于：

将所述第二节点的节点特征连同所述k个隐含向量，分别输入第三变换函数和第四变换函数，分别得到第三变换向量和第四变换向量；

基于所述组合向量和第三变换向量，确定所述第二节点的中间向量；

基于所述第二节点的中间向量和第四变换向量，确定所述第二节点的隐含向量。

21.根据权利要求15所述的装置，其中，所述lstm层用于：根据所述第二节点的节点特征，该第二节点所指向的k个关联节点各自的中间向量和隐含向量，以及该第二节点对应的交互时间与所述k个关联节点对应的交互时间之间的时间差，确定所述第二节点的隐含向量和中间向量。

22.根据权利要求21所述的装置，其中，所述lstm层具体用于：

将所述第二节点的节点特征和所述时间差，与所述k个关联节点对应的k个隐含向量分别组合，输入第一变换函数，得到k个第一变换向量；

将所述第二节点的节点特征与所述k个关联节点对应的k个隐含向量分别组合，输入第二变换函数，得到k个第二变换向量；

将所述第二节点的节点特征连同所述k个隐含向量，分别输入第三变换函数和第四变换函数，分别得到第三变换向量和第四变换向量；

基于所述组合向量和第三变换向量，确定所述第二节点的中间向量；

基于所述第二节点的中间向量和第四变换向量，确定所述第二节点的隐含向量。

23.根据权利要求21所述的装置，其中，所述lstm层具体用于：

将所述第二节点的节点特征连同所述k个隐含向量，分别输入第三变换函数和第四变换函数，分别得到第三变换向量和第四变换向量；

基于所述组合向量和第三变换向量，确定所述第二节点的中间向量；

基于所述第二节点的中间向量和第四变换向量，确定所述第二节点的隐含向量。

24.根据权利要求15所述的装置，其中，所述神经网络模型包括多个lstm层，其中，上一lstm层确定出的所述第二节点的隐含向量，输入到下一lstm层作为该第二节点的节点特征。

25.根据权利要求24所述的装置，其中，所述神经网络模型将所述多个lstm层各自输出的当前节点的隐含向量进行综合，得到所述当前节点的最终隐含向量。

26.根据权利要求24所述的装置，其中，所述神经网络模型将所述多个lstm层中最后一个lstm层输出的当前节点的隐含向量，作为所述当前节点的最终隐含向量。

27.根据权利要求15所述的装置，其中，所述神经网络模型通过模型训练单元训练，所述模型训练单元包括：

样本获取模块，配置为获取历史交互事件，其中包括第一样本对象和第二样本对象；

子图确定模块，配置为在所述动态交互图中，分别确定与所述第一样本对象对应的第一子图，和与所述第二样本对象对应的第二子图；

向量获取模块，配置为将所述第一子图和所述第二子图分别输入所述神经网络模型，分别得到所述第一样本对象的隐含向量和第二样本对象的隐含向量；

预测模块，配置为根据所述第一样本对象的隐含向量和第二样本对象的隐含向量，预测所述第一样本对象和第二样本对象是否会发生交互，得到预测结果；

损失确定模块，配置为根据所述预测结果，确定预测损失；

更新模块，配置为根据所述预测损失，更新所述神经网络模型。

28.根据权利要求15所述的装置，其中，所述神经网络模型通过模型训练单元训练，所述模型训练单元包括：

样本获取模块，配置为从所述交互事件集涉及的多个样本对象中选择样本对象，并获取该样本对象的分类标签；

子图确定模块，配置为在所述动态交互图中，确定与该样本对象对应的样本子图；

向量获取模块，配置为将所述样本子图输入所述神经网络模型，得到所述样本对象的隐含向量；

预测模块，配置为根据所述样本对象的隐含向量，预测所述样本对象的分类，得到预测结果；

损失确定模块，配置为根据所述预测结果和所述分类标签，确定预测损失；

更新模块，配置为根据所述预测损失，更新所述神经网络模型。

29.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令计算机执行权利要求1-14中任一项的所述的方法。

30.一种计算设备，包括存储器和处理器，其特征在于，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-14中任一项所述的方法。

技术总结
本说明书实施例提供一种处理交互数据的方法和装置。在该方法中，首先获取根据交互事件集构建的动态交互图，图中的任意节点i通过连接边指向该节点i所代表的对象上次参与的N个关联事件所对应的M个关联节点，其中，允许对象同时参与多个关联事件，允许节点连接到多于2个的关联节点。然后，在动态交互图中，确定与待分析的当前节点对应的当前子图，并将当前子图输入神经网络模型进行处理。神经网络模型包括LSTM层，LSTM层根据当前子图中各个节点之间的连接边的指向关系，依次迭代处理各个节点，从而得到当前节点的隐含向量。

技术研发人员：常晓夫;文剑烽;刘旭钦;宋乐
受保护的技术使用者：支付宝(杭州)信息技术有限公司
技术研发日：2020.01.09
技术公布日：2020.05.29

完整全部详细技术资料下载

当前第2页1 2