一种基于深度学习的隐含关系发现方法与流程

文档序号：14835877发布日期：2018-06-30 12:22阅读：来源：国知局

技术特征：

1.一种基于深度学习的隐含关系发现方法，其特征在于：对隐含关系挖掘问题作出形式化的定义：

定义1学者发表网络G

将时间依赖的学者发表网络形式化表示为一个二部图，令G＝(A,P,E)，其中表示学者发表网络中所有作者的集合；是所有论文的集合；E＝{eik|1<＝i<＝na,1<＝k<＝np,ai是pk的作者}，表示学者发表网络中的作者与论文的著作关系；

定义2论文合著网络G’

从G中生成其中，是作者集合，a0是一虚拟作者，对于作者ai，假设其导师为如果那么认为E’＝{eij|1<＝i<＝na,1<＝j<＝na,ai和aj具有合作关系且ai≠aj}；其中，pnij是与eij相关的一个向量，pnij∈R¹^×40表示ai和aj在某一个时间域内合著的论文数量；对于单个作者来说，使用pni可以表示作者ai论文发表情况；

定义3论文合著矩阵C

对于A中任意一作者x，假设其与m位作者具有合著关系，合作者集合用Ax表示，Ax＝{b0,b1,b2,···,bm}，其中b0＝a0；若在某一年t中，x与bj合著的论文数为则对于作者x，有合著矩阵：

其中，T为作者合作的总体时间域，本文以一年为一个时间跨度，若作者合著时间为[1970,2010]，共40年，则在上述矩阵中T＝39，合著矩阵C∈R^(m+1)×40；

定义4导师学生关系R

令R＝{yij|0<＝i<＝na,0<＝j<＝na}，表示作者之间是否是“导师-学生”关系，其具体取值如下：

所述的基于深度学习的隐含关系发现方法，具体包括如下步骤：

Input：学者发表网络G；

Output：“导师-学生”关系的预测结果；

步骤1：对学者发表网络G中的链接进行分析，从学者发表网络G中生成论文合著网络G’；

步骤2：根据论文合著网络G’，计算论文发表情况矩阵C，D，S，进而计算论文的合著矩阵XS，XD，XT；

步骤3：建立tARMM模型；

步骤4：通过tARMM模型对合著矩阵进行处理；

步骤4.1：使用RGRU计算概率PT；

步骤4.2：使用DNN计算概率PF；

步骤4.3：计算最终的导师概率P；

步骤5：P中最大概率的候选导师即为x的预测导师，从而得到“导师-学生”关系的预测结果。

2.根据权利要求1所述的基于深度学习的隐含关系发现方法，其特征在于：在步骤2中，对于论文的合著情况，从如下两个方面进行分析：

第一方面，从合著的详细情况进行分析，对于作者x，通过合著矩阵C表示x与其候选导师之间的合著论文发表情况；

候选导师的论文发表情况用D表示：

作者x的论文发表情况pnx用S表示：

S＝(S0 … ST-1) (2.3)；

分别利用作者和候选导师的论文发表情况对合著矩阵C进行归一化处理：

XS＝C·S (2.5)；

XD＝D·S (2.6)；

其中，XS为基于学生的合著子矩阵，XSij∈XS，表示在第j年中作者x与其候选导师bi合著论文数占作者x第j年总论文数的比例；XD为基于导师的合著子矩阵，XDij∈XD，表示在第j年中作者x与其候选导师bi合著论文数占候选导师bi第j年总论文数的比例；

第二方面，从合著的时间角度出发，根据合著矩阵C将合著情况的时间结构以矩阵的形式进行表示，具体定义如下：

XT为基于时间结构的合著子矩阵，其含义是用矩阵的形式表示作者x与其候选导师bi之间合著论文的时间结构。

3.根据权利要求1所述的基于深度学习的隐含关系发现方法，其特征在于：在步骤4.1中，在tARMM模型中，对RNN进行改造，生成更新门循环单元RGRU，通过更新门循环单元RGRU，对XT进行处理，得到导师概率PT；

对于时刻t，有：

rt＝σ(wr[ht+1,xt]+br) (2.9)；

ht＝wh[(1-rt)ht+1,rtxt] (2.10)；

其中，rt是更新门在时间t的状态，wr是更新门的权重矩阵，br是更新门的偏移量，ht+1是更新门单元时刻t+1的状态，xt是时刻t的输入矩阵，ht是更新门单元在时间t的状态，wt和bt分别是生成状态ht的权重矩阵和偏移量；

基于RGRU的导师概率PT：

PT＝hT (2.11)；

其中，hT是更新门单元在时间T的状态；其公式与ht相同；

具体步骤如下：

Input：论文合著矩阵XT；

Output：基于RGRU的导师概率PT；

步骤4.1.1：初始化PT为零矩阵；

步骤4.1.2：通过公式(2.9)计算t年的更新门的状态rt；

步骤4.1.3：通过公式(2.10)计算t年的更新门单元的状态ht；

步骤4.1.4：通过公式(2.11)计算x的导师概率PT。

4.根据权利要求1所述的基于深度学习的隐含关系发现方法，其特征在于：在步骤4.2中，通过tARMM模型，采用深度神经网络，对XS、XD进行处理，得到基于类图矩阵的导师概率PF；

将XS和XD进行组合，构成一个双颜色通道的位图，称之为类图矩阵X；目标是发现类图矩阵X中的特定图形所在的行号；由于这是一个像素级的目标定位问题，所以构建一个DNN进行识别，根据感知器的计算公式，对于DNN中的每一个节点，其输出为：

其中，wi，b为模型的权重与偏移量参数，pi为每个节点预测出的概率值；

则DNN最终产生的基于类图矩阵的导师概率PF为DNN最后一层的输出：

PF＝Relu(f(XS,XD)) (2.13)；

具体步骤如下：

Input：论文合著矩阵XS和XD；

Output：基于类图矩阵的导师概率PF；

步骤4.2.1：初始化PF为零矩阵；

步骤4.2.2：通过公式(2.12)计算DNN中每个节点的输出；

步骤4.2.3：通过公式(2.13)计算概率PF。

5.根据权利要求1所述的基于深度学习的隐含关系发现方法，其特征在于：在步骤4.3中，将PT和PF通过全连接层生成最终的导师概率矩阵，从中选取最高的概率值P，其对应的候选导师即为x的预测导师；

P＝σ(PF·PT) (2.14)。

完整全部详细技术资料下载

当前第2页1 2 3