一种基于深度学习的隐含关系发现方法与流程

文档序号:14835877发布日期:2018-06-30 12:22阅读:来源:国知局
一种基于深度学习的隐含关系发现方法与流程

技术特征:

1.一种基于深度学习的隐含关系发现方法,其特征在于:对隐含关系挖掘问题作出形式化的定义:

定义1学者发表网络G

将时间依赖的学者发表网络形式化表示为一个二部图,令G=(A,P,E),其中表示学者发表网络中所有作者的集合;是所有论文的集合;E={eik|1<=i<=na,1<=k<=np,ai是pk的作者},表示学者发表网络中的作者与论文的著作关系;

定义2论文合著网络G’

从G中生成其中,是作者集合,a0是一虚拟作者,对于作者ai,假设其导师为如果那么认为E’={eij|1<=i<=na,1<=j<=na,ai和aj具有合作关系且ai≠aj};其中,pnij是与eij相关的一个向量,pnij∈R1×40表示ai和aj在某一个时间域内合著的论文数量;对于单个作者来说,使用pni可以表示作者ai论文发表情况;

定义3论文合著矩阵C

对于A中任意一作者x,假设其与m位作者具有合著关系,合作者集合用Ax表示,Ax={b0,b1,b2,···,bm},其中b0=a0;若在某一年t中,x与bj合著的论文数为则对于作者x,有合著矩阵:

其中,T为作者合作的总体时间域,本文以一年为一个时间跨度,若作者合著时间为[1970,2010],共40年,则在上述矩阵中T=39,合著矩阵C∈R(m+1)×40

定义4导师学生关系R

令R={yij|0<=i<=na,0<=j<=na},表示作者之间是否是“导师-学生”关系,其具体取值如下:

所述的基于深度学习的隐含关系发现方法,具体包括如下步骤:

Input:学者发表网络G;

Output:“导师-学生”关系的预测结果;

步骤1:对学者发表网络G中的链接进行分析,从学者发表网络G中生成论文合著网络G’;

步骤2:根据论文合著网络G’,计算论文发表情况矩阵C,D,S,进而计算论文的合著矩阵XS,XD,XT;

步骤3:建立tARMM模型;

步骤4:通过tARMM模型对合著矩阵进行处理;

步骤4.1:使用RGRU计算概率PT;

步骤4.2:使用DNN计算概率PF;

步骤4.3:计算最终的导师概率P;

步骤5:P中最大概率的候选导师即为x的预测导师,从而得到“导师-学生”关系的预测结果。

2.根据权利要求1所述的基于深度学习的隐含关系发现方法,其特征在于:在步骤2中,对于论文的合著情况,从如下两个方面进行分析:

第一方面,从合著的详细情况进行分析,对于作者x,通过合著矩阵C表示x与其候选导师之间的合著论文发表情况;

候选导师的论文发表情况用D表示:

作者x的论文发表情况pnx用S表示:

S=(S0 … ST-1) (2.3);

分别利用作者和候选导师的论文发表情况对合著矩阵C进行归一化处理:

XS=C·S (2.5);

XD=D·S (2.6);

其中,XS为基于学生的合著子矩阵,XSij∈XS,表示在第j年中作者x与其候选导师bi合著论文数占作者x第j年总论文数的比例;XD为基于导师的合著子矩阵,XDij∈XD,表示在第j年中作者x与其候选导师bi合著论文数占候选导师bi第j年总论文数的比例;

第二方面,从合著的时间角度出发,根据合著矩阵C将合著情况的时间结构以矩阵的形式进行表示,具体定义如下:

XT为基于时间结构的合著子矩阵,其含义是用矩阵的形式表示作者x与其候选导师bi之间合著论文的时间结构。

3.根据权利要求1所述的基于深度学习的隐含关系发现方法,其特征在于:在步骤4.1中,在tARMM模型中,对RNN进行改造,生成更新门循环单元RGRU,通过更新门循环单元RGRU,对XT进行处理,得到导师概率PT;

对于时刻t,有:

rt=σ(wr[ht+1,xt]+br) (2.9);

ht=wh[(1-rt)ht+1,rtxt] (2.10);

其中,rt是更新门在时间t的状态,wr是更新门的权重矩阵,br是更新门的偏移量,ht+1是更新门单元时刻t+1的状态,xt是时刻t的输入矩阵,ht是更新门单元在时间t的状态,wt和bt分别是生成状态ht的权重矩阵和偏移量;

基于RGRU的导师概率PT:

PT=hT (2.11);

其中,hT是更新门单元在时间T的状态;其公式与ht相同;

具体步骤如下:

Input:论文合著矩阵XT;

Output:基于RGRU的导师概率PT;

步骤4.1.1:初始化PT为零矩阵;

步骤4.1.2:通过公式(2.9)计算t年的更新门的状态rt;

步骤4.1.3:通过公式(2.10)计算t年的更新门单元的状态ht;

步骤4.1.4:通过公式(2.11)计算x的导师概率PT。

4.根据权利要求1所述的基于深度学习的隐含关系发现方法,其特征在于:在步骤4.2中,通过tARMM模型,采用深度神经网络,对XS、XD进行处理,得到基于类图矩阵的导师概率PF;

将XS和XD进行组合,构成一个双颜色通道的位图,称之为类图矩阵X;目标是发现类图矩阵X中的特定图形所在的行号;由于这是一个像素级的目标定位问题,所以构建一个DNN进行识别,根据感知器的计算公式,对于DNN中的每一个节点,其输出为:

其中,wi,b为模型的权重与偏移量参数,pi为每个节点预测出的概率值;

则DNN最终产生的基于类图矩阵的导师概率PF为DNN最后一层的输出:

PF=Relu(f(XS,XD)) (2.13);

具体步骤如下:

Input:论文合著矩阵XS和XD;

Output:基于类图矩阵的导师概率PF;

步骤4.2.1:初始化PF为零矩阵;

步骤4.2.2:通过公式(2.12)计算DNN中每个节点的输出;

步骤4.2.3:通过公式(2.13)计算概率PF。

5.根据权利要求1所述的基于深度学习的隐含关系发现方法,其特征在于:在步骤4.3中,将PT和PF通过全连接层生成最终的导师概率矩阵,从中选取最高的概率值P,其对应的候选导师即为x的预测导师;

P=σ(PF·PT) (2.14)。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1